Temas que trata la obra: • Redes cristalinas y tipos de cristales • Análisis cristalográfico con rayos X • Dinámica de las redes cristalinas • Mecánica cuántica, generalidades • Mecánica estadística, generalidades • Vibraciones reticulares y propiedades térmicas de los cristales • Teoría del electrón libre de los metales • Teorí~ cuántica de los electrones en redes periódicas • Semiconductores electrónicos uniformes en equilibrio • Exceso de portadores en semiconductores • Tecnología de materiales y medición de propiedades volumétricas • Teoría de las uniones p-n de los semiconductores • Rectificadores de la unión p-n y transistores • Uniones p-n a niveles altos de corrientes; el rectificador p-i-n • Otros dispositivos semiconductores • Contactos metal-semiconductor y superficies de semiconductores ,6flll""' FISIC , DEL ESTADO SOLIDO Y DE SEMICONDUCTORES J. P. McKELVEY ~LIMUSA NORIEGA EDITORES MÉXICO • Eapel\a • Venezuela • Colombia VERSIÓN AUTORIZADA EN ESPNIOL DE LA OBRA PUBLICADA EN INGLéS CON EL TITULO: SOLIO STATE ANO SEMICONDUCTOR PHYSICS O HARPER & Row PuBLISHERs, INc. COLABORADOR EN LA TRADUCCIÓN: HORTENSIA CORONA RODRÍGUEZ INGENIERO DE LA UNIVERSIDAD DE CALIFORNIA, 8eRKELEY. REVISIÓN: FRANCISCO RESÉNDIZ RODRÍGUEZ MAESTFÚA EN CIENCIAS EN INOENIERIA ELéCTRI• CA DEL CeNTRO DE INVESTIGACióN Y EsTUDIOS AVANZADOS, PROFESOR DE ELECTRÓNICA DE LA EscueLA SuPERIOR DE INOENIERfA MECÁNICA Y ELéCTRICA DEL INSTITUTO PouTéCNICO NA· CIONAL, MéxiCO. LA PRESENTACIÓN YDISPOSICIÓN EN CONJUNTO DE FÍSICA DEL ESTADO SÓLIDO Y DE SEMICONDUCTORES SON PROPIEDAD DEL EDITOR. NINGUNA PARTE DE ESTA OBRA PUEDE SER REPRODUCIDA O TRANS· MlliDA, MEDANll: NfGÚN SISTBM O MÉlalO, B..EC· TIÓIIICO o aECÑICO (N:W'fENX) afOitlCXlPWlO, LA GRABACIÓN O CUALQUIER SISTEMA DE RECUPE· RACIÓN Y ALMACENAMIENTO DE INFORMACIÓN), SIN CONSENTIMIENTO POR ESCRITO DEL EDITOR. DERECHOS RESERVADOS: O 1996, EDITORIAL LIMUSA, S.A. DE C.V. GRUPO NORIEGA EDITORES BALDERAS 95, MéJOCO, D.F. C.P. 06040 i l 521·21.05 Q 512·29.03 CANIEM NúM. 121 NovENA RBMPRESIÓN HECHO EN MéxiCO ISBN 968·18·0431·7 Prólogo Este libro se basa en el material que utilicé para impartir cursos especiales de dos semestres a los estudiantes de las carreras de física, ingeniería eléctrica, metalurgia y ciencias de materiales. Por lo común, el primer semestre de estos cursos se dedica ala física general del estado sólido y el segundo, a un estudio detallado de los materiales y dispositivos semiconductores, incluyéndose en él (además de una gran cantidad de material nuevo) muchas aplicaciones de los principios desarrollados en la sección introductoria del curso. Por consiguiente, la obra es fundamentalmente un libro de texto para un curso de este tipo. Esperamos que su alcance sea lo suficientemente amplio y la exposición de los aspectos fundamentales, lo suficientemente detallada y clara para que también sirva como libro de consulta general para los ingenieros y otros profesionales que trabajan en el área de investigación y desarrollo de los materiales y dispositivos semiconductores. En vista de que este material puede interesar a los estudiantes y profesionales de carreras muy diversas, se incluyeron los capítulos sobre mecánica cuántica y mecánica estadística, por creer que serían muy útiles para algunos. Sin embargo, cabe señalar que con estos capítulos no se pretende suplir un curso completo de estos temas, ya que sólo se trata df. breves ensayos introductorios que le proporcionan al lector los conocimientos necesarios para seguir el desarrollo del tema y entender el significado físico de los conceptos presentados. Desde luego, para apreciar debidamente la importancia que tienen los fenómenos cuánticos y estadísticos en la física del estado sólido, no queda otra, sino estudiarlos a fondo. A lo largo de la obra, los temas se presentan desde el punto de vista de la física; por otra parte, se incluyen muchos detalles técnicos sobre temas tales como tecnología de materiales y crecimiento de cristales; fabricación de dispositivos semiconductores; características y configuración de circuitos de estos dispositivos, y para proporcionar un panorama más completo, se indican las obras que conviene consultar, si se desea obtener datos más concretos y detallados en relación con estos temas. Traté de presentar en forma exhaustiva la teoría de la unión p-n y el análisis del dispositivo semiconductor y dar una explicación completa y detallada de las técni<:as analíticas que se utilizan en este campo tan importante, pero tan descuidado. Prólogo 6 Los conceptos de la física general del estado sólido que se estudian en la sección introductoria, capítulos del 1 al 8, sólo abarcan aquellos que tienen una importancia central en la física de los semiconductores. Por lo tanto, esta introducción es más bien selectiva que completa; peri, aun así, contiene el material suficiente para un curso completo, de nivel intermedio, sobre la física del estado sólido. Desde luego, un libro de texto de tamaño normal no puede abarcar un estudio de dieléctricos, magnetismo, centros de color, experimentos de resonancia y otros temas que por lo general se tocan en los cursos de física del estado sólido. El nivel de presentación es intermedio; he tratado de ir mucho más allá de lo que puede lograrse con un enfoque cualitativo, sin recurrir realmente a la mecánica cuántica y la mecánica estadística, a fin de evitar las tremendas complejidades matemáticas requeridas para un planteamiento absoluto de la teoría cuántica. La línea de mis planteamientos es pragmática bien que axiómática y traté sistemáticamente de explicar todos los temas desde dos puntos de vista, el físico y el matemático. A lo largo de la obra se hace énfasis en los principios fundamentales y no en los detalles técnicos. Además, con mucha frecuencia se recurre al planteamiento de la partícula tal y como se explica en la teoría del transporte del electrón libre; este planteamiento se justifica a la luz de la teoría cuántica que se subraya en el capítulo 8. No se necesita tener conocimientos matemáticos más avanzados que el análisis vectorial y de las ecuaciones diferenciales ordinarias. Aunque en varias ocasiones aparecen las ecuaciones diferenciales parciales y expansiones de la función ortogonal, siempre se proporcionan en seguida los medios matemáticos necesarios para resolverlas. Me es imposible expresar en forma adecuada mi gratitud a todos mis colegas que han contribuido a esta obra. Sin embargo, quisiera dar las gracias de un modo específico a los doctores D.R. Frankl, P.H. Cutler, J. Yahia y H.F. John por sus útiles comentarios, observaciones y sugerencias, así como al Dr. F .G. Brickwedde quien me autorizó a emplear su personal, cuando la transcripción del manuscrito se retrasaba por alguna emergencia. Mis antiguos alumnos, los doctores J.C. Balogh, M W. Cresswell y E.F. Pulver también me ayudaron mucho leyendo, evaluando y corrigiendo partes del manuscrito. También muchos de mis estudiantes me señalaron los errores que hubo en las notas del manuscrito y sugirieron cómo mejorar la exposición de algunos temas. No me puedo acordar de todas las personas que me ayudaron; pero estoy profundamente agradecido a cada una de ellas. También deseo expresar mi gratitud a la señorita Frances Fogle, a la señora Marion Shaw y a la señorita Eileen Berringer por su inapreciable colaboración en la transcripción del manuscrito. J.P. MCKELVEY University Park, Pa. Contenido Capítulo 1 Redes cristalinas y tipos de cristales 13 1.1 1.2 1.3 1.4 1.5 Concepto de estado "sólido", 13 Celdas unitarias y redes de Bravais, 14 Algunas estructuras cristalinas simples, 18 Planos cristalinos e índices de Miller, 23 Espaciamiento de los planos en las redes cristalinas, 25 1.6 Clasificación general de los cristales, 27 Capítulo 2 Análisis cristalográfico con rayos x 31 2.1 Introducción, 31 2.2 Física de la difracción de los rayos X: las ecuaciones de V on Laue, 34 2.3 Factor de dispersión atómica, 37 2.4 Factor geométrico de la estructura, 40 2.5 La red recíproca, 43 2.6 La condición de Bragg en función de la red recíproca, 47 Capítulo 3 Dinámica de las redes cristalinas 3.1 Vibraciones elásticas de medios continuos, 51 3.2 Velocidad de grupo de trenes de ondas armónicas, 53 3.3 Movimiento ondulatorio en redes atómicas unidimensionales, 55 3.4 Estructuras diatómicas unidimensionales, 62 3.5 Región de frecuencia prohibida, 65 3.6 Excitación óptica de vibraciones reticulares en cristales iónicos, 6 7 3. 7 Energía de enlace de estructuras cristalinas iónicas, 69 51 Contenido 8 Capítulo 4 Mecánica cuántica, generalidades 19 4.1 4.2 4.3 4.4 4.5 4.6 Introducción, 79 Radiación del cuerpo negro, 79 Efecto fotoeléctrico, 81 Calor específico de los sólidos, 83 El átomo de Bohr, 84 La hipótesis de De Broglie y las propiedades ondulatorias de la materia, 8 7 4.7 Mecánica ondulatoria, 87 4.8 Dependencia del tiempo de la función de onda, 91 4.9 La partícula libre y el principio de incertidumbre, 94 4.10 Una partícula en un pozo de potencial unidimensional e infinitamente profundo, 100 4.11 Una partícula en un pozo unidimensional de profundidad finita, 103 4.12 El oscilador armónico unidimensional, 111 4.13 Oetogonalidad de las funciones propias y la superposición de estados, 119 4.14 Valores esperados y números cuánticos, 123 4.15 El átomo de hidrógeno, 128 4.16 El espín electrónico, el principio de exclusión de Pauli y el sistema periódico, 141 Capítulo S Mecánica estadística, generalidades 5.1 Introducción, 147 5.2 La función de distribución y la densidad de los estados, 148 5.3 La distribución Maxwell·Boltzmann, 153 5.4 La estadística de Maxwell-Boltzmann para un gas ideal, 161 5.5 Estadística de Fermi-Dirac, 168 5.6 La distribución Bose-Einstein, 176 147 Capítulo 6 Vibraciones reticulares y propiedades térmicas de los cristales 6.1 Cálculos clásicos del calor específico reticular, 181 6.2 Teoría de Einstein sobre el calor específico, 183 6.3 Teoría de Debye sobre el calor específico, 186 6.4 El fonón, 192 6.5 Expansión térmica de los sólidos, 193 6.6 Conductividad térmica reticular de los sólidos, 195 181 Contenido 9 Capítulo 7 Teoría del electrón libre de los metales 203 Introducción, 203 La ecuación de Boltzmann y la trayectoria libre media, 204 Conductividad eléctrica de un gas de electrones libres, 209 Conductividad térmica y efectos termoeléctricos en sistemas de electrones libres, 215 7.5 Procesos de dispersión, 219 7.6 El efecto de Hall y otros efectos galvanomagnéticos, 222 7. 7 Capacidad térmica de sistemas de electrones libres, 225 7.1 7.2 7.3 7.4 Capítulo 8 Teoría cuántica de los electrones en redes periódicas 231 8.1 Introducción, 231 8.2 El teorema de Bloch, 232 8.3 El modelo de Kronig-Penney de un cristal infinito unidimensional, 23 5 8.4 Cantidad de movimiento del cristal y masa efectiva, 240 8.5 Representación de zona reducida; electrones y huecos, 243 8.6 La aproximación del electrón libre, 248 8. 7 La aproximación del enlace firme, 255 8.8 Dinámica del electrón en estructuras bidimensionales y tridimensionales; superficies de energía constante y zonas de Brillouin, 260 8.9 Aisladores, semiconductores y metales, 269 8.10 Densidad de la función de estados y cambios de fase en aleaciones binarias, 273 Capítulo 9 Semiconductores electrónicos uniformes en equilibrio 9.1 Semiconductores, 281 9.2 Semiconductores intrínsecos y semiconductores con impurezas, 284 9.3 Estadística de huecos y electrones- El caso del semiconductor intrínseco, 288 9.4 Energía de ionización de centros de impurezas, 292 9.5 Estadísticas de los semiconductores con impurezas, 295 9.6 El caso de la ionización incompleta de niveles de impureza (Temperatura muy baja), 300 9. 7 Conductividad, 302 9.8 El efecto de Hall y la magnetorresistencia, 306 9.9 Resonancia de ciclotrón y superficies elipsoidales de energía, 316 9.10 Densidad de estados, conductividad y efecto de Hall con superficies complejas de energía, 327 9.11 Mecanismos de dispersión y movilidad de los portadores de carga, 335 281 Contenido 10 Capítulo 1O Exceso de portadores en semiconductores 347 10.1 Introducción, 347 10.2 Comportamiento de transporte de los portadores excedentes; las ecuaciones de continuidad, 348 10.3 Algunas soluciones particulares de la ecuación de continuidad, 361 10.4 Movilidad de arrastre y el experimento de Haynes-Shockley, 371 10.5 Recombinación superficial y condiciones de frontera superficiales, 3 74 10.6 F otoconductividad de estado estacionario, 3 79 10.7 Fotoconductividad transitoria; tiempo de vida de los portadores en excedentes, 383 10.8 Mecanismos de recombinación; la teoría de recombinación de Shockley-Read, 390 Capítulo 11 Tecnología de materiales y medición de propiedades •E volumétricas 401 11.1 Preparación de los materiales semiconductores de alto grado de pureza, 401 11.2 Crecimiento de muestras monocristalinas, 407 11.3 Medición de la resistividad volumétrica, 409 11.4 Medición del contenido de impurezas y la movilidad mediante el efecto de Hall, 411 11.5 Medición del tiempo de vida de los portadores excedentes, 412 11.6 Dislocaciones y otras imperfecciones, 413 Capítulo 12 Teoría de las uniones p-n de los semiconductores 12.1 12.2 12.3 12.4 12.5 421 La unión p-n, 421 El potencial de contacto interno de equilibrio, 424 Potenciales y campos en las cercanías de una unión p-n, 426 Modelo matemático simplificado de la unión p-n abrupta, 429 Capacitancia de unión; determinación del potencial interno, 435 Capítulo 13 Rectificadores de unión p-n y transistores 13.1 Teoría del rectificador de unión p-n, 439 13.2 Corrientes y campos en los rectificadores de unión p-n, 44 7 13.3 Rectificadores de unión de tamaño finito; efectos de superficies y terminales óhmicas, 452 13.4 Mecanismos físicos de ruptura en las uniónes p-n, 456 13.5 Técnicas de fabricación de la unión p-n, 460 13.6 Transistores de unión p-n-p- y n-p-n, 460 439 Contenido 11 Capítulo 14 Uniones p-n a niveles altos de corriente; el rectificara p-i-n, 479 14.1 Uniones p-n a densidades altas de corriente, 479 14.2 El análisis del rectificador p+-i-n+ a niveles altos de corriente, 481 14.3 Rectificadores p-i-u; la caída de voltaje en sentido directo como una función de la temperatura, 490 Capítulo 1S Otros dispositivos semiconductores, 495 15.1 El efecto fotovoltaico p-n y las celdas fotovoltaicas de unión p-n, 495 15.2 Otros dispositivos sensibles a la luz; fototransistores, detectores de partículas y detectores infrarrojos, 502 15.3 Rectificadores controlados p-n-p-n, 503 15.4 Diodos túnel, 506 15.5 Transist~res de efecto de campo o unipolares, 509 CAPITULO 16 CONTACTOS METAL-SEMICONDUCTOR Y SUPERFICIES DE SEMICONDUCTORES, 513 16.1 Contactos metal-semiconductor en equilibrio, 513 16.2 Rectificación por contacto metal-semiconductor, 517 16.3 Estados superficiales y rectificación independiente de las funciones de trabajo, 5 20 16.4 Potencial, campo y carga en la capa superficial de un semiconductor, 524 16.5 Conductividad superficial, efecto de campo y movilidad superficial; propiedades de superficies de semiconductores reales, 5 31 Apéndice a la función & dirac S3S Apéndice b análisis tensorial 537 Indice de nombres 541 Indice de temas S43 CAPITUW 1 Redes cristali,-,m y tipos de cristales 1.1 CONCEPTO DE ESTADO "SOLIDO" Desde un punto de vista general, el término sólido se aplica a substancias elásticas rígidas, es decir, a substancias que tienen un comportamiento elástico no sólo cuando se les somete a fuerzas hidrostáticas, sino también a esfuerzos de tensión y cortantes. Por supuesto, existen algunos materiales cuyo comportamiento es tanto elástico como plástico o viscoso, de modo que esta clasificación no es del todo rigurosa. No obstante, se adoptará como criterio de lo que es una substancia sólida, reconociendo que existe un tipo de substancias que, al mismo tiempo, se comporta como sólido y como fluido. Los materiales que se pueden considerar como sólidos de acuerdo con esta defmición, se dividen en dos categorías: los amorfos y los cristalinos. Entre las substancias amorfas, los átomos o moléculas pueden estar enlazados con bastante firmeza entre sí; pero poseen poca o ninguna regularidad o periodicidad geométrica, en la forma en que los átomos están dispuestos o acomodados en el espacio. Estas substancias son casi siempre viscoelásticas y se pueden considerar como líquidos sobreenfriados. En la figura 1.1 se muestra una representación bidimensional de un material amorfo. •o •o •o •o• •o •o•o •o• •o •o •o •o • •o • o •o •o • •o •o •o •o• •o •o • • • • o • o • oo • oo • • • • • • Cristalino Figura 1.1. •o • • o• •o• o • o • • •o • o o • o • o • o •o•• • •o o o • •o • o• o o • •o • • • o • o o o •o • • • • • • Amorfo Representación esquemática en dos dimensiones, que muestra la düerencia existente entre el arreglo atómico de un sólido cristalino y otro amorfo. 13 14 H.edes cristalinos y tipos de cristales Por otro lado, las substancias cristalinas se caracterizan por una periodicidad perfecta (o casi perfecta) en su estructura atómica; esta regularidad de estructura proporciona un cuadro conceptual muy simple de un cristal y facilita la tarea de comprender y calcular sus propiedades físicas. Por esta razón, los sólidos cristalinos se comprenden mejor físicamente que los sólidos y líquidos amorfos. En este libro, el tema se restringirá principalmente a un estudio de las propiedades físicas de los sólidos cristalinos perfectos o casi perfectos. En algunas ocasiones, la presencia de un número relativamente pequeño de imperfecciones tales como átomos de impurezas, vacíos en la red o dislocaciones, en un cristal periódico que sería perfecto a no ser por esta circunstancia, puede producir cambios notables en el comportamiento físico del material. Esta obra se ocupará también de ellos según la importancia que revistan dichos efectos. Por último, es necesario comprender que las muestras macroscópicas de sólidos cristalinos tales como metales, cerámicas, sales iónicas, etc., no siempre se componen de un solo cristal, sino que a menudo están formados por un conjunto o conglomerado de pequeñas unidades de cristal -cada una con diferente orientación de cristal- separadas entre sí por "fronteras o límites de grano" que se pueden considerar como regiones definidas de rupturas y dislocaciones reticulares muy grandes. Principalmente se tratarán las propiedades de diferentes tipos de cristales individuales; pero se intentará comprender la naturaleza de las fronteras o límites de granos y sei'ialar las principales formas en que pueden influir en las propiedades físicas de las muestras cristalinas macroscópicas. 1.2 CELDAS UNITARIAS Y REDES DE BRAVAIS En la figura 1.2 se describe la estructura reticular de un cristal bidimensional que se utilizará como ejemplo para explicar ciertos términos cristalográficos fundamentales. En relación con esta figura, se puede seleccionar el paralelogramo ABCD como una celda unitaria de dicha estructura reticular o red, la cual está determinada por los vectores base a y b. Todas las traslaciones del paralelogramo ABCD mediante múltiplos enteros de los vectores a y b a lo largo de las direcciones a y b, darán como resultado su traslación a una región del cristal exactamente igual a la original. Así pues, todo el cristal se puede reproducir sencillamente si se reproduce la super- Figura 1.2. Celdas unitarias y vectores base en una estructura reticular bidimensional. Celdas unittuios y redes de Bravais 15 ficie ABCD que se traslada sobre las direcciones a y b mediante todas las combinaciones posibles de múltiplos de los vectores base a y b. En otras palabras, cada punto de la red del cristal se puede describir por medio de un vector r tal que r =ha+ kb, (1.2-1) en donde h y k son enteros. Evidentemente, este procedimiento se puede ampliar con suma facilidad para determinar celdas unitarias y vectores base en redes cristalinas tridimensionales. Por tanto, se puede llegar a las siguientes defmiciones: Celda unitaria: una región del cristal defmida por tres vectores, a, b y e, que al trasladarse por medio de cualquier múltiplo entero de dichos vectores reproduce una región similar del cristal, Vectores base: conjunto de vectores linealmente independientes a, b, e, que se pueden usar para defmir una celda unitaria, Celda unitaria primitiva: la celda unitaria más pequeiia (en volumen) que se puede defmir para una red dada, Vectores base primitivos: conjunto de vectores linea1mente independientes que definen una celda unitaria primitiva. De acuerdo con las anteriores defmiciones, en este caso también es evidente que cada punto reticular de una red cristalina tridimensional se puede describir mediante un vector de la forma r =ha+ kb +le (h, k, 1 enteros) (1.2-2) Conviene obserYar que la celda unitaria se puede defmir de varias maneras, po1 ejemplo, A'B'C 'D' y A"B''C "D" son otras posibilidades que describen la celda uni· taria ilustrada en la figura 1.2. Estas tres celdas unitarias son de tipo primitivo para esta red y, por ende, existe una ambigüedad correspondiente en la selección de un conjunto de vectores base primitivos. Cualquiera de los vectores (a, b) o (a', b') podría servir de igual manera. La celda de mayor tamaño EFGH de la misma figura es un ejemplo de una celda unitaria que no es primitiva. Se puede demostrar que existen 14 formas de acomodar los puntos en las redes cristalinas, de tal modo que todos los puntos de dichas redes tengan exactamente el mismo medio circundante. Estas estructuras reticulares conocidas como redes de Bravais se ilustran en la figura 1.3. En el caso de una de estas redes, un observador que ve el cristal desde uno de los puntos de la red, vería exactamente la misma disposición o arreglo de los puntos circundantes de la red, sea cual fuere el punto que haya seleccionado para observar. A primera vista podría parecer que puede existir otra red de Bravais; por ejemplo, en las 14 redes de Bravais de la figura 1.3 no se incluye un arreglo tetragonal centrado en la cara. la razón de ello es que esta estructura tetragonal centrada en la cara equivale a una red tetragonal centrada en el cuerpo, en la que el lado de la base de la celda unitaria es 1/.¡2 veces su valor correspondiente a la disposición centrada en la cara. La demostración de este postulado, y la pregunta acerca de por qué las estructuras cúbicas centrada en la cara y centrada en el cuerpo son distintas, se le dejan al lector como ejercicio. Estas 14 redes se pueden agrupar en siete sistemas cristalinos, cada uno de los cuales tiene en común ciertos elementos de simetría característicos. Los elementos de simetría que se han escogido para especificar estos siete sistemas son los siguientes: 16 Redes cristoliliiiS y tipos de cristales / / / V Cúbica simple Cúbica centrada en la base ./ 7 ./ [7 Tetragonal centrada en el cuerpo Tetragonal simple V Cúbica centrada en la cara V Ortorrómbica simple Ortorrómbica Ortorrómbica Ortorrómbica centrada en la base centrada en el cuerpo centrada en la cara MonocHnica Monoclínica simple centrada en la base Triclínica Trigonal e Figura 1.3. Las catorce redes de Bravais. (1) Eje de rotación de orden n: la rotación alrededor de un eje de este tipo a un ángulo de 21rjn radianes no produce ningún cambio en la estructura reticular. En este caso, n puede tener los valores 1, 2, 3, 4 y 6. La simetría rotacional de 5 veces en una red cristalina es imposible. (2) Plano de simetría: una mitad del cristal reflejada en un plano semejante que pasa por un punto de la red, reproduce la otra mitad. Celdas unitarias y redes de Bravais 17 (3) Centro de inversión: un punto de la red alrededor del cual la operación r-+ - r (en donde r es un vector a cualquier otro punto de la red) deja a la estructura reticular sin sufrir cambio alguno. ( 4) Eje de rotación-inversión: la rotación alrededor de este eje a 2n/n radianes (n = 1, 2, 3, 4, 6) seguida de una inversión alrededor de un punto de la red por el que pasa el eje de rotación, no produce ningún cambio en la red. Existen otras formas posibles de operaciones de simetría; pero se puede demostrar que todas son equivalentes a combinaciones lineales de estas cuatro. Los siete sistemas cristalinos con sus elementos de simetría representativos y sus características de celda unitaria aparecen en la tabla 1.1. En la figura 1.4 se describe la notación que se emplea para las dimensiones y los ángulos de la celda unitaria. TABLA l.l Los siete sistemas cristalinos Sistema Elemento característico de simetría* Red de Bravais Triclínico Ninguno Simple Monoclínico Un eje de rotación doble Simple Centrada en la base Características de la celda unitaria a=l=b=l=c a. = f3 = 90° =1= y Ortorrómbico Tres ejes de rotación doble mutuamente perpendiculares Simple Centrada en la base Centrada en el cuerpo Centrada en la cara a=l=b=l=c a. = f3 = y = 900 Tetragonal Un eje de rotación cuádruple o un eje de rotación-inversión cuádruple Simple Centrada en el cuerpo a=b=l=c a. = f3 = y = 900 Cúbico Cuatro ejes de rotación triple (diagonales cúbicas) Simple Centrada en el cuerpo Centrada en la cara a=b=c a. = f3 = y = 90° Hexagonal Un eje de rotación séxtuple Simple a =b =1= e a.= 120° f3 =y= 90° Trigonal (Rombohédrico) Un eje de rotación triple Simple a=b=c a. = f3 = Y -r 90· *Por supuesto, pueden existir otras propiedades de simetría en casos individuales. aquí se indican sólo los más peculiares de cada sistema cristalino en particular. 18 Redes cristalinas y tipos de cristales b ~------b--------~ Figura 1.4. Notación de los ángulos y las dimensiones dentro de la celda unitaria. Conviene recordar que, por lo general, los puntos de la red de una estructura reticular no representan a un solo átomo, sino más bien a un grupo de átomos o molécula. En consecuencia, además de las propiedades de simetría de los puntos reticulares propiamente dichos, se necesita tomar en cuenta las propiedades de simetría de las moléculas o grupos de átomos en cada punto reticular alrededor de los puntos de red propiamente dichos, a fin de enumerar totalmente todas las estructuras cristalinas posibles. Cuando esto se hace, se descubre que hay 230 patrones repetitivos básicamente diferentes en los que los elementos se pueden acomodar para formar posibles estructuras cristalinas. Las limitaciones de este libro no permiten estudiar y enumerar todas estas posibilidades en detalle. Si el lector desea obtener datos más detallados sobre este tema, convendrá que consulte una de las obras que tratan sobre cristalografía y que se citan al final de este capítulo. 1.3 ALGUNAS ESTRUCTURAS CRIST AUNAS SIMPLES De acuerdo con la figura 1.3, es evidente que existen tres redes cúbicas posibles, es decir, la cúbica simple, la cúbica centrada en el cuerpo y la cúbica centrada en la cara. La celda cúbica unitaria que se ilustra en la figura 1.3 como la red cúbica simple, constituye también la celda unitaria primitiva, dado que contiene el mínimo irreductible de un átomo por cada celda. Este resultado se obtiene observando que en la celda cúbica simple se tienen ocho átomos en los ocho vértices de la celda, donde, cada átomo es compartido en la misma forma por ocho celdas unitarias adyacentes a cada vértice. Por tanto, se puede decir que se tienen 8 átomos en las esquinas y que 1/8 de cada uno de éstos pertenece a esta celda en particular, dando un total de un átomo por celda unitaria. La celda cúbica correspondiente a la estructura cúbica centrada en la cara, contiene 8 átomos en los vértices, compartidos por 8 celdas y 6 átomos centrados en la cara, que son compartidos por dos celdas, lo cual da un total de 8(1/8) + 6(1/2), o bien, 4 átomos dentro de la celda cúbica. En la celda cúbica correspondiente a la estructura cúbica centrada en el cuerpo, se tienen 8 átomos en los vértices compartidos por 8 celdas y un átomo central que pertenece exclusivamente a dicha celda, dando un total de 8(1/8) + 1 ó 2 átomos dentro de la celda cúbica. Para estructuras simples que contienen átomos de un solo tipo, la celda unitaria primitiva contiene casi siempre un solo átomo y, por tanto, se puede llegar a la conclusión de que la celda cúbica centrada en la cara y la centrada en el cunpo no son primitivas. En efecto, este es el caso; las celdas primitivas para las estructm:J<; cúhica crntrada en la cara y cúbica centrada en el cuerpo, se ilustran Algunas estructuras cristalinas simples 19 Celda primitiva cúbica centrada en la cara Celda primitiva cúbica centrada en el cuerpo 1 1 1 1 1 1 1 11 ~--------4' 1 1 Figura 1.5. Celdas unitaria~ primitivas de redes cúbicas centrada en la cara y centrada en el cuerpo. en la figura l.S. Cada celda primitiva contiene un solo átomo. Como siempre, estas celdas primitivas no son las únicas que se pueden definir, ya que existen muchas opciones posibles de grupos de vectores base primitivos para cualquiera de las estructuras. La celda primitiva para la estructura cúbica centrada en la cara que se ilustra en la figura 1.5 es, obviamente, un caso especial de una estructura trigonal en la que a = {3 = 'Y = 60°. Para este valor particular de a, la estructura trigonal posee una simetría cúbica y se reduce a la red cúbica centrada en la cara. Por supuesto, se puede hacer caso omiso de la celda cúbica de la red cúbica centrada en la cara y considerar que la estructura sea de tipo trigonal con a = 60°, empleando sólo la celda primitiva de la figura l.S. Sin embargo, casi siempre conviene considerar la mayor celda cúbica como la base del cristal, en lugar de utilizar la celda primitiva, ya que esto permite representar la estructura reticular en un sistema de coordenadas ortogonales (x, y, z) -el cual es mucho más simple que un sistema oblicuo- y porque la red tiene todas las propiedades de simetría relacionadas con la estructura cúbica simple. En el caso de la estructura cúbica centrada en el cuerpo, por similares consideraciones, se aconseja usar, siempre que sP.a posible, la mayor celda cúbica como la base del cristal. No obstante, para ciertos fines será absolutamente necesario emplear la celda primitiva; pero estos casos especiales se señalarán cuando surjan. Cuando se tienen esferas iguales dentro de un recipiente, el empaquetamiento más cerrado o compacto que se puede lograr es tener una capa en la base en la que cada esfera está rodeada por otras seis adyacentes, con capas exactamente iguales encima de ella, utilizando los intersticios triangulares entre las esferas de la capa inferior para acomodar las que se van agregando en la capa inmediatamente superior. Es obvio que en un arreglo de empaquetamiento compacto cada esfera sólo tiene 12 vecinas adyacentes, seis que la rodean en la misma capa, 3 en la superior y. 3 en la inferior. Cualquier estructura que tiene un empaquetamiento compacto en este sentido, se caracteriza por la propiedad de que cada átomo tiene 12 vecinos adyacentes y, por lo contrario, no hay otra estructura en la que cada átomo tenga más de 12 vecinos cercanos. 20 Redes cristalinos y tipos de cristales @ Posiciones para la tercera capa en h.e.c. © Posiciones para la tercera capa en cúbica centrada en la cara c.c.c. de empaquetamiento compacto A A A Figura ] .6. Arre~( o de capas de empaquetamiento compacto en las redes cúbica centrada en la eara con empaquct~miento compacto y la hexagonal con empaquetamiento comp;wto. [Tomado l"Oil autorización de L. V. Azaroff, Introduction to Solids, McC.raw-Hill (1960), pá¡>;ina 1)0.1 Algunas estructuras cristalinas simples 21 Para tener una estructura con esta clase de empaquetamiento compacto, se puede colocar una capa inferior A, luego una segunda capa B -tal como se describió en el párrafo anterior-, después se pone una tercera capa en la que los átomos quedan directamente arriba de los de la capa A, a continuación, la cuarta capa cuyos átomos se ubican directamente arriba de los de la capa B, y así sucesivamente hasta formar un arreglo de capas ABABABAB ... , como se ilustra en la figura 1.6. Esta estructura tiene una Simetría hexagonal y se le conoce con el nombre de estructura hexagonal de empaquetamiento compacto (h.e.c.). De igual modo, se pueden colocar los átomos de la tercera capa ya no directamente encima de los de la primera, sino en una tercera gama de posiciones como se ilustra en la figura 1.6, formando la tercera capa C cuyos átomos quedan arriba, en una posición diferente a los de las capas A y B. A continuación se agrega la cuarta capa en las posiciones correspondientes a la capa A y se forma una disposición de capas ABCABCABC ... Esta segunda estructura ·posible de empaquetamiento compacto es sencillamente, la cúbica centrada en la cara, que es la normal en las capas de empaquetamiento compacto de la estructura diagonal cúbica. De acuerdo con la figura 1.3, se puede ver claramente que cada átomo de la estructura cúbica centrada en la cara tiene sólo 12 vecinos contiguos, a una distancia de ..j2(2 veces el lado del cubo, por lo que la estructura debe ser de empaquetamiento compacto. Por el contrario, en la estructura cúbica centrada en el cuerpo, cada átomo tiene sólo 8 vecinos adyacentes a una distancia de ../'f/2 veces el lado del cubo; si los puntos reticulares de la estructura cúbica centrada en el cuerpo se observaran como si fueran esferas en expansión, éstas tocarían el borde del cubo antes de rozar la diagonal y la estructura resultante no tendría un empaquetamiento tan compacto. En la figura l. 7 se muestran las estructuras de NaCl y CsCI. La estructura del NaCI tiene átomos alternantes de Na y Cl en los puntos reticulares de una red cúbica simple. Los átomos de Na quedan en los puntos reticulares de una estructura cúbica centrada en la cara, al igual que los átomos de Cl. La estructura del CsCl es básicamente centrada en el cuerpo y, en ella, los átomos de Cs quedan en las posiciones centradas en el cuerpo y los de Cl en los vértices del cubo (o viceversa). Hay un gran número de cristales iónicos que cristalizan en cualquiera de estas dos formas reticulares. / / L ~ V / ~ V / / V V V V V V (O) NoCI Figura 1.7. V V (b) CsCI Las estructuras de NaCI y CsCI. En la figura 1.8 se ilustran las estructuras del diamante y la zincblenda. Las líneas que conectan los átomos de estas estructuras representan los enlaces covalentes de los pares de electrones que están dispuestos tctrahédricamente alrededor de cada átomo. En estas dos estructuras, cada átomo tiene cuatro vecinos contiguos. En el caso del diamante, la estructura se puede considerar como dos redes cúbicas centra· das en la cara que se intercalan una en la otra, desplazándose entre sí a lo largo de la diagonal del cubo en 1/4 de la longitud de dicha diagonal. Por tanto, la re.d tiene 22 Redes cristaliTUlS y tipos de cristales {al Zincblenda {ZnS) Figura 1.8. Figura 1.9. { b) Diamante Estructuras de la zincblenda y el diamante. Diagrama de la estructura reticular de la zincblenda en donde se muestran los contornos lk la n:lcla unitaria cúbica. Planos cristalinos e índices de Miller 23 una simetría cúbica. La descripción anterior de la red del diamante se puede entender mejor estudiando la figura 1.9 en donde se muestra cómo la red del diamante se puede describir mediante una celda unitaria cúbica. El silicio, el germanio y el estaño a- (gris) se cristalizan también en la estructura del diamante. La estructura de la zincblenda está íntimamente relacionada con la del diamante. En el caso de la zmcblenda, la estructura se puede representar como dos redes cúbicas centradas en la cara que tienen una interpenetración, al igual que el diamante, excepto que una de las redes cúbicas centradas en la cara se compone por completo de átomos de zinc y la obra está constituida totalmente por átomos de S. Por supuesto, esta estructura reticular también tiene simetría cúbica. Los compuestos semiconductores III-V, InSb, GaAs, GaSb, InP, GaP, etc., se cristalizan con esta misma estructura. Lo "compacto" del empaquetamiento de los átomos en cualquier estructura dada se puede inferir del número de vecinos más cercanos que rodean a cada átomo. Esta cifra, que con frecuencia se denomina número de coordinación del cristal, puede variar de un máximo de 12 en las estructuras de empaquetamiento compacto hasta el 4, en el caso del diamante y la zincblenda, cuyas estructuras son relativamente "abiertas". 1.4 PLANOS CRISTALINOS E INDICES DE MILLER En un cristal de red periódica regular, con frecuencia es necesario mencionar el sistema de planos dentro del cristal que corren en ciertas direcciones, cortando varios conjuntos de átomos. Así pues, las capas con empaquetamiento compacto de las redes cúbicas centradas en la cara y hexagonal con empaquetamiento compacto, forman sistemas muy definidos e importantes de planos cristalinos. La orientación de estos sistemas de planos dentro del cristal se especifica mediante tres números denominados índices de Miller, que se pueden determinar como sigue: (1) Se toma como origen cualquier átomo del cristal y se levantan ejes de coordenadas a partir de dicho átomo en las direcciones de los vectores base. (2) Se encuentran las intersecciones de un plano que pertenece al sistema, expresándolos como múltiplos enteros de los vectores base a lo largo de los ejes cristalinos. (3) Se sacan los recíprocos de estos números y se reducen a la tríada más pequeña de enteros h, k, l, que tienen la misma relación. De donde, la cantidad (hk/) constituye lol> índices de Miller de dicho sistema de planos. Por ejemplo, en la figura 1.1 O se muestra un plano cuyas intersecciones son el doble de la distancia reticular a, tres veces la distancia reticular b y 4 veces la distancia reticular c. Los índices de Miller de la familia a la que pertenece este plano se obtienen sacando los recíprocos de estos números, es decir, 1/2, 1/3, 1/4, y reduciéndolos a la tríada más pequeña posible de enteros que tengan la misma relación. Esto se logra multiplicando cada uno de los recíprocos p0r doce, que en este caso dan 6, 4, 3. Los índices de Miller se escriben simplemente encerrando estos tres números entre paréntesis; en este ejemplo, el plano forma parte de una familia de planos (643) o sea, un plano. Puede haber un número de sistemas de planos cuyos índices de Miller difieran por permutación de los números o de signos menos y, sin embargo, ser todos cristalográficantente equivalentes en lo que respecta a densidad de átomos y espa- 24 Redes cristalinas y tipos de cristales Figura 1.10. Un plano reticular (643) de una red cristalina. ciamiento interplanar. Por ejemplo, en una red ortogonal, los siguientes planos (Jzkl), (hkl), (hKl), (hkl), (ftld), (fikl), etc., obtenidos al asignar varias combinaciones de signos menos a los índices de Miller, son equivalentes en este sentido. (Se acostumbra escribir los signos menos encima y no antes de los índices de Miller.) De igual modo, en una estructura reticular cúbica, todos los planos representados por permutaciones de los tres índices de Miller entre sí mismos, tales como (hkl), (khl), (lhk), etcétera, al igual que los que se obtienen tomando varias combinaciones de signos menos, son cristalográficamente equivalentes. C'uando se hace referencia a un grupo completo de planos cristalográficamente equivall'ntes, de los cuales (hkl) ~s un miembro, se acostumbra encerrar los índices de Miller entre llaves, o sea, { hkl}. Si el plano es paralelo a uno o dos de Jos vectores a, b, e, una o dos de las intersecciones se localizarán en el infinito; los índices de Miller correspondientes son, por tanto. cero. Por ejemplo, si el plano que se ilustra en la figura 1.1 O se hace girar alrededor de la línea AB hasta que queda paralelo a e, las intersecciones se convierten en 2, 3, oo, y los índices de Miller son, en consecuencia (320). Si se hace girar más todavía alrededor de una línea perpendicular al plano a y b pasando por el punto A hasta que quede en paralelo a b, las intersecciones serán 2, oo, uo, y los índices de Miller son (1 00). El lector debe conocer a fondo las familias de planos { 100} (planos de cara cúbica), { 11 O } y de {111} para las redes cúbicas. Los índices de una dirección dentro de un cri~tal se pueden expresar como un conjunto de enteros que tienen la misma relación que los componentes de un vector en esa dirección, expresados como múltiplos de los vectores base a, b, c. Por tanto, el índice de dirección de un vector ha+ kb +le es, en todo caso, [hkl]. Los paréntesis cuadrados que encierran las tres cifras señalan los tres índices de dirección. Por supuesto, las direcciones con distintos índices direccionales pueden ser cristalográficamente diferentes en la misma forma que los planos cristalinos con distintos índices de Miller; sobre todo las normales a los planos cristalográficamente equivalentes también deben tener direcciones cristalográficamente equivalentes. El conjunto completo de direcciones cristalográficamente equivalentes de las cuales [hkll es un miembro, se expresa encerrando los índices de dirección en la siguiente forma: (hk[). En cristales cúbicos, una dirección con índices direccionales [hkl] es normal a un plano cuyos índices de Miller son (hkl); pero, por lo general, esto no se aplica a otros sistemas. Esta es otra de las razones aceptables para relacionar las redes cúbicas centradas en el cuerpo y la centrada en la cara con estructuras cúbicas más que con celdas unitarias primitivas. El comprobar este resultado queda como ejercicio para el lector. La posición de los puntos de una celda unitaria se especifica en función de las partes fraccionales de las magn1tudes de los vectores de base a lo largu de las direcciOne~ de coordenadas correspondientes, tomando siempre como origen el átomo Espaciamiento de los planos en las redes cristalinas 25 de un vértice. Por ejemplo, las coordenadas del punto central de una celda unitaria son {1/2, 1/2, 1/2) y las coordenadas de los centros de las caras son (1/2, 1/2, 0), (0, 1/2, 1/2), (1/2, O, 1/2), (1/2, 1/2, 1), (1, 1/2, 1/2) y (1/2, 1, 1/2). 1.5 ESPACIAMIENTO DE LOS PLANOS EN LAS REDES CRISTALINAS De acuerdo con la figura 1.1 O, se podría pensar que el espaciamiento existente entre los planos vecinos del sistema (hkl) sería simplemente igual a la longitud de la normal al plano definida por las intersecciones dadas y el origen. Sin embargo, generalmente no es así y la razón es que al determinar la ubicación de un plano (hkl) desde ciertas distancias de intersección, el origen se podría tomar como cualquier punto reticular del cristal, por lo que un plano (hkl) debe pasar por cada punto reticular del cristal. Esto se ilustra gráficamente en la figura 1.11 para el caso de un conjunto de "planos" en una estructura reticular bidimensional. El sistema de planos es el que determinan las intersecciones 3a y 2b a lo largo de los ejes, a y b, respectivamente. En consecuencia, los índices de Miller son (23) (o bien, (230) si se piensa que los planos son paralelos a un eje e que sale del plano de la hoja de papel en un cristal tridimensional). Los planos que están delineados con líneas más gruesas son los que se determinan por medio de las distancias de intersección (3a, 2b) y el origen se escoge en O. No obstante, el origen podría haberse escogido en el punto reticular número "1 ", en cuyo caso se habrían definido los planos de trazo más ligero marcados con "1 ", utilizando el mismo conjunto de distancias de intersección. De igual manera, el origen se podría haber ubicado en los puntos reticulares 2, 3, 4 ó 5, en cuyo caso, usando todavía el mismo conjunto de distancias de intersección, el conjunto de planos números 2, 3, 4 y 5 habrían quedado definidos. Sin embargo, ahora se tiene un plano de esta familia que pasa por cada átomo del cristal, entre Figura I.l L Una representación de todas las líneas (23) dentro de una red bidimensional. Si existe un eie e- normal al nlano del papel, este sistema de líneas se puede considerar como los tra10s de planos (230) (que son normales a la página) en el plano del papel. Observe que sólo se tiene una línea (o plano) del sistema que pasa pnr cada punto reticular. 26 Redes cristalinos y tipos de cristales los cuales se intercalan 5 planos adicionales entre cada par de planos originales de trazo grueso. Ahora se ve que las intersecciones de los planos adyacentes a lo largo de los ejes a y b difieren, respectivamente, en a/2 y b/3. Para un .conjunto de índices de Miller (hk) estas intersecciones diferirán en a/h y b/k. Para demostrarlo, véase primero el área OA CB de la figura 1.11. Se tienen los puntos reticulares hk que pertenecen a esta área, ya que consiste en hk celdas unitarias que tienen cada una de ellas un solo punto reticular. La región ABCD, que obviamente equivale en superficie a OACB (ambas se pueden tomar como superposiciones de dos triángulos congruentes a OAB) por tanto, también tiene hk puntos reticulares. Esta superficie también contiene sólo hk planos reticulares (6 en el ejemplo anterior), uno por cada uno de los puntos reticulares hk dentro del área. Se observará que cada plano puede cortar sólo un punto reticular dentro de ABCD, excepción hecha de los planos que cortan los puntos reticulares de las fronteras, que pueden pasar por dos puntos reticulares, de los cuales un medio o un cuarto pueden pertenecer a ABCD, dependiendo de que dichos puntos reticulares así intersecados representen átomos laterales o de vértices. En consecuencia, en ABCD hay hk planos del sistema que se intersecan con el eje b dentro de una distancia hb, siendo la diferencia que hay entre las intersecciones b de los planos adyacentes, hb/hk = b/k. De la misma manera, en el área ABEC que también es igual en superficie a OACB y que contiene también hk puntos reticulares y hk planos, se observa que se tienen hk que cortan el eje a en una distancia ka, en donde la diferencia existente entre las intersecciones a de los planos adyacentes del sistema es afh. Para simplificar los conceptos geométricos, este resultado se obtuvo para un cristal bidimensional (o para planos paralelos al eje e de un cristal tridimensional). Sin embargo este mismo argumento se puede ampliar en una forma muy directa para un conjunto de planos (hk{) de un cristal tridimensional teniendo como resultado el hecho de que las distancias entre las intersecciones entre los ejes y los planos adyacentes de un sistema con índices de Miller (hkl) a lo largo de los ejes a-, b- y e- son, respectivamente, afh, b/k y cfl. El desarrollo de la exposición para un cristal tridimensional queda de ejercicio para que el lector lo resuelva. El espaciamiento real d que hay entre los planos adyacentes se puede calcular tomando cualquier punto reticular como origen, levantando ejes en las direcciones b k Figura 1.12. Angulas direccionales de la normal al plano (hkl). Qasificación general de ~os cristales 27 a-, b- y e-, y encontrando la distancia perpendicular existente· entre este origen y el plano cuyas intersecciones con el eje son afh, b/k y cfl. En relación con la figura 1.12, es obvio que a b e d = OP = h cos rx = k cos fJ = l cos y, (1.5-1) en donde a, {3, 'Y son los ángulos que hay entre la nonnal al plano y los ejes a-, bY e-, respectivamente. No obstante, si n es el vector unitario nonnal al plano, se tiene que n • a =a cosa, etc., y n·a n·b n·c (1.5-2) d=-=-=h k l . En una red ortogonal, tomando el eje de la coordenada x a lo largo de a, el eje y sobre b y el eje z sobre e, la ecuación del plano (hkl) cuyas intersecciones con los ejes son a/h, b/k, cfl, es hx f(x,y,z) ky lz =-; + b +e = l. (1.5-3) Si f(x, y, z) =constante es la ecuación de una superficie, entonces Vf es un vector nonnal a dicha superficie y la unidad nonnal n está dada por (hfa)i" + (k/b)i, + (lfc)iz Vf 0 = \-Vf-1 = "'--"-........;;;J'":-h-2..;. . .;. . . ;k2-<--l....:.2.;.....;....=., (1.5-4) 2+b2+2 a e y el espaciamiento d'que hay entre los planos adyacentes (hkl) es simplemente n·a d= - h = 1 Jh2 k2 [2 2+b2+2 a e , (1.5-5) de acuerdo con (1.5-2). En este punto conviene observar que a, b y e no son vectores unitarios, en este ejemplo, a = aix, b = biy y e = ciz, en donde ix, iy e iz son la tríada usual de vectores unitarios a lo largo de las direcciones x-, y- y z-, respectivamente. En estructuras reticulares no ortogonales, el problema de encontrar el espaciamiento existente entre planos adyacentes en ténninos explícitos de los espaciamientos y los ángulos reticulares se hace más complejo y no se estudiará en esta obra, aunque las expresiones generales (1.5-1) y (1.5-2) son correctas tanto para sistemas ortogonales como para los no ortogonales. 1.6 CLASIFICACION GENERAL DE LOS CRISTALES Para darle al lector una imagen inicial amplia de las propiedades y las características de varios tipos de materiah:s cristalinos, se hará un repaso breve de algunas de las características más sobresalientes de varias clases de cristales. Por supuesto, se pueden 28 Redes cristalinas y tipos de cristales clasificar en muchas formas, por ejemplo, según sus redes cristalinas, propiedades eléctricas, propiedades mecánicas o características químicas. Sin embargo, para el estudio que nos ocupa, es más conveniente adoptar un esquema de clasificación basado en el tipo de interacción que hace que los átomos del cristal se mantengan unidos. De acuerdo con este esquema de clasificación, los sólidos se subdividen en cuatro categorías generales: iónicos, covalentes, metálicos y moleculares. Cada una de estas clases se examinará en lo particular, aunque se reconoce que no son absolutamente distintos y que algunos cristales pueden posser, al mismo tiempo, características relacionadas con más de una de estas clases generales. Los iónicos son cristales en los que los electrones de valencia se transfieren de un átomo a otro, dando como resultado que el cristal esté compuesto de iones positivos y negativos. La fuente de energía cohesiva que mantiene unido al cristal es la intersección electrostática de estos iones. La configuración electrónica de los iones es esencialmente la de un gas inerte, en donde la distribución de carga de cada ion es esféricamente simétrica. Los compuestos químicos que contienen átomos muy electropositivos y electronegativos, por ejemplo, NaCl, KBr, LiF, tienden a formar cristales iónicos en estado sólido. Casi siempre los cristales iónicos tienen energías de enlace relativamente altas y, como resultado, se caracterizan por puntos de fusión y ebullición más o menos elevado. También se caracterizan por ser malos conductores eléctricos a temperaturas normales y casi siempre son transparentes a la luz visible en tanto que muestran un solo pico de reflexión óptico característico en la región lejana infrarroja del espectro. Los cristales son a menudo muy solubles en disolventes ionizantes tales como el agua, y sus soluciones se disocian fácilmente en iones libres. Casi siempre los cristales iónicos se cristalizan en estructuras de empaquetamiento relativamente compacto como las del NaCl y el CsCI. Los cristales covalentes son aquellos en los que varios átomos comparten equitativamente los electrones de valencia en lugar de transferirlos de unos a otros, como sucede en los cristales iónicos. De donde, no se tiene una carga neta asociada con ningún átomo del cristal. A menudo los elementos de las columnas III, IV y V de la tabla periódica forman combinaciones covalentes. Un ejemplo típico de cristal cavalente lo tenemos en el diamante, en el que cada átomo de carbono comparte sus cuatro electrones de valencia con sus cuatro vecinos más cercanos formando enlaces covalentes de pares de electrones. Los espins de los electrones de estos enlaces de par de electrones son antiparalelos. Estos enlaces covalentes de pares de electrones del diamante son idénticos a las uniones carbono-carbono que se encuentran tan frecuentemente en los compuestos orgánicos. Tienen una naturaleza muy direccional, es decir, los electrones tienden a concentrarse a lo largo de las líneas que unen a los átomos adyacentes y estas líneas tienden a ubicarse tetrahédricamente alrededor de cualquier átomo. Esta disposición tetrahédrica natural de los enlaces covalentes se satisface en las estructuras del diamante y la zincblenda y se ha descubierto que los cristales covalentes tienen a menudo estas estructuras. Por lo general, los cristales covalentes son materiales duros, quebradizos y de energías de enlace bastante elevadas, con puntos de fusión y ebullición elevados. Son semiconductores típicos cuya conductividad eléctrica es muy sensible a la presencia de pequeñas cantidades de átomos de impurezas y aumenta al incrementarse la temperatura a niveles lo suficientemente elevados. Son transparentes a la radiación de longitudes de onda largas y opacos a longitudes de onda más cortas, con una transición abrupta que se produce a una longitud de onda característica y que casi siempre se localiza en la región visible o infrarroja cercana. Existe un rango continuo entre las propiedades covalente e iónica; un cristal dado puede tener naturaleza tanto covalente como iónica y sus electrones de valencia se transfieren en parte y se comparten parcialmente. En la tabla 1.2, los cmtales de la primera columna se componen de átomos de la columna IV del Dosificación general de los cristales 29 TABLA 1.2. Cristales covalentes y iónicos Covalentes (Grupo IV) e (diamante) SI Ge cx-Sn Compuestos III-V Compuestos 11-VI Compuestos {iónicos) I-VII BN BP AIN AIP GaP AlAs BeO BeS MgO MgS CaO Ca S ZnS CaSe ZnSe CdS CdSe ZnTe CdTe LiF LiCI NaF NaCI KF KCI LiBr KBr Nal RbCI RbBr KF Rbl CsBr GaAs InP AISb GaSb InAs InSb sistema periódico y forman cristales completamente covalentes. Los compuestos de la cuarta columna de la tabla son de '"I y VII" y están constituidos de átomos muy electropositivos y electronegativos y los cristales de estos compuestos son muy iónicos. La segunda y la tercera columnas contienen compuestos (II-Vl y lll-V) que son intermedios entre estos dos extremos y tienen naturaleza tanto iónica como cavalente. Por supuesto, los compuestos 111-V son un poco más covalentes que los compuestos 11-VI. Los compuestos intermetálicos III-V forman, a pesar de su carácter ligeramente iónico, una serie de semiconductores cuyas propiedades son similares en muchas formas a las de Jos materiales correspondientes del grupo IV. Los elementos metálicos en estado libre forman cristales metálicos en los que están presentes electrones libres. El hecho de que haya tales electrones libres explica la elevada conductividad eléctrica y térmica de los metales. A su vez, a esta elevada conductividad eléctrica se deben directamente los elevados coeficientes de reflexión y absorción ópticas que son las propiedades ópticas más típicas de los metales. Las propiedades eléctricas y térmicas de los metales que se deben a la existencia de los electrones libres, se pueden explicar fácilmente si se supone que el cristal metálico es un recipiente lleno de un "gas ideal de electrones libres". La energía de enlace de metales "ideales" tales como los metales alcalinos, se originan en la interacción del gas de electrones libres con iones positivos de la red, aunque para muchos otros metales esta imagen es mucho más compleja. Las energías de enlace reales de los cristales metálicos pueden ser muy bajas, como sucede en el caso de los metales alcalinos, que tienen puntos de ebullición y fusión relativamente bajos o muy elevados, como el tungsteno. cuyo punto de fusión es muy alto. Los cristales moleculares son aquellos en los que el enlace entre átomos o las moléculas no es iónico ni covalente, sino que se origina exclusivamente en fuerzas dipolares existentes entre los átomos o las moléculas del cristal. A pesar de que un átomo o una molécula no tiene un momento dipolar promedio, por lo general tendrá un momento dipolar instantáneo y fluctuante que se origina en las posiciones instantá- 30 Redes cristalinas y tipos de cristales neas de los electrones dentro de sus órbitas. Este momento dipolar instantáneo es la fuente de un campo dipolar electrostático que, a su vez, puede inducir un momento dipolar en otro átomo u otra molécula. La interacción existente entre el momento dipolar original y el inducido es de atracción y puede servir para unir un cristal en ausencia de un enlace de tipo iónico y covalente. Las fuerzas de enlace que se originan en interacciones dipolares fluctuantes de esta naturaleza se conocen con el nombre de fuerzas de van der Waals. Casi siempre, estas fuerzas son muy débiles y la energía de enlace que originan disminuye según l/r6 , en donde r es la distancia entre los dipolos. Entonces, los cristales moleculares se caracterizan por energías de enlace reducidas y, en consecuencia, por puntos de fusión y ebullición bajos; por lo general son conductores eléctricos deficientes. Los cristales de compuestos orgánicos generalmente pertenecen a esta clase, como es el caso' de los gases inertes He, Ne, A, etc., en estado sólido. EJERCICIOS l. Demuestre geométricamente que la estructura tetragonal centrada en la cara es equivalente a una red tetragonal centrada en el cuerpo en la que el lado de la base de la celda unitaria es 1/.,¡2 veces la magnitud que tiene para la disposición centrada en la cara. ¿Por qué son distintas las estructuras cúbicas centrada en la cara y la centrada en el cuerpo? 2. Demuestre que la proporción máxima de espacio que se puede llenar con esferas sólidas acomodadas en varias estructuras es la siguiente para cada arreglo Cúbica centrada en el cuerpo 7T/6, 7Tv' 3/8, Cúbica centrada en la cara 7Tv'1¡6, Hexagonal con empaquetamiento compacto 7Tv'2/6, 7Tv'3!t6. Cúbica simple Estructura del diamante 3. Analice desde el punto de vista físico el porqué un cristal real no puede tener un eje de un múltiplo de cinco de simetría rotativa. 4. (a) Dibuje los bosquejos que ilustren Jos planos (100), (110) y (111) para una celda • unitaria cúbica. (b) ¿Cuántos planos equivalentes {lOO'}, ( 110} y { 111} existen en un cristal cúbico? Considere que los planos (hkl) y (hkl) son idénticos. 5. (a) ¿Cuántos planos equivalentes {123} existen en un cristal cúbico? (b) ¿Cuántos planos equivalentes { 111} existen en un cristal ortorrómbico? (e) ¿Cuántos planos equivalentes { 123} existen en un cristal ortorrómbico? En todos estos casos se considerará que los planos (hkl) y (hkl) son idénticos. 6. Demuestre que en un cristal cúbico la dirección [hkl] es normal al plano (hkl). 7. Demuestre que las intersecciones entre los ejes y Jos planos adyacentes (hkl) a Jo largo de los ejes, a-, b- y e- dentro de una estructura tridimensional son a/h, b/k y e/1, respectivamente, utilizando una extensión de los métodos que se usaron en el caso bidimensional dt' la sección 1.5. 8. Demuestre que para las fuerzas de van der Waals, la energía de interacción de los átomos y las moléculas desciende en la forma lfr6, en donde r es la distancia que hay entre los átomos o las moléculas interactuantes. Nota: principie teniendo en cuenta la energía potencial de un dipolo eléctrico en un campo eléctrico externo. 9. De acuerdo con los resultados de la teoría electromagnética de Maxwell para ondas planas, demuestre que en el caso de un conductor muy bueno (a~oo, K ~oo, a= conductividad, K =constante dieléctrica) se debe esperar un alto grado de reflectividad superficial y una gran absorción interna. CAPITULO 2 Análisis cristalográfico con rayos X 1.1 INTRODUCCION El uso de la difracción de los rayos X como técnica para analizar la estructura de los cristales, data del descubrimiento de los efectos de difracción de los rayos X en muestras de un monocristal, efectuado por von Laue en 1912. Laue predijo que :0s átomos de un espécimen monocristalino producirían la difracción de un haz de ::o~ os X monocromático y paralelo, originando una serie de haces difractados cuyas .:!necciones e intensidades dependerían de la estructura reticular y la composición ":.~ímica del cristal. Estas predicciones se verificaron en un plazo muy corto, gracias 1 los trabajos de Friedrich y Knipping. En la figura 2.l(a) se muestra un diagrama esquemático del arreglo experimental correspondiente. La ubicación de los máximos de difracción fue explicada por W. L. Bragg, 1 a base de un modelo muy simple en el que ;.e supone que la radiación X se refleja especularmente desde los planos sucesivos de los fi!~Jra 2.1. 1 W.L. (a) Diagrama esquemático de la difracción de rayos X obtenida con la técnica de Laue. Bragg, Proc. Cambrige Phil. Soc. 17, 43 0912). 31 32 Análisis cristalográfico con rayos X Figura 2.1. (continúa) (b) Un patrón de difracción de Laue de un cristal de fluoruro de litio, haz incidente de rayos X a lo largo de una dirección { 100} (fotografía por cortesía de H. A. McKinstry, Materials Research Laboratory, Pennsylvania Sta te University). 471" ~~--~~----~~L-~~--~~~----~~----~671" Planos del cristal AB = AC =d sen 8 Figura 2.2. Representación de Bragg de una difracción de rayos X, de acuerdo con reflexion.:s en fase desde planos sucesivos de un sistema particular (hk/). Introducción 33 diversos sistemas (hkl) del cristal, y en el que los máximos de difracción sólo se encuentran para direcciones de incidencia y reflexión tales que las reflexiones de los planos adyacentes de un sistema interfieran en forma constructiva, con diferencias de fase de 2rrn radianes, en donde n es un entero. Según este experimento, la diferencia de trayectoria para reflexiones sucesivas sería igual a un número entero de longitudes de onda de los rayos X. Sin embargo, esta diferencia de trayectoria, de acuerdo con la figura 2.2, es 2d sen e, en donde d es el espaciamiento entre planos átomicos adyacentes, tal y como lo dan las expresiones (1.5-2) o (1.5-5) y e es el ángulo de incidencia entre el plano atómico y el haz incidente. Por tanto, los haces fuertemente difractados deben propagarse, fuera del cristal, en direcciones para las que se satisface la ecuación de Bragg nA.= 2d sen e (2.1-1) A partir de 1916, la observación experimental de los patrones de difracción de rayos X se simplificó enormemente gracias a la introducción del método de potencia de Debye y Scherrer. 2 Como se ilustra en la figura 2.3(a), en este método se deja pasar un haz monocromático paralelo lit> rayos X a través de un espécimen finamente pulverizado. En forma puramente accidental, algunos de los microcristales del espécimen pulverizado estarán orientados en el ángulo correcto de difracción para un conjunto particular de planos (hkl), como se expresa en (2.1-1) y el haz difractado ' . ' . \' ' . 1 )\ ; ¡ (b) Figura 2.3. 2 P. (a) Diagrama esquemático de la difracción de rayos X obtenida con la técnica del polvo de Debye-Scherrer. (b) Un patrón de difracción de polvo, de Debye-Scherrer a partir de una muestra de un óxido compleJO de escandia y circonio (fotografía por cortesía de H. A. l\lcKimtry, Materials Research Laboratory, Pennsylvania State University). Debye y P. Scherrer, Physikal, Zeitschr. 17, 277 (1916). 34 Análisis cristalográfico con rayos X se produce inmediatamente. Puesto que la condición de difracción se puede satisfacer para cualquier orientación angular posible </> de la normal a los planos de dispersión alrededor del eje del haz incidente, y dado que siempre habrá microcristales orientados en tal forma que produzcan la difracción (hkf) para cualquier valor de </>, el haz difractado tendrá la forma de un cono cuyo ángulo de abertura es e y no sólo un haz de rayos. Se acostumbra colocar una tira de película en la pared interior de una cámara cilíndrica, concéntrica con la muestra, con el fin de interceptar una porción específica de estos conos de difracción, que son una serie de arcos producidos sobre dicha película. En la figura 2.3(b) se ilustra un patrón pulverizado logrado mediante este sistema. 2.2 FISICA DE LA DIFRACCION DE LOS RAYOS X: LAS ECUACIONES DE VON LAUE Los rayos X se pueden producir fácilmente permitiendo que electrones de alta energía choquen contra un ánodo metálico que constituye el blanco. Los rayos X producidos en esta forma poseen, además de un espectro de fondo continuo, algunas líneas espectrales muy intensas y casi monocromáticas cuya frecuencia es característica del material del blanco. Estas líneas se originan debido al paso de electrones de capas internas del átomo a estados de mayor energía de los cuales se apartan para volver al estado base original con la consecuente emisión de rayos X. La producción de rayos X debido a la interacción de electrones de alta energía con la materia se analiza más detalladamente en la obra de Leighton. 3 Si existe un potencial V0 entre el cátodo y el ánodo de un tubo de rayos X, los electrones adquieren una energía eV0 -en donde e es la magnitud de la carga electrónica- al llegar al ánodo. El cuanto de rayos X más energético que pueden producir tales electrones es aquel para el que la energía del cuanto hv es igual a eV0 • En consecuencia, para este cuanto, eV0 = hv =he/A., (2.2-1) en donde h( = 6.62 x 10- 27 erg-seg) es la constante de Planck. De donde, la longitud de onda de rayos X más corta que se puede producir es A.=~ l/ . e o (2.2-2) Para un voltaje de 10 kilovolts, esto demuestra que la longitud de onda mínima de rayos X que se puede excitar es 1.24 x I0- 8 cm o sea, 1.24 unidades Angstrom. Esta magnitud es del orden de las distancias interatómicas de cristales reales y, de acuerdo con la ecuación de Bragg (2.1-1), es la apropiada para producir efectos de difracción observables sin recurrir a valores extremos de d y e. Por tanto, en un tubo de rayos X en el que los electrones se aceleran mediante un potencial de unas cuantas decenas de kilovolts, se puede considerar satisfactorio para producir rayos X apropiados para el trabajo de difracción cristalográfica. 3 R B. 1 ei¡•hton, l'rinl"iples o( Modern Physics, McGraw-Hill Book Co., Inc. Nueva York (1959), p 405 d 21. Física de la difracción de los rayos X 35 Cuando los átomos de un cristal están sometidos a una radiación electromagnética, por ejemplo, los rayos X, se ejercen sobre ellos fuerzas eléctricas debidas a la interacción de las partículas cargadas de los átomos con el vector del campo eléctrico de la onda electromagnética. Debido a esto, los electrones atómicos vibran armónicamente a la frecuencia de la radiación incidente sufriendo una aceleración. Estas cargas aceleradas vuelven a irradiar energía electromagnética, de acuerdo con la teoría electromagnética, a la frecuencia de vibración, es decir, a la de la onda incidente. A las frecuencias de la luz visible en donde la longitud de onda incidente es mucho mayor que las distancias interatómicas, la superposición de las ondas reirradiadas o dispersas en esta forma por los átomos individuales del cristal, produce solamente los efectos bien conocidos de la refracción y la reflexión ópticas. Sin embargo, a las frecuencias de los rayos X, la longitud de onda incidente es comparable al espaciamiento interatómico y se puede observar la difracción de la radiación de los átomos del cristal. Bragg supuso que los sistemas de planos cristalinos reflejarían especularmente los rayos X, siempre y cuando se satisficiera la condición para la interferencia constructiva entre las reflexiones de planos atómicos sucesivos. A continuación se examinará en detalle la forma en que los rayos X dispersados de diferentes átomos individuales se pueden recombinar de varias maneras. Primero se examinará la radiación dispersada por dos centros de dispersión idénticos separados por una distancia r. El vector n 0 se define como un vector unitario en la dirección del haz incidente y se considera que el vector n 1 es un vector unitario en una dirección arbitraria de dispersión, como se indica en la figura 2.4. Se supone que la radiación incidente es un haz paralelo y el haz disperso se detecta en un punto de observación muy distante. Por tanto la diferencia de trayectoria entre la radiación dispersa en P y la que se dispersa en O es PA - OB = r • n0 - r • n 1 = r • (n 0 - n 1 ). (2.2-3) El vector n 0 - n 1 =N es la normal a lo que en la representación de Bragg se denomina plano de reflexión, si n 1 fuera una dirección de difracción, como se ilustra en la figura 2.5. De acuerdo con esta figura, también es evidente que la magnitud de este vector es (2.2-4) N=2sen0. p Figura 2.4. Geometría de la situación de dispersión de rayo~ X que ~e .mali1a en la ~cc­ ción 2.2. 36 Análisis cristalográfico con rayos X / / / / / / Plano de e_ Figura 2.5. _L_ di~ersión Relación geométrica del haz incidente y el difractado, la normal de dispersión y el "plano de dispersión". La diferencia de fase rl>r entre la radiación dispersa en los dos puntos es, sen· cillarnente 27T/A veces la diferencia de trayectoria, de donde, (2.2-5) Ahora bien, para que haya una difracción máxima en la dirección n cada átomo del cristal debe contribuir a la dispersión en esa dirección, con una diferencia de fase igual a un múltiplo entero de 27T radianes. Para que esto sea verdad, lo único que se necesita es que la radiación de los átomos separados por los vectores reticu· lares primitiJ;os a, b, y e se sumen en fase, ya que en este caso, la contribución de otros átomos separados del origen por combinaciones enteras de estos vectores se sumarán en fase obligatoriamente. Si las contribuciones de dispersión de átomos circunvecinos tuviera una diferencia de fase distinta, siempre sería posible encontrar un átomo del cristal que contribuyera con una radiación exacta de 1T radianes fuera de fase con la contribución de un átomo dado; estas contribuciones se cancelarían átomo por átomo, y no darían un haz difractado. Si se analiza un ejemplo en el que átomos circunvecinos a lo largo de la dirección a contribuyen con componentes de radiación en una dirección dada, que están fuera de fase en 1T radianes (o 7T/2, 7T/4, 7T/6, etc.,) se verá con claridad que esta afirmación es fácil de corroborar. En consecuencia, lo único que se requiere es que se obtenga un múltiplo entero de 27T (2.2-5), en donde r es igual a a, b o e, es decir, se requiere simultá· neamente que 2n -(a· N)= 2nh' = 2nnh }. 2n T (b • N) = 'J.nk' = 2nnk (2.2-6) 2n -;-(e· N)= 2nl' = 2nnl. l. En estas expresiones, h', k', !' pueden ser cualquiera de tres enteros; en general estos tres enteros pueden contener el factor común entero de mayor valor n superior a la unidad, en cuyo caso se puede escribir h' = nh, k'= nk y !' = nl, en Factor de dispersión atómica 37 donde h, k y 1 son ahora tres enteros en la misma relación que h', k' y 1 ' sólo que no tienen un factor común mayor que la unidad. Si h', k', y 1 ', no tienen un factor común mayor que la unidad, entonces se considera que n es la unidad. Si a,~. y 'Y son los ángulos entre la normal de dispersión N y los ejes a-, b- y e- del cristal, respectivamente, entonces, de acuerdo con (2.2-4), a • N= aN cosa= 2a sen() cosa, etcétera, de donde (2.2-6) se puede expresar también como sigue 2a senO cos oc= h'A. = nh.A., 2b sen (} cos fJ = k' A. = nk.A., (2.2-7) 2c sen (} cos y = l' A. = nl.A.. Estas expresiones se conocen con el nombre de ecuaciones de Laue. Para una longitud de onda incidente dada, >.., y valores e~pecíficos de los enteros h, k, l y n, las ecuaciones determinan un cierto valor de () y dos de las tres cantidades (cos a, cos ~. cos 'Y). No obstante, sólo dos de las trc~ cantidades (a,~. 'Y) son independientes debido a que una vez que se fijan los ángulos entre un vector y dos de los tres ejes de coordenadas, la dirección del vector queda fija y el tercer ángulo se puede determinar trigonométricarnente. Por ejemplo, en un sistema de coordenadas ortogonales, un resultado elemental de geometría analítica es que cos2 a + cos2 ~ + cos 2 'Y = l. Las tres ecuaciones (2.2-7) sirven, por tanto, para determinar un valor único de () y N, definiendo así una dirección de dispersión. Los cosenos de dirección de la normal de dispersión N son, de acuerdo con la expresión (2.2-7), proporcionales a h/a, k/b y 1/c. Sin embargo, los planos cercanos cuyos índices de Miller son (hkl), se intersecan con los ejes a-, b- y e- a intervalos a/h, b/k y c/1; por tanto, los cosenos de dirección de la normal a la familia de planos (hkl) son también proporcionales a hja, k/b y ljc, de acuerdo con (1.5-1). La normal de dispersión N es, por ende, idéntica a la normal de los planos (hkl) y, en consecuencia, los planos (hkl) pueden tomarse como los de reflexión en la representación de Bragg. Se puede demostrar que la ecuación de Bragg se sigue de las ecuaciones de Laue, haciendo que h =a cos ajd, k= b cos ~/d, 1 =ecos 'Y/d, en la expresión (1.5-1), de acuerdo con lo cual una de las tres ecuaciones de Laue se reduce a nA.= 2d sen 8, en donde d es la distancia entre los- planos adyacentes del sistema (hkl) y en donde el orden n de la difracción es el factor común más alto entre los órdenes de interferencia h', k' y l '. Por lo general, para referirse a una reflexión de rayos X observada, se citan los números (h' k' 1 ') que dan el orden de interferencia entre los átomos circunvecinos a lo largo de los ejes cristalinos; en consecuencia, el máximo de difracción de primer orden para los planos ( 111) se menciona como la reflexión (111), el máximo de difracción de segundo orden para el mismo conjunto de planos (n = 2, h' = 2h, k' = 2k, 1' = 21) es la reflexión (222), el tercer orden es la reflexión (333), etc. 2.3 FACTOR DE DISPERSION ATOMICA Los cálculos de la sección anterior se basaron en la supostcton de que los centros de los puntos de dispersión coincidían con los puntos reticulares. Ahora, 38 Análisis cristalográfico con rayos X conviene tomar en cuenta que la dispersión, que es el resultado de una interacción entre los electrones del átomo y un haz de rayos X, puede desarrollarse en cualquier punto en que se encuentren los electrones. En otras palabras, se desea modificar los cálculos considerando que la radiación X se dispersa debido a una distribución continua de "densidad de electrones" relacionada con cada punto reticular. Como se verá más tarde, este concepto concuerda totalmente con el punto de vista de la mecánica ondulatoria del proceso. Sin embargo, se debe hacer notar que se está descuidando el efecto de dispersión de los núcleos atómicos que interactuán con mucha menor fuerza con los rayos X. Se encontrará que, debido a la extensión finita de la distribución de densidad e.lectrónica, la amplitud de la radiación difractada se multiplica por un factor que incluye la longitud de onda de los rayos X, el ángulo incidente y la distribución de densidad electrónica asociada con los átomos. Se principiará inquiriendo sobre la relación entre la amplitud de difracción de los rayos X, en el ángulo de Bragg, dispersados por un elemento de carga p(r)dv, ubicado en un elemento de volumen dv alrededor del punto r, y la que dispersa un electrón de un solo punto en un punto de la red, como se ilustra en la figura 2.6. En este caso, p(r) es la densidad de electrones, p(r) dv es la probabilidad de que se encuentre un electrón dentro del elemento de volumen dv. Por supuesto, es necesrio que ip(r) dv = Z, (2.3-1) en donde Z es el número de electrones por átomo, esto es, el número atómico de los átomos de los que está compuesto el cristal. La integral anterior se toma sobre todo el espacio; aunque al hacer los cálculos se supone habitualmente que las "nubes de electrones", relacionadas con diferentes átomos del cristal, no se superponen en forN Figura 2.6. Geometría de la situación de dispersión de rayos X que se analiza en la· sección 2.3. Radiación dispersada en el ángulo ele Bragg por una densidad electrónica contenida en el elemento de volumen dv en r, que se compara con la que se dispersaría desde un ciPctrón de punto en O. Factor de dispersión atómica 39 ma apreciable, de donde, dicha nube electrónica de un solo átomo queda confmada al volumen de una celda unitaria. La diferencia de fase if>n entre la radiación dispersada en el origen y la que se dispersa en el elemento dv en r es, de acuerdo con (2.2-5) cj>, = 2n T (r • N). (2.3-2) Si la amplitud de dispersión desde el electrón del punto a lo largo de la dirección n 1 se representa mediante Aei(ks-wt), en donde k= 2n/A. y ses una coordenada de distancia a lo largo de la dirección de dispersión n 1 , entonces, la amplitud de dispersión a lo largo de tal dirección, a partir del elemento dv, será p(r)dv veces más fuerte (puesto que será proporcional a la can ti dad de carga en ese elemento) y estará fuera de fase en una cantidad dada por (2.3-2). La relación de la amplitud de la radiación que dispersa el elemento dv con la que dispersa un electrón de punto en el origen que se denominará df, será entonces dr = Aei(ks-wt)+i<i>,p(r) dv . Ae•<ks wt) J . = pfr)é2n•fA.)(r·N) dv ' · (2.3-3) Si se integra sobre todo el espacio, se encontrará la relación f de la amplitud dispersa en el átomo entero con la de un electrón de punto, en un punto reticular. De donde, 1 f= p(r)e(2ní/A.)(r·N) dv. (2.3-4) No obstante, de acuerdo con la expres1ón (2.2-4) 2n 2n 4rr T (r ·N)= T Nr cos 8' = T r sen() cos ()' = w cos ()', (2.3-5) 4rr 11 = "T sen 8. (2.3-6) en donde Si la densidad de carga del átomo es esféricamente simétrica y, por tanto, es una función exclusiva de r, p(r) = p(r) y f= f' J: J:n p(r)eiw cos 8 ' r 2 sen()' dr d()' dc/J. (2.3-7) Se pueden evaluar las partes angulares de esta integral, integrando primeramente sobre Q>, luego sobre 8' (haciendo que x = cos 8', dx =sen O' d8'), y expresando finalmente los factores exponenciales como funciones trigonométricas, lo cual da f(!l) = l oo sen 11r 4rrr 2 p(r) - - dr. o (2.3-8) Jll" Esta cantidad, es decir, la relación de la amplitud dispersada por el átomo real con la que dispersa un solo electrón sobre un punto reticular, se denomina factor de dispersión atómica. Puesto que 8 -+O, Jl-+ O y sen JlY/JlY-+ 1, de donde !Ímf(tt) = 11~o Joj 4rrr p(r) dr = fp dv = Z, 00 2 v (2.3-9) 40 Análisis cristalográfico con rayos X Los valores de p(r) deben obtenerse, evaluando, de acuerdo con la mecamca cuántica, las "funciones de onda" de los átomos del cristal. En un capítulo posterior se verá en qué consiste este proceso. En la práctica, las funciones ondulatorias de los átomos libres se utilizan muy a menudo en los cálculos del factor de dispersión, para obtener resultados aproximados para las intensidades esperadas; mientras que las funciones ondulatorias reales modificadas se emplean para los átomos, cuando éstos se encuentran en una red cristalina. 2.4 FACTOR GEOMETRICO DE LA ESTRUCTURA Hasta ahora, se ha supuesto que se trata de celdas unitarias con átomos exclusivamente en los vértices (es decir, celdas unitarias primitivas). Si se desean predecir las características de la radiación difractada desde cristales con celdas unitarias complejas, que contienen más de un átomo, como sucede en las celdas cúbicas para las estructuras cúbica centrada en el cuerpo y cúbica centrada en la cara, se debe explicar la interacción de los haces que se difractan desde los diversos átomos, dentro de la celda unitaria. Si para la reflexión (h' k'!') se representa la relación de la amplitud de radiación que dispersa toda la celda unitaria en función a la que dispersa un electrón de punto en el origen, por medio de F(h' k'!'), entonces F(h'k'l') = ¿¡;ei4>;. (2.4-1) i En este caso, [¡ es el factor atómico de dispersión para el iésimo átomo de la celda unitaria y cp¡ se relaciona con la diferencia de fase entre la radiación dispersada en el origen y la dispersada del iésimo átomo de la celda unitaria. La suma se obtiene, tomando en cuenta todos los átomos que pertenecen a la celda unitaria. La diferencia de fase cjJ¡ está dada por (2.3-2), de donde (2.4-1) se puede expresar como sigue: F(h'k'l') = ¿¡;e<2xi/.l.)(r;·N>, (2.4-2) i en donde r¡ es un vector desde el origen hasta el iésimo átomo de la celda unitaria. Si las coordenadas de posición fraccionales del iésimo átomo son (x¡, y¡, z¡), de acuerdo con lo definido en la sección 1.4, entonces, r¡ se puede expresar así: f¡ = X¡a + y¡b + Z¡C. (2.4-3) Sin embargo, de acuerdo con la ecuacwn (2.2-6), a · N= h'X, etc.; substituyendo la (2.4-3) en la (2.4-2) y utilizando este resultado, se encuentra que de donde r; ·N= A(h'x¡ +k' y¡+ l'z;), (2.4-4) F(h'k'l') = Lf¡e2xi(h'x;+k'y1 +1'z;). (2.4-5) i Factor geométrico de lo estructura 41 Cuando todos los átomos del cristal son idénticos, el resultado se puede expresar en una forma especialmente simplificada, porque, en ese caso, todas las[¡ tienen el mismo valor f Por tanto, la ecuación (2.4-5) se convierte en S= en donde F(h'k'l') = fS (2.4-6) L (2.4-7) e2ni(h'.x¡+k'y¡+l'z¡). i Por tanto, la amplitud total dispersada está dada por el producto del factor de dispersión atómica y un factor S, que está regido por la disposición geométrica de los átomos, dentro de la celda unitaria y que se conoce como el factor geométrico estructural. Para los cristales en los que no todos los átomos son idénticos, esta separación es imposible y, en tales casos, se utilizará la forma más general (2.4-5). La intensidad del haz difractado es proporcional al cuadrado de la amplitud F o, más exactamente, dado que F es compleja, al cuadrado del valor absoluto de F, que es F* F, en donde F* es el conjugado complejo de F Si F(h' k' l '), como lo expresa (2.4-5), se escribe como el número complejo a+ i{3, entonces, F* =a- i(3 y (2.4-8) en donde a:= Re(F) = L [f; cos 2n:(h'x; +k' y;+ l'z;)], (2.4-9) P = Im(F) = L [J¡sen 2n:(h'x; +k' y¡+ l'z¡)]. (2.4-10) i y i Como ejemplo, se verá el caso de un cristal cúbico centrado en el cuerpo, en el que todos los átomos son idénticos. En esta estructura, se tienen dos átomos dentro de la celda cúbica unitaria: un átomo del vértice y otro en el centro del cuerpo; se procede a asignar arbitrariamente el átomo del vértice cuyas coordenadas (x¡, y¡, z¡) son (0, O, O) a la celda unitaria y no se consideran los otros átomos de vértice; el otro átomo de la celda es el del centro del cuerpo, que pertenece exclusivamente a la celda unitaria, cuyas coordenadas son (t.t.t). Por tanto, de acuerdo con esta situación, la amplitud de difracción para la dirección de difracción (h' k' l ') es la que señalan las expresiones (2.4-6) y (2.4-7), F(h'k'l') = fL e2>ti(h'.x,+k'y,+t'••> = f[l + ein(h'+k'+t'>]. (2.4-11) i Puede pensarse que la forma en que un átomo de vértice se asignó a la celda y los otros se excluyeron, es demasiado arbitraria, por lo que se puede proponer un procedimiento más razonable, en el que i de cada átomo de vértice se asigna a la celda, dejándolos en sus respectivas ubicaciones~ Esta forma alternativa de proceder lleva exactamente a la misma expresión que la que se obtuvo en (2.4-11) para el factor de estructura geométrica. La verificación de esta afirmación quedará como tarea para el lector. En general, la asignación de los átomos que pertenecen a la celda unitaria puede hacerse en cualquier forma arbitraria, como antes se hizo, siempre que se le asigne a ésta el número correcto de átomos de cada categoría (cara, vértice, borde, interior). 42 Análisis cristalográfico con rayos X De acuerdo con (2.4-11), el factor geométrico de la estructura 1 + exp(hr(h' + k' + l ')] desaparece para cualquier reflexión (h'k'l ') para la que h' +k'+ l' sea un número impar, ya que exp(mri) = -1 cuando n es impar. Por tanto, en la estructura cúbica centrada en el cuerpo, faltan ciertas reflexiones (h'k'l '), que estarían presentes en una estructura cúbica simple, con la misma dimensión lateral del cubo. Por ejemplo, no existe una reflexión (100), aunque sí se tiene la reflexión (200); del mismo modo, no hay la reflexión (111) aunque se tiene la (222). Este efecto se puede comprender físicamente, cuando menos en el caso de la reflexión (100), observando primeramente que para una estructura cúbica simple, los haces reflejados desde las caras superior e inferior del cubo de la celda unitaria, difieren 2rr en fase para la dirección de difracción (1 00). Sin embargo, en la estructura cúbica centrada en el cuerpo que tiene la misma dimensión lateral del cubo, existe otro plano de átomos (centros de cuerpos), ubicados paralelamente y a la mitad entre los planos de las caras superior e inferior del cubo de las celdas unitarias, como put..de verse en la figura 2.7. La densidad de átomos en estos planos intermedios es la misma que la de los planos de las caras superior e inferior del cubo y, por tanto, dan origP.n a haces difractados, con la misma intensidad que los producidos por los planos superior e inferior de la celda unitaria; pero están fuera de fase con estos haces por rr radianes. Los haces difractados desde los planos superiores y los del centro del cuerpo interfieren en forma destructiva en pares, sin producir un haz difractado neto para este conjunto de condiciones. No obst?.nte, la reflexión (200) está presente, debido a que, en ese caso, los planos superior e inferior dan origen a haces que están 4rr fuera de fase. Entonces los planos de los centros de cuerpo contribuyen, con haces que difieren 2rr en fase de las reflexiones obtenidas de los planos superior e inferior, reforzándolos en lugar de cancelarlos. Las otras reflexiones faltantes para la estructura cúbica centrada en el cuerpo se pueden explicar físicamente, siguiendo la misma trayectoria de razonamiento. Los haces se refuerzan (1 00) reflexión Figura 2.7. Celda unitaria c.c.c. reflexión (200) Relaciones de fase para los ángulos de difracción (100) y (200), en una estructura cúbica centrada en el cuerpo. La red reciproca 2.5 43 LA RED RECIPROCA En este punto, conviene presentar el concepto de la red recíproca, que es una estructura reticular de puntos, que está relacionada en cierta forma con la red cristalina real. La condición de Bragg para la difracción de rayos X se puede expresar en una forma muy sencilla con la ayuda de la red recíproca y en uno de Jos vapítulos posteriores se verá que el comportamiento mecánico ondulatorio de los electrones en las redes cristalinas periódicas se entiende más fácilmente en relación con la red recíproca del cristal. Si a, b y e son los vectores primitivos de translación de una red cristalina real, los vectores primitivos de translación de la red recíproca, a*, b*, y e* se definen mediante las relaciones y a*· a= b* • b =e*· e= 1 (2.5-1) a*· b =a*· e= b* ·e= b* ·a =e*· a= e*· b =O. (2.5-2) Puesto que, de acuerdo con (2.5-2), a* • b =a* · e= O, el vector a* es perpendicular al plano determinado por b y c. En consecuencia, es paralelo al vector b x e y se puede expresar como un múltiplo de ese vector, esto es a*= A(b X e), (2.5-3) en donde A es una constante escalar. Sin embargo, de acuerdo con (2.5-1) a* ·a= A(b X e)· a= 1, (2.5-4) de donde, resolviendo para A y substituyendo el valor así obtenido en {2.5-3), a* = b X e . a· b X e (2.5-5) De igual manera, se puede demostrar que b* = e X a a· b X e * = a-X- be a· b X e Si se utiliza el mismo planteamiento general, se pueden obtener las siguientes transformaciones inversas b* X e* a = a* . b* X e*, (2.5-6) etcétera. Como ejemplo, supóngase que se desea determinar la red recíproca de una estructura cúbica centrada en la cara. Se debe principiar con la celda unitaria pri 44 Análisis cristalográfico con rayos X mitiva de la figura 1.5(a), para la cual, los vectores de base primitivos a, b y e se pueden expresar como sigue: a('lx + ., .) a= 2 (2.5-7) a(' .) e= 2. •, + •.' en donde a es el lado de la celda cúbica y en donde el eje de la coordenada x se toma a lo largo de a, el eje y va sobre b y el eje z pasa por c. Entonce~, 2 * a4 Ci.x + i.) X (i, + i.) b X e a = = a· b X e de igual modo, 1 (' . . )· = - •x + •, - •. ' 3 a ('lx + IJI . ) ' [('lx + lz . ) X ('1)1 + lz . )] S . + lz . )' b* = -1 ('lx - IJI a a • + ••. •) e * = -1 ( . + ., a -•x (2.5-8) Es evidente que esos vectores tienen las direcciones cúbicas diagonales, al igual que los vectores primitivos de la estructura cúbica centrada en el cuerpo, como se puede ver en la figura 1.5(b). Además, se debe observar que el espaciamiento reticular de la red recíproca es proporcional a 1/a. O sea, que cualquier vector r* que conecte dos puntos reticulares de la red recíproca, debe tener la forma r* =la*+ mb* + ne*, (2.5-9) en donde /, m y n son enteros; al substituir las expresiones correspondientes a a*, b*, y e* de (2.5-8) en (2.5-9), es evidente que los puntos de la red recíproca deben tener (x, y, z) coordenadas de la forma 1 (x,y,z) = - [(l + m - n), a (l- m+ n), ( -l +m+ n)], (2.5-10) en donde l, m y n pueden tomar cualquier valor entero. En la tabla 2.1 se presenta una tabulación de estos puntos reticulares posibles; los diversos casilleros de la tabla corresponden a valores específicos de l y m, esto hace que la forma de las coordenadas indicadas en cada casillero varíe sólo con n, de acuerdo con (2.5-1 0), en función de los valores correspondientes de l y m, ahí incluidos. En la tabulación que se da aquí, cualquier punto cuya coordenada x, y o z exceda de 2 (aparte del factor constante 1/a, que no se incluye en las entradas de la tabla), queda descartado por completo; por tanto, los puntos que se conservan son suficientes para describir 8 celdas unitarias de la red recíproca. Cuando se grafican estos puntos, insertando el factor constante 1/a -y se considera la forma que tienen los vectores primitivos de la red recíproca- es evidente que fa red recíproca resultante es una estructura cúbica centrada en el cuerpo, cuya dimensión lateral del cubo es 2/a. En forma similar, se puede demostrar que la red recíproca para una estructura real cúbica centrada en el cuerpo, es una red cúbica centrada en la cara. TABLA 2.1. Puntos reticulares para la red recíproca cúbica centrada en la cara (Todos los puntos son de la fonna [(/+m- n), (/-m+ n), (-1 +m+ n)]) m= -2 1= -2 1 = -1 1=0 (-n- 4, n, n) -2, -2, -2 ( -n- 3, n +- 1, n- 1) -2, O, -2 ( -n- 2, n + 2, n- 2) -2, 2, 2 (-n-2,n,n) -2, O, O -1, -1, -1 O, -2, -2 (- n - 1, n + 1, n - 1) -1,1,-1 - 2, 2, O 0,0, -2 (-n-3,n-1,n+1) m= -1 --2, -2, o ( -n- 2, n- 2, n + 2) m=O -2, -2, 2 ( -n- 1, n- 1, n + 1) -1, -1,1 -2, o, 2 O, -2,0 (- n, n - 2, n + 2) m= 1 m=2 O, -2,2 l= 1 1=2 (- n, n + 2, n - 2) O, 2, - 2 (1-n,n+ 1,n-1) 1, 1, -1 O, 2,0 2,0, -2 (2 - n, n + 2, n - 2) (2- n, n, n) (3-n,n+ 1,n-1) 0,0,2 2, -2, o 2,0,0 1, 1, 1 O, 2, 2 2,2,0 (2 - n, n - 2, n + 2) 2, -2,2 (3- n, n- 1, n + 1) 2,0,2 (-n, n, n) 0,0,0 -1, 1, 1 -2, 2, 2 1, -1,-1 2, -2, -2 (1 - n, n- 1, n + 1) 1, -1, 1 2, 2, -2 (4- n, n, n) 2, 2, 2 46 Análisis cristalográfico con rayos X Una de las propiedades de la red recíproca es que un vector r* = h'a* + k'b* +!'e* desde el origen hasta cualquier punto reticular de la red recíproca es normal al plano (hk[) de la red real. En este caso, la tríada (hkl) es, simplemente, la tríada (h'k'l') dividida por el factor común mayor, n entre (h'k't'), al igual que se hizo en la sección 2.2. En otras palabras, h'/h =k'/k= 1'/l = n. Para demostrar este resultado, se puede observar en la figura 2.8 que el vector AC es igual a - (a/h) + (e/[), y queda dentro del plano (hkl), al igual que el vector AB, que es igual a - (a/h) + (b/k). Sin embargo, utilizando las expresiones (2.5-1) y (2.5-2), h' 1' r* · [ -(a/h) +(e//)]= (h'a* + k'b* + l'e*) · [ -(a/h) + (ejl)] = - h +-¡=O, (2.5-11) puesto que h'/h = 1'/l = n, de acuerdo con (2.2-6). De igual modo, r* · [ -(a/h) + (b/k)] = (h'a* + k'b* + l'e*) · [ -(a/h) + (b/k)] = - h' k' h +k= O. (2.5-12) e a Figura 2.8. Geometría vectorial en la red directa para los cálculos de la sección 2.5. Por tanto, el vector r* es perpendicular a dos vectores linealmente independientes, AC y AB, que se encuentran dentro del plano (hkl). Luego, debe ser perpendicular al plano propiamente dicho. Del mismo modo, si n es un vector unitario normal al plano (hk[) de la red real, se puede escribir n = r*/r*, ya que se sabe que r* es un vector normal a (hkl). No obstante, si d es la distancia entre los planos adyacentes (hkl), de acuerdo con (1.5-2), debe ser verdad que a· n a· r* a· (h'a* + k'b* + /'e*) n d=-=-= -h hr* hr* - r* ' (2.5-13) por lo que la magnitud de r* está dada por r* -= n/d, (2.5-14) en donde n es un entero que se defme como se indica en la ecuación (2.2-6). La condición de Bragg 2.6 47 LA CONDICION DE BRAGG EN FUNCION DE LA RED RECIPROCA La condición de Bragg se puede expresar como una relación entre vectores en la red recíproca. En la figura 2.9, el vector AO que tiene una longitud 1/A. está trazado en la dirección del haz incidente de rayos X y termina en el origen de la red recíproca. Se observará que el origen del vector AO no debe encontrarse necesariamente en un punto reticular de la red recíproca. Se construye una esfera de radio lA alrededor del punto A, que es el centro. Supóngase ahora que esta esfera intersecta algún punto (h'k'l ') de la red recíproca en B. Por tanto, el vector OB representa al vector que conecta el origen de la red recíproca con un punto (h'k'l ') de la red; como tal, debe ser normal al plano (hkl) de la red real y también debe tener la longitud n/d, donde n es el factor común entero de mayor valor a los tres números (h'k'l '). Sin embargo, de acuerdo con las relaciones trigonométricas de la figura 2.9, la longitud de OB se puede expresar también como 2 sen 0/A.. Si se igualan estas dos expresiones para la longitud del vector OB, se tiene que n). = 2d sen e, y se satisface la condición de Bragg. En relación con la figura 2.9, también es evidente que el vector OB representa una normal a los planos de reflexión (hkl) y que el vector AB lo es en la dirección del haz difractado. Esta última proposición se entenderá con mayor claridad, si se traslada el vector AB paralelo consigo mismo, hasta que su origen descanse en el punto O, en que se verá que AO, OB y AB están en la relación familiar de la dirección del haz incidente, así como la dirección normal de dispersión y del haz de difracción. De acuerdo con esta construcción geométrica, es evidente que la condición de Bragg se satisfará para una longitud de onda dada por cada intersección de la superficie de una esfera de tadio 1/A. trazada alrededor de A, con un punto de la red recíproca. En cada caso, el ángulo apropiado de Bragg estará dado por el ángulo comprendido entre el vector AO y un plano normal a OB. Cuando la condición de Bragg se satisface en esta forma, los vectores AO y AB constituyen un triángulo isósceles con un vector OB de la red recíproca. De acuerdo con esta disposición de los vectores, como se ilustra en la Figura 2.9. Geometría vectorial de la reflexión de Bragg en la red recíproca. 48 AniÍiisis cristalográfico con rayos X figura 2.9, se puede observa~ que AB debe ser la suma vectorial de AO y OB y la geometría vectorial de la figura 2.9 permite expresar la condición de reflexión de Bragg, en un forma especialmente sencilla. Para este fin se supone que todos los vectores de la figura 2.9 se multiplican por un factor escalar constante de 27T, como se indica en la figura 2.10. Por tanto, en esta figura, el vector G es simplemente 27T veces el vector OB de la figura 2.9 y el vector k es 27T veces el vector AO de la figura 2.9. También en este caso, la disposición de los vectores es tal que el vector A 'B' de la figura 2.1 O debe ser la suma vectorial de k y G. Puesto que la magnitud de ese vector y la del vector del 8' Figura 2.10. Diagrama vectorial de la figura 2.9, ampliado de acuerdo con un factor escalar de 27T y rotulado nuevamente (la notación va de acuerdo con la utilizada por C. Kittel en /ntroduction to Solid Sta te Physics. J ohn Wiley & Sons, Nueva York (1956). haz incidente k deben ser iguales, en todos Jos casos en que se satisface la condición de Bragg, ésta debe implicar que (k + G) 2 = (k + G) • (k + G) = k 2 , (2.6-1) o bien, desarrollando el producto y simplificando, 2k · G + G2 =O, (2.6-2) en donde G es 27T veces un vector desde el origen hasta un punto reticular de la red recíproca, en donde k es un vector de magnitud 27T/A a lo largo de la dirección del haz incidente de rayos X. La ecuación (2.6-2) es la forma vectorial de la ecuación de Bragg. 4 EJERCICIOS l. l·.n un cristal cúbico se oh~erva una reflexión de primer orden (1 00) a un ángulo incidente de 18° utilizando una radiación X de longitud de onda de 1 5 A ¿Cuál es la di~tancia ~ntre lo~ planos (1 00) del cristal? 4 Esta construcción la originó Ewald (P.P. Ewald, Zeitschrift für Kristallographie 56, 129 (1921) y se denomina, a veces, construcción de Ewald. La condición de Bragg 49 2. Para el átomo de hidrógeno en su estado energético más bajo, la función de onda está dada por en donde a0 es el radio de la primera órbita de Bohr, h2j4rr2me2 = 0.53 electrónica para este tipo de átomo está dada por 1/Jfs 1/1 19 , por lo que A. La densidad e-2rJ•o p(r) = - - . 7TQ~ Si se utiliza esta función de distribución de densidad electrónica, calcule el factor de dispersión atómica para un cristal hipotético, compuesto de átomos de este tipo y grafíquela como función de p. ( = 4rr sen (} (l\). 3. Sea una estructura cúbica centrada en el cuerpo, en la que todos los átomos son idénticos. Demuestre que asignándole a la celda unitaria un octavo de cada átomo de vértice -en su ubicación respectiva de coordenada celular- y el ítomo del centro del cuerpo -en la posición central- se obtiene el mismo resultado para el factor geométrico de estructura de esta red, que derivando dicho factor de acuerdo con la ecuación (2.4-11 ). 4. Encuentre la amplitud de difracción F(h'k'l ') para la reflexión (h'k'l ') de un cristal que tiene la estructura del CsC'l, como se ilustra en la figura 1.7(b). ¿Se podría esperar una reflexión (100) en este cristal? Explique por qué. 5. Encuentre el factor geométrico de estructura para la red cúbica centrada en la cara (donde todos los átomos son idénticos). ¿Cuál de las siguientes reflexiones de rayos X habrá en un cristal de este tipo y cuál faltará en él: (100), (110), (111), (200), (220), (222), (211), (221 ), (123)? 6. Determme el factor geométrico de estructura de la red de diamante. Exprese el resultado como el producto del factor geométrico de estructura para la red cúbica centrada en la cara por otro factor. Indique cuáles de las reflexiones de rayos X mencionadas en relación con el problema 5 se encuentran en dicha estructura y cuáles faltarán en ella? Nota: asigne los átomos a una celda unitaria cúbica, de acuerdo con el diagrama de la figura 1.9. 7. Demuestre que la red recíproca de una estructura cúbica simple es otra red cúbica simple, de donde, dicha estructura es autorrecíproca. 8. Demuestre que la red recíproca de una red cúbica centrada en el cuerpo es una estructura cúbica centrada en la cara. Haga una tabla de los puntos reticulares y grafíquelos para formar un diagrama, basándose en sus resultados. LECTURAS RECOMENDADAS W. H. Bragg, An Introduction to Crystal Analysis, G. Bell & Sons, Londres (1928). W. L. Bragg,The Crystalline State, Vol. 1, G. Bell & Sons,.,.Londres (1955). R. B. Leighton, Principies o[ Modern Phys;cs, McGraw-Hill Book Company, Inc., Nueva York (1959). A. Taylor, X-Ray Metallography, John Wiley & Sons, Nueva York (1961). CAPITULO 3 Dinámica de las redes cristalinas 3.1 VIBRACIONES ELASTICAS DE MEDIOS CONTINUOS Ahora se investigarán las características del movimiento elástico vibratorio de las redes cristalinas. Se encontrará que existen diferencias importantes entre las ondas elásticas, en las estructuras reticulares compuestas de átomos discretos y las ondas que hay en los medios elásticos completamente continuos y homogéneos. Para entender estas diferencias con toda claridad, primeramente se hará un repaso breve de algunas características esenciales de las ondas elásticas en substancias elásticas homogéneas, isotrópicas y lineales. Se analizará detalladamente tan sólo el movimiento ondulatorio unidimensional, pero siempre que sea necesario se tratará de indicar cómo se pueden generalizar los resultados obtenidos para describir sistemas de dos y tres dimensiones. Sea un elemento de una substancia elástica isotrópica y homogénea, de longitud tu y el área transversal uniforme ~Y l:!.z. Cuando no hay deformaciones este elemento se extiende de x a x + ÁX a lo largo del eje x, como se ilustra en la figura 3.1, pero al aplicarle un esfuerzo, se produce una deformación elástica, la I -u+~u-1 Areo t:J.yt:J.z (l \r------t----i-1---. r-u- -u-:t:J.u--::___ - F =ce (x) !:J. y tJ. z .._-------+---+-...J 1 X Figura 3.1. F=ce(x+t:J.x)t:J.yt:J.z t:J.x-----1 x+t:J.x Desplazamiento y deformación de extensión de un elemento de volumen que originalmente se extendía de x a x + &. En la condición deformada, el elemento se extiende de x'+u a x + ~x +u+ ~u. poSictOn de equilibrio del extremo izquierdo del elemento se desplaza una distancia u a lo largo del eje x, y el extremo derecho del elemento se desplaza una distancia u + &. Si el medio elástico es lineal, el esfuerzo aplicado y la deformación resul51 52 Dinámica de las redes cristaliiUls tante se relacionan linealmente, mediante la ley de Hooke. La deformación s se define como la extensión elástica del elemento por unidad de longitud, es decir , Au ou s(x)= hm - = - , &x--+O Ax ox (3.1-1) mientras que el esfuerzo es la fuerza por unidad de área que actúa sobre el ele· mento. Por tanto, de acuerdo con la ley de Hooke, si F(x) es la fuerza total que actúa en el punto x, F(x) = cs(x)Ay Az, (3.1-2) en donde e es el módulo elástico del material. Del mismo modo, en el punto X+ _ax, F(x + Ax) = cs(x + Ax)Ay Az. (3.1-3) La fuerza total ejercida sobre el elemento se debe relacionar con la aceleración del elemento, de acuerdo con la ley de Newton, por lo que F(x + Ax) - F(x) = c[s(x + Ax) - s(x)]Ay Az = ma, (3.1-4) en donde m es la masa del elemento y a su aceleración. Desarrollando s(x + & ) como una serie de Taylor, con respecto al punto x, y descartando los términos de segundo o mayor orden en .ax, que en cualquier caso se perderían en el límite, conforme .ax -+ O, se encuentra que os e ox Ax Ay Az = ma. (3.1-5) Sin embargo, la masa del elemento es su intensidad p por el volumen .ax Lly &, la aceleración es a2 ujat 2 , y la deformación, de acuerdo con la definición {3.1-1) es au;ax. Al efectuar estas substituciones, (3.1-5) se convierte en ou 2 p o2 u ox 2 = ~ ot 2 • (3.1-6) Esta es la ecuación de onda para la amplitud de ondas elásticas en un medio lineal homogéneo, en función de x y t, en donde la deformación elástica se limita a la dirección x. Las soluciones a esta ecuación se pueden escribir en la forma u(x,t) = Aei<wr-znxt.l.l = Aei<wr-kx>, (3.1-7) k= 2nfA. (3.1-8) en donde, La solución (3.1-7) representa una perturbación sinusoidal de frecuencia w y longitud de onda X, que se propaga a lo largo del eje x positivo. Por lo general, es más conveniente expresar los resultados de un cálculo relativo a las vibraciones armónicas, en términos de la constante de propagación k, que en función de X propiamente Velocidad de grupo de trenes de ondas armónicas 53 dicha. La dirección de propagación de la onda se invierte, cambiando el signo de k. Si la solución (3.1-7) se diferencia y se substituye de nuevo en la ecuación ondulatoria (3.1-6), se verá que, para satisfacer (3.1-6), w y k deben relacionarse mediante ro= kJcfp. (3.1-9) La velocidad de fase de una onda es la razón de avance de un punto de fase constante a lo largo de la dirección de propagación de la onda. Para determinar la velocidad de fase, se puede examinar el movimiento de un punto de fase constante y, para mayor facilidad, se utilizará un punto de fase cero. Puesto que el ángulo de fase es wt- kx, de acuerdo con (3.1-7), la ecuación de movimiento del punto de fase cero es, rot- kx =O o bien, (3.1-10) Como se puede ver, el punto de fase avanza a una velocidad constante de fase igual a w/k. De acuerdo con la ecuación (3.1-9), la velocidad de fase para estas ondas se puede expresar como vP vP = wfk = Jcfp, (3.1-11) de donde, es evidente que la ecuación de onda (3.1-6) se puede escribir como sigue (3.1-12) Para este caso en particular, la velocidad de fase es independiente de la frecuencia y la longitud de onda, y sólo depende de las constantes físicas e y p, relacionadas con el medio elástico. 3.2 VELOCIDAD DE GRUPO DE TRENES DE ONDAS ARMONICAS Ahora se investigará lo que sucede cuando se superponen dos trenes de ondas, uno de frecuencia w y constante de propagación k el otro con una frecuencia ligeramente distinta, w + dw y constante de propagación k+ dk. Para mayor facilidad, se supondrá que las amplitudes máxima de los dos trenes de ondas son idénticas, en cuyo caso, ambas amplitudes se expresan como sigúe: u 1 =A cos (wt- kx) u 2 =A cos [(ro+ dro)t- (k+ dk)x]. (3.2-1) La amplitud de la superposición es, entonces, u 1 + u 2 = A[cos (rot- kx) + cos [(ro+ dro)t- (k+ dk)x]] = A[cos a+ cos p]. (3.2-2) 54 Dinámica de los redes cristalinas Sin embargo, tomando como base la trigonometría elemental, cos ex+ cos p = 2 cos t(ex - p)cos !(ex + p), (3.2-3) y, de acuerdo con (3.2-2), se tiene que ex+ P= 2rot - 2kx + tdro- xdk ~ 2(rot - kx), (3.2-4) y ex - p = xdk - tdro. (3.2-5) En (3.2-4), los términos diferenciales tdw y xdk se pueden hacer a un lado, teniendo en cuenta que son pequeños, en comparación con los otros términos; en (3.2-5) no hay términos "grandes" y los términos diferenciales son importantes. Al substituir (3.2-4) y (3.2-5) en (3.2-2), se tiene que u 1 + u 2 = 2A cos (rot- kx) cos (tx dk- !t dro). (3.2-6) Esta superposición representa una onda caracterizada por los valores originales de w y k, multiplicados por una envolvente sinusoidal con una longitud de onda mucho más larga, 21T/dk, denominada "envolvente de pulsaciones", como se ilustra en la figura 3.2. Se puede examinar el movimiento de esta envolvente y, sobre todo, 2,. k Figura 3.2. Tren de ondas formado al superponer dos ondas sinusoidales cuyas frecuencias son w y w +dw y con constantes de propagación de k y k +dk. la velocidad de fase de la envolvente (correspondiente a la velocidad de los grupos o "pulsaciones", a lo largo de la dirección de propagación) determinada mediante el mismo procedimiento que se utilizó para una onda armónica simple, en la sección 3.1. La ecuación del movimiento del punto de fase cero de la envolvente es x dk - t dw = O, o bien, dw x=-t=vt dk g o (3.2-7) Por tanto, se ve que la envolvente o los grupos de ondas se desplazan con una velocidad dw/dk; que se denomina velocidad de grupo, v.rr, asociada con las ondas. Se puede demostrar que la velocidad con que la onda transmite energía a lo largo de la dirección de propagación es idéntica a esa velocidad de grupo. 1 Como puede 1 L. Brillouin, Wave l'ropa!!;ation in Perwdic Structures, Dover Publications, lnc., Nueva York (1953) Movimiento ondulatorio en redes atómicas unidimensionales SS verse, esto es lógico desde el punto de vista físico, por ejemplo, en el tren de ondas de la figura 3.2, no puede fluir energía más allá de un nodo, ya que el medio en el punto nodal está totalmente inmóvil. Por consiguiente, la energía se debe transmitir a la velocidad a la que se mueven los nodos, es decir, a la velocidad de grupo. En el caso de una onda estacionaria, la velocidad de grupo es cero y es evidente que no puede haber un flujo neto de energía. Para las ondas elásticas en un medio homogéneo, que se estudiaron en la sección 3.1, la velocidad de fase y la de grupo son iguales, de acuerdo con la ecuación (3.1-9). Esto es cierto debido a que w es una función lineal de k, de donde, w/k y dw/dk son iguales. El mismo resultado se aplica también a las ondas electromagnéticas en vacío, dado que también en este caso, la velocidad es una constante independiente de la frecuencia y la longitud de onda. La velocidad de fase y la velocidad de grupo sólo pueden diferir cuando la primera w/k es una función de la frecuencia w, y por tanto, cuando la misma w no es una función lineal de k. Por ejemplo, esta situación se presenta cuando hay una luz que pasa por un medio en el que el índice de refracción (y, por ende, la velocidad de fase) es una función de la frecuencia; el fenómeno se conoce como dispersión y dicho medio se denomina medio dispersivo o de dispersión. Como ¡,~ verá en breve, también sucede en el caso de ondas elásticas, en un medio compuesto de átomos discretos enlazados por las fuerzas de la ley de Hooke, sobre todo cuando las longitudes de onda de que se trata no son mucho mayores que las distancias interatómicas. 3.3 MOVIMIENTO ONDULATORIO EN REDES ATOMICAS UNIDIMENSIONALES Ahora se examinará el movimiento vibratorio longitudinal de una cadena unidimensional de átomos idénticos de masa m, que están unidos entre sí mediante fuerzas lineales, como se indica en la figura 3.3. En estado de equilibrio, los átomos estarán situados en puntos de equilibrio igualmente espaciados; pero en estado de excitación producido por el movimiento vibratorio, los átomos realizan movimientos periódicos alrededor de estas posiciones de equilibrio, en este caso, la amplitud Un representa el desplazamiento real del nésimo átomo, desde su posición de equilibrio. n-2 En reposo: ~a Vibrando ~ + ~t Un-1 Figura 3.3. n n-1 a n+l + ~t un a + n+2 a----4 ~ t t Un+ 1 Geúmetría de la red lineal monoatómica de la sección 3.3. Se supone que las fuerzas entre los átomos circunvecinos son las de la ley de Hooke, y que los átomos se comportan como si estuviesen unidos por medio de resortes ideales, suponiéndose también que las únicas interacciones de fuerzas significativas, son las que se ejercen directamente entre los átomos más cercanos. De donde la influencia directa de los átomos n + 2, N+ 3, n + 4 ... sobre el átomo n 56 Dinámica de las redes cristalinos se considera despreciable, aunque el comportamiento del átomo n + 2, por ejemplo, puede influir indirectamente en el átomo n en el sentido de que afecta directamente al átomo n + 1 que, a su vez, actúa sobre n. De acuerdo con estas suposiciones, la fuerza neta que actúa sobre el nésimo átomo se puede expresar en términos de la extensión de dos "resortes" que lo unen a los átomos n + 1 y n - l. Así: = {3(u.+ 1 + !1 11 _ 1 - 2u,). (3.3-1) en donde (3 es la constante de la ley de Hooke, que expresa la proporcionalidad existente entre la fuerza requerida para producir un desplazamiento atómico y el desplazamiento propiamente dicho. De acuerdo con la segunda ley de Newton, esta fuerza se puede expresar como el producto de masa m del nésimo átomo por su aceleración, de donde, se obtiene la ecuación del movimiento (3.3-2) Se buscan soluciones periódicas a esta ecuación y se puede esperar que tengan la forma (3.3-3) en analogía con (3.1-7). Sin embargo, en la expresión (3.3-3) se debe representar el coeficiente de k del exponente como la coordenada x ael nésimo átomo de la cadena, es decir, na. De acuerdo con esto. se puede esperar que un+l = Aei[wt-k(ll+l)aJ Un-l = Aei[wt-k(n-l)•J. y (3.3-4) Si la solución (3.3-3) se diferencia dos veces con respecto al tiempo y, junto con la (3.3-4) se substituye de nuevo en la ecuación de movimiento (3.3-2), el resultado es = 2{3(cos ka - 1). (3.3-5) 1 -cosO= 2 sen~ !0, (3.3-6) Sin embargo, dado que esto se puede expresar en la forma 01 = ,./4fJ/m lsen-!kal. (3.3-7) Movimiento ondulatorio en redes atómicas unidimensionales 51 Los signos de valor absoluto se requieren en (3.3-7), por la única razón de que la frecuencia se debe considerar como una cantidad esencialmente positiva, sin importar de que k sea positiva o negativa, es decir, sin importar que la onda se propague hacia la derecha o la izquierda, a lo largo de la cadena. En consecuencia, se observa que existen soluciones de la forma (3.3-3), a condición de que w se relacione con k, mediante (3.3-7). Es obvio que, en este caso, w no es una función lineal de k, de modo que aquí se trata un medio de dispersión; una relación del tipo de (3.3-7) que presenta a w en función de k, se conoce como relación de dispersión. En la figura 3.4 se muestra una gráfica de w en función de k, como se da en (3.3-7). De acuerdo con esto (y (3.3-7)), se observará que, si se restringen los valores de k, mucho menores que rrja, y, por ende, a valores de "A que son mucho mayores que el doble de la distancia interatómica a, w es aproximadamente lineal, con k, ya que, en ese caso, sen-!- ka~-!- ka y (3.3-8) En este límite de longitud de onda larga, la velocidad de fase será esencialmente constante, ya que vP = wfk = aJ{3/m = v0. (3.3-9) En este mismo límite, la velocidad de grupo es (3.3-10) y, por tanto, constante e igual a la velocidad de fase en esas condiciones. En consecuencia, para longitudes de onda muy largas, los efectos de dispersión son desechables y el medio se comporta como si fuera elástico, continuo y homogéneo. Por supuesto, esto es plausible desde un punto de vista físico, ya que, para este tipo de longitudes de onda largas, la naturaleza "atómica" de la cadena tiene poca importancia en lo que respecta al comportamiento dinámico del sistema. No obstante, al aumentar k, los efectos de dispersión se hacen cada vez más importantes y w deja w(k) _,------------~------------r--k -7T o Figura 3.4. o 1T o Relación de dispersión de red lineal monoatómica de la sección 3.3. 58 Dinámica de las redes cristalinas de variar en forma lineal, en función de k. En estas circunstancias, se observa que, de acuerdo con (3.3-7), vP = wfk = v0 !ka lsentkal (3.3-11) y v9 = dwfdk = v0 leos tkal, (3.3-12) en donde v0 =a .Jlflm es el límite de longitud de onda larga, tanto de vP como de vg, como lo demuestran (3.3-9) y (3.3-1 0). En las figuras 3.5 y 3.6 se presentan las gráficas de vp y Vg, como funciones de k. En la figura 3.6 se observa que vg-+ O conforme k-+ rr/a y, por tanto, conforme A-+ 2a; en este caso, la fase de vibración de los átomos adyacentes difiere en rr radianes y la naturaleza del movimiento es sencillamente una onda estacionaria. Esta condición corresponde también a la reflexión de Bragg de las vibraciones elásticas de átomos sucesivos del cristal; para esta geometría, el ángulo 8 de Bragg de la ecuación de Bragg (2.1-1) es rr /2 correspondiendo a la incidencia normal, en cuyo caso, la ecuación de Bragg se reduce a A = 2d para el primer orden de reflexión. La naturaleza física real del movimiento se ilustra en la figura 3.7, para el caso de una longitud de onda larga y para la condición A = 2a, en la que se establecen las ondas estacionarias. En estas figuras, los desplazamientos atómicos se representan como movimientos transversales, para facilitar la ilustración, aunque, por supuesto, los movimientos atómicos reales que se analizan aquí son de tipo longitudinal, en el que Vp -6,. o - o -2,. o -., o o .,. 2rr a o -4rr o -6a... Figura 3.5. Velocidad de fase en función de la constante de propagación k, correspondiente a la red lineal monoatómica. [Tomado, con permiso, de Wave Propagation in Periodic Structures, McGraw-Hill (1946). J Figura 3.6. Vcloddad de grupo como una función de la constante de propagación k para la red lineal monoatórnica. Movimiento ondulatorio en redes atómicas unidimensionales ~j Figura 3.7. 59 i j ¡---¡-_,__ Desplazamientos atómicos en la red monoatómica lineal (a) para una longitud de onda mucho mayor que el espaciamiento interatómico, (b) en el límite en donde 'A= 2a. Para mayor claridad, los desplazamientos se representan como transversales, pero se debe tener presente que los desplazamientos reales estudiados en este texto son longitudinales. [De acuerdo con Brillouin.] los desplazamientos atómicos reales se efectúan a lo largo de la cadena y no en sentido normal a ésta. Como se ilustra en la figura 3.8, para cualquier valor de k en la región - rr/a <k< rr/a, se tendrá un movimiento vibratorio comprendiendo ciertos desplazamientos atómicos posibles. Sin embargo, como se indica también en dicha figura, el mismo conjunto de desplazamientos de átomos que hay en esta onda, se puede asociar asimismo con una onda de k mayor (y por ende, de una menor 'A), e incluso Figura 3.8. Un solo grupo de desplazamientos atómicos representados por varias ondas sinusoidales de diferentes longitudes de onda. [Tomado de Brillouin, Wave Propagation in Periodic Structures, McGraw-Hill, Nueva York, (1946).] con otra de k aún mayor. En otras palabras, pueden existir muchas representaciones del mismo patrón de desplazamiento átomico en el que se incluya un valor distinto de k y, en consecuencia, un valor diferente de 'A. Se puede demostrar que estas representaciones disímbolas están asociadas con diferentes periodos de la gráfica de w en función de k. Cada una de las representaciones posibles debe tener el mismo valor de w por lo que, en una gráfica de w en función de k, en la que aparezcan varios periodos de la curva, como sucede en la figura 3.9, puede haber muchos valores de k que correspondan al mismo valor de w. En la región central, que se extiende desde - rr/a hasta rr/a, se tiene sólo dos posibilidades, una onda que se propaga hacia la derecha, con la constante de propagación k 1 y otra que se desplaza hacia la izquierda, con una constan te de propagación k_ 1 = - k 1 • Las regiones marcadas en esta figura con los números 2 y 2', que con tienen otras dos soluciones posibles, k 2 y k_ 2 = - k 2 , se pueden superponer en la región central, desplazando la región 2 hacia la izquierda una distancia 2rr/a y moviendo la región 2' una distancia 2rr/a. El carácter de las soluciones posibles en la región 2 es el mismo que 60 Dinámica de las redes cristalinos "' Figura 3.9. Varios periodos de la relación de dispersión para una red lineal monoatómica. Se observará que muchos valores de k se pueden asociar con cualquier frecuencia dada dentro del rango permitido. el de las soluciones posibles de la región 1' excepto por una diferencia en los valores k de 2rr/a; lo mismo puede afirmarse de las regiones 2' y l. Del mismo modo, las regiones 3 y 3', que contienen dos soluciones posibles para las que k = k 3 y k = k_ 3 = - k 3 , se pueden superponer sobre la región central - rr/a <k< rr/a, desplazando la región 3 hacia la izquierda una distancia 4rr/a y la 3', a la derecha, una distancia 4rr/a; la naturaleza física de las soluciones en esta región coincide, por tanto, con la de la región central, excepción hecha de las diferencias de los valores k de 4rr/a. Se pueden observar relaciones similares en zonas superiores. El hecho físico importante es que cualquier arreglo posible de posiciones atómicas, que sea compatible con una solución sinusoidal de cualquier longitud de onda, por más pequeña que sea, se puede representar o reducirse a una solución sinusoidal para la que - rr/a <k< rr/a. y que, por ende, pertenece a la zona central. Por consiguiente en este caso, no es necesario considerar las vibraciones que no pertenezcan a la zona central -rr/a <k< rr/a. Esta región central (1 y 1' de la figura 3.9) se denomina primera zona de Brillouin; las regiones 2 y 2', y 3 y 3', etc., para las que el carácter físico de las soluciones es el mismo que el de la primera zona, exceptuando la traslación que se hace a lo largo del eje k, en una distancia igual a un múltiplo entero de 2rr/a, se citan como la segunda, tercera, etc., zonas de Brillouin, respectivamente. Más adelante, se representará la ocasión de utilizar el concepto de las zonas de Brillouin, en relación con el comportamiento de la mecánica cuántica de los electrones en las estructuras reticulares periódicas. 2 También se debe determinar cuántos modos nonnales posibles de vibración (en otras palabras, cuántas soluciones independientes de la ecuación de onda que satisfagan un conjunto de condiciones de frontera) se pueden asociar con una cadena lineal de átomos. Por ejemplo, supongamos que se tiene una cadena rígidamente fija en ambos extremos. Si dicha cadena, que tiene una longitud L, fuera un medio homogéneo y continuo, cualquier vibración de la forma u(x,t) = A sen knx sen wt (3.3-13) kn = nrr.JL, (3.3-14) con en donde, n es un entero, satisfaría las condiciones de frontera de que el desplazamiento u en ambos extremos de la cadena en x =O y x = L, debe ser cero y, por 2 Debe hacerse notar que las velocidades de fase de ondas equivalentes en diferentes Zonas de Brillouin son distintas; pero este hecho no tiene un efecto físico directo. Movimiento ondulatorio en redes atómicas unidimensionales 61 ~ , Figura 3.10. n =4 Conjunto de desplazamientos sinusoidales de una cuerda con vibración transversal, que satisfacen la condición de frontera de que el desplazamiento desaparece en ambos extremos. Estas diversas configuraciones sinusoidales se pueden considerar como modos normales para el sistema en esta condición particular de frontera. tanto, se calificaría como modo normal de vibración del sistema. Esta situación se ilustra en la figura 3.1 O. Sin embargo, si la cadena se compone de átomos discretos, el valor máximo de k está dado por rrja, y corresponde a un valor mínimo de la longitud de onda de 2a, como se puede ver en la figura 3. 7(b ). Cualquier valor grande de k o cualquier valor pequeño de A. corresponde simplemente a una repeti· ción de cierta configuración que se puede describir mediante un valor de k dentro de la zona central. De acuerdo con (3.3-4), los valores posibles de k para un sistema de ese tipo son, k= rr/L, 2rr/L, 3rr/L, • • • rrja. No obstante, si hay N átomos en una cadena de longitud L, cada uno de los cuales está separado de su vecino por una distancia a, entonces, a= L/(N- 1) y, por tanto los valores permitidos de k para vibraciones normales de esta índole es k = rr/L, 2rr/L, 3rr/L • • • (N - 1)rr/L, dando un total de N- 1 modos. Sin embargo, para k= (N- l)rr/L, (A.= 2a) se debe excluir en este caso, dado que no se puede excitar a menos que se muevan los átomos del extremo, lo cual está prohibido por las condiciones de frontera. El número de modos reales de vibración, en estas condiciones de frontera, es, por tanto N- 2, o sea, el número de átomos de la cadena menos dos. Por supuesto, si N es un número muy grande, no importa si el número de modos normales se considera como N- 2 o, simplemente, como N. Conviene hacer notar que las condiciones físicas de frontera que se imponen al sistema son las que limitan los valores posibles de k a cierto número finito de valores, tomados del continuo de valores posibles entre - rr/a y rrja que permiten las soluciones de las ecuaciones diferenciales de movimiento del sistema. Como lo demuestra la exposición anterior, cuando los extremos de la cadena se mantienen rígidamente fijos, se seleciona un conjunto de N- 2 valores posibles de k, correspondientes a las soluciones que satisfacen esas condiciones de frontera, de entre este grupo infinito de valores posibles. Sin embargo, en cualquier problema real se deben seleccionar ciertas condiciones de frontera en las ondas elásticas y, en lo que respecta al número de modos normales posibles, se encuentra que no importa mucho cuál de los conjuntos de condiciones se escoja, siempre que sea físicamente aceptable. En cada caso, se tendrán básicamente N modos normales posibles de vibración, que satisfagan las condiciones de frontera que se hayan seleccionado, a condición de que el número de átomos N sea mucho mayor que la unidad. Se encuentra que este resultado se aplica también en sistemas bidimensionales y tridimensionales. En muchos casos, será útil seleccionar como condición de frontera, el requisito de que la amplitud de vibración del Nésimo átomo sea precisamente la misma que la del primer átomo. Desde el punto de vista físico, esto correspondería a una cadena lineal, que se dobla para obtener la forma de un anillo, en el que el Nésimo átomo se une al primero para cerrar la cadena. Las condiciones de frontera de esta naturaleza se conocen con el nombre de frontera periódica; la aplicación de estas condiciones a las soluciones (3.3-3) de las ecuaciones de movimiento, producirá el mismo 62 Dinámica de redes cristalinos resultado, a saber: que pueden existir esencialmente N soluciones de las ecuaciones de movimiento, que satisfagan también las condiciones de frontera periódicas. Más adelante, la demostración de este resultado se le asignará al lector como tarea y ejercicio. 3.4 ESTRUCTURAS DIATOMICAS UNIDIMENSIONALES Hasta ahora el examen de las propiedades dinámicas de las redes cristalinas se ha concretado al caso en que todos los átomos de la red son idénticos. Puesto que muchos cristales comunes son compuestos diatómicos, que contienen átomos de dos especies químicas diferentes y, dado que las característic~s dinámicas de sus estructuras difieren en varias formas importantes de los cristales monoatómicos, conviene proceder al de las vibraciones elásticas en cristales de este tipo. Sea una red en la que los átomos de dos especies están dispuestos en forma alternada y cada átomo está separado de los dos átomos adyacentes por una distancia a, como se muestra en la figura 3.11. La masa del átomo ligero se representa mediante m, y la del átomo pesado es M. También aquí se aplicarán las suposiciones de la sección 3.3 en relación con las fuerzas de la ley de Hooke y sólo se tomarán en cuenta las interacciones entre los átomos adyacentes. Aquí se hace necesario escribir ecuaciones independientes para el átomo ligero y el pesado; lo cual se hace siguiendo una analogía exacta del procedimiento de la sección 3.3, teniendo como resultado (3.4-1) También ahora se deben buscar soluciones de la forma (const.)ei(wt-kx), representando la coordenada x del átomo, de acuerdo con su posición a lo largo de la cadena, como en (3.3-3) y (3.3-4). m m M ~o-i-o~ ---- 2 n-2 Figura 3.11. M • o m M • o m M 2n-l 2n 2n+l 2n+2 2n+3 --- • m o M • Geometría de la red diatómica lineal de la sección 3.4. Puesto que Jos dos tipos de átomos tienen masas distintas, por lo normal, sus respectivas amplitudes de vibración, también, serían diferentes. Además, en este punto, no se puede f>aber que sus frecuencias son iguales -aunque, como se verá Estructuras diatómicas unidimensionales 63 más adelante, esto es lo que sucede en este caso en particular. Por tanto, se suponen soluciones de la fórmula y (3.4-2) Si u 2 n y u2n+i están dadas por estas expresiones, de acuerdo con la regla de que el coeficiente de k en el exponente debe representar la coordenada x del átomo en cuestión, también debe ser cierto que (3.4-3) Si las soluciones (3.4-2) se diferencian dos veces con respecto al tiempo y se substituyen de nuevo en las ecuaciones de movimiento (3.4-1), utilizando (3.4-3) para expresar todos los desplazamientos en términos de u 2 n y u 2 n+i, se tiene que (3.4-4) Al resolver la segunda de estas ecuaciones para u 2 n+i, se observa que p(l + e-2ika> U2n+ 1 = 2 p _ Mw~ U2n· (3.4-5) Las ecuaciones de movimiento requieren que esta relación se satisfaga para todos los valores de tiempo. No obstante, si los valores de u 2 n y u 2 n+l tal y como los da (3.4-2), se substituyen en (3.4-5), es evidente que este requisito se puede satisfacer para todos los valores de t, sólo cuando w 1 y w 2 son iguales. De acuerdo con esto, tomando (3.4-6) y substituyendo (3.4-5) en la primera de las ecuaciones (3.4-4), expresando los exponenciales de acuerdo con las funciones trigonométricas y simplificando, es evidente que (3.4-7) Al reacomodar esta ecuación y reunir las potencias de w, se tiene, por último, 4 w - 2P(m +M) 2 4P 2 sen 2 ka mM w + mM = O. (3.4-8) 64 Dinámica de redes cristalinos Esta ecuación cuadrática en w 2 se puede resolver fácilmente mediante la fórmula cuadrática a fin de obtener dos soluciones para w 2 , que se designarán como w~ y w~, según se escoja el signo + o el - en la fórmula cuadrática. El resultado es 2 _ c.o± - P(m + M) [ 1± mM J_ 1 4mM sen2 ka] ( m+ M)2 . (3.4-9) w(k) l /2~/M 1 1 1 -4--------------~--------------~k l-..!:. 2o Figura 3.12. o 1 ;o Relación de dispersión correspondiente a la red diatómica lineal, donde se muestran las ramas Óptica y acústica. En la figura 3.12 se muestra una gráfica de este resultado. En donde se pueden ver dos ramas de la curva w en función de k, una para el caso en que se tome el signo + y la otra, el signo -, en (3.4-9). La rama superior, w+(k), se conoce con el nombre de óptica, en tanto que la inferior, w_(k), se denomina la rama acústica. La importancia de esta terminología se aclarará más detalladamente a su debido tiempo. Para valores pequeños de k, sen ka:::: ka, y las dos raíces se convierten en (3.4-10) y w_(k)=ka J 2p -m+M (ka ~ ;r/2). (3.4-11) Para obtener la expresión (3.4-11) se debe escribir la raíz cuadrada de (3.4-9) en forma de una expansión binomial para valores pequeños del argumento. La longitud de onda más pequeña posible de la primera zona de Brillouin es dos veces la distancia de la celda unitaria de la red que, en este caso, es 2a. Esto proporciona una longitud de onda mínima de 4a, correspondiente a un valor máximo de k de Tr/2a en la frontera de la primera zona. Para este valor de k (3.4-9) da Región de frecuencia prohibida 65 (3.4-12) y w_ = )l/3/M. Las características físicas del movimiento se pueden entender mejor, observando lo que sucede cuando k~ O. En este caso, para obtener la relación de la amplitud B/A la expresión (3.4-5) es la más conveniente, siendo el resultado 2{3 !~~~=A= 2{3- Mw~ , U2n+ 1 B (3.4-13) Para la rama acústica, w = w_, como se indica en (3.4-11) y conforme de donde B/A = l. En consecuencia, para el modo acústico de vibración, los dos tipos de átomos se mueven en la misma dirección, con igual amplitud, como se muestra en la figura 3.13(a). k~ O, w_ ~O, (a) Rama acústica (b) Rama óptica Figura 3.13. Desplazamientos físicos asociados con vibraciones de longitud de onda larga propios de (a) la rama acústica y (b) la rama Óptica. Para 1~ rama óptica, w = w+ en (3.4-13) y utilizando (3.4-10) se ve claramente que, en este caso, B/A = - m/M. Por tanto, para la rama óptica en k= O, las vibraciones de los átomos tienen direcciones opuestas y las amplitudes, una relación inversa con las masas, de manera que el centro de la masa de la celda unitaria permanece fijo durante el periodo de movimiento, como se observa en la figura 3.13(b). Por lo general, esas características son típicas de las ramas óptica y acústica. Las vibraciones de modo óptico en cristales iónicos, donde dos tipos de átomos tienen cargas opuestas, se pueden excitar mediante un campo eléctrico que tiende a hacer que los iones se muevan en diiecciones contrarias. Sobre todo en las substancias iónicas, este modo se puede excitar mediante un campo eléctrico asociado con una onda lumínica, debido a lo cual se usa el término de vibraciones de modo óptico. 3.5 REGION DE FRECUENCIA PROHIBIDA De acuerdo con la mencionada figura 3.1 '2, existe una banda de frecuencias 2(3/M < w 2 < 2(3/m en la que no hay soluciones de la forma (3 4-2). Pues sucede que las frecuencias de este rango simplemente. no pueden propagarse como vibraciones armónicas continuas no amortiguadas de la red. Si se intenta excitar vibraciones de una frecuencia que queda dentro de esta banda. las vihmciones ~on at<'lllltlllas o 66 Dinámica de redes cristalinas amortiguadas por la propia red, dependiendo el coeficiente de atenuación de la frecuencia, las masas atómicas y la constante de fuerza. Para ver esto con mayor claridad, la ecuación (3.4-7) se puede escribir en la siguiente forma (3.5-1) Puesto que en la regwn 2(3/M < w 2 < 2(3/m, el primer factor en la parte superior de la ecuación de (3.5-1) es positivo y negativo el segundo, es evidente que cos ka debe ser imaginario en esta región de frecuencias, por lo que ka debe ser un número complejo. Si la raíz cuadrada se escribe en la segunda forma que se indica arriba, cos ka se expresa como una cantidad imaginaria if>, en donde 6 es un número real dentro del rango de frecuencias de interés. El coseno de un número complejo se puede expresar como la suma de partes reales o imaginarias mediante un simple cálculo, utilizando el teorema de Euler como sigue: COS Z = COS (x + iy) = COS X COSh y- Í sen XSenh y. (3.5-2) Si esto se iguala a if>, como lo requiere (3.5-1), y se igualan las partes reales e imaginarias de la ecuación resultante, se obtiene cos x cosh y = O, (3.5-3) sen x senh y= -~. (3.5-4) En (3.5-3), coshy no es nunca cero para cualquier valor de y, de donde cos x = O y x = ± rr/2, por tanto, sen x = ± l. Al substituir este valor en (3.5-4), es obvio que y = :¡: senh- 1 ~. (3.5-5) en donde, 7l z = ka = x + i y = ± l + i senh- e) 1 (3.5-b) y las soluciones de la ecuación de onda (3.4-2) se convierten en (3.5-7) Estas son oscilaciones atenuadas o amortiguadas; el signo menos del exponente se debe seleccionar para los casos físicamente reales de-ondas amortiguadas (el signo m:ís representa ondas crecientes cuya amplitud aumenta exponencialmente a lo largo Excitación óptica de vibraciones reticulares en cristales iónicos 67 de la cadena). La constante de atenuación K, definida al escribir la solución (3.5-7) como (3.5-8) está dada por 1 K = - senh - l ó, a (3.5-9) en donde o, a su vez, está dada por (3.5-1). Esta misma situación general predomina para valores de w que exceden w+(O), según han sido dados por (3.4-1 0), y también en el caso de la cadena monoatómica para valores de w que se sobrepasen de y4[3/m; en cada caso se encuentra que la red cristalina no puede propagar frecuencias en estos rangos y que la red misma debe amortiguar o atenuar cualquier perturbación de esta índole. Hasta ahora sólo se han visto ondas longitudinales en redes unidimensionales; sin embargo, también se pueden excitar vibracwnes transversales en las que los desplazamientos atómicos son perpendiculares a la cadena y no a lo largo de ella. Las características de estas ondas transversales son, en general, muy similares a las de las ondas longitudinales; el fenómeno de dispersión, los modos de vibración acústico y óptico para las estructuras diatómicas y las bandas de frecuencias prohibidas, se producen más o menos en la misma forma que en las ondas longitudinales. Puesto que las ondas transversales implican desplazamientos atómicos normales a los que tienen lugar en las vibraciones longitudinales, las ondas transversales y longitudinales se pueden excitar en forma simultánea (como primera aproximación) e independientemente entre sí. De igual manera, puesto que existen dos direcciones posibles de desplazamiento ortogonal e independiente para las ondas transversales, se pueden excitar de un modo simultáneo dos oscilaciones transversales independientes. 3.6 EXCITACION OPTICA DE VIBRACIONES RETICULARES EN CRISTALES IONICOS En un cristal iónico, por ejemplo, el de NaCl, los átomos de sodio y cloro están ionizados; el átomo de sodio lleva una carga e y el de cloro una carga -e. En estos cristales, el vector eléctrico de una onda lumínica puede excitar vibraciones de un modo óptico, ya que un campo eléctrico ejerce fuerza sobre las cargas positiva y negativa que tienen direcciones opuestas. En esta exposición, se supondrá que se trata de redes diatómicas lineales de átomos de cargas opuestas que se extienden a lo largo de la dirección x y que la luz incide perpendicularmente a la cadena atómica, de tal modo que el vector eléctrico de la onda oscila a lo largo del eje x. En estas condiciones, en cualquier instante dado, todos los átomos del cristal están sometidos al mismo campo eléctrico, y sobre los iones adyacentes, positivos y negativos, se ejercen fuerzas exactamente iguales, pero opuestas. El efecto que produce un campo de excitación de esta naturaleza consistirá en establecer vibraciones longitudinales forzadas en la red cristalina, a la frecuencia de la fuente de excitación, es decir, la onda de luz incidente. Puesto que el campo eléctrico es idéntico en todas las partes de la red, en un momento dado, el tipo de vibración que se excitará será el de la figura 3.13(b), o sea, una vibración óptica de una longitud de onda infinitamente larga, en la que k = O. 68 Dinámica de redes cristalinas En presencia de este tipo de campos, la fuerza ejercida sobre un ion positivo es eE0 eíwot y en el ion negativo, -eE0 eiwot, en donde w 0 es la frecuencia de la luz y E 0 es la magnitud del vector eléctrico de la onda de luz. De acuerdo con esto, se debe agregar un término de fuerza eE0 eiwot al lado derecho de la primera ecuación de movimiento (3.4-1) y el término - eE0 eiwot al segundo. Si ahora se suponen soluciones de la forma u 2n+ 1 = Bei(coor-[2n+ 1JkaJ (3.6-1) Las vibraciones que se han supuesto a la frecuencia de fuerza y, si se repiten los pasos que llevan a las ecuaciones (3.4-4), se obtiene - mw~u2n = p[(l + éika)u2n+ 1 - 2u2nJ + eE 0 eiwot 2 R[(l +e - 2ika) U2n- 2U2n+1 J -eE oeiwot· - M WoU2n+1=P (3.6-2) Puesto que desde el punto de vista físico la vibración óptica que se excita por medio de la onda de luz es tal que k= O, el conjunto de ecuaciones anteriores se reduce a (2P- mw~)u 2 n- 2Pu2n+1 = eEoeiwor -2Pu2n + (2P- Mw~)u2n+1 = -eEoeiwor. (3.6-3) Este grupo de ecuaciones simultáneas se puede resolver para las amplitudes de vibración u 2 n y u 2 n+l, y el resultado es - (- eEo/m) iwor U2n- Wo2 w+2(0)e (3.6-4) _ (eEo/M) iw 0 t, U2n+ 1 - w 2 -w+2 (O) e 0 en donde w+{O) es el límite de longitud de onda larga de la frecuencia de rama óptica, como está dado por (3.4-10). De acuerdo con estos resultados, cuando la frecuencia de la luz incidente es igual a la frecuencia natural de la red para vibraciones de modo óptico de longitud de onda larga, w+{O), por lo normal, se observaría un efecto de resonancia ya que las amplitudes de vibración aumentarían mucho. Es de esperarse que al producirse la resonancia, las amplitudes muy grandes de vibración de los iones cargados den origen a una fuerte rerradiación de energía electromagnética a la frecuencia resonante. De hecho, este fenómeno se observa en cristales iónicos en los que se produce un solo pico fuerte en la reflexividad óptica del cristal en la región infrarroja lejana del espectro, sobre todo en la región de 40 a 1OOJ.L de longitud de onda. Si se conocen las constantes de elasticidad del cristal, se puede hacer un cálculo de la constante de fuerza {3; sí luego se conocen las masas atómicas m· y M, se puede calcular y comparar la frecuencia de resonancia w+(O) según la predice (3.4-1 O), con la frecuencia óptica a la que se observa experimentalmente la máxima reflexividad. De esta manera se encuentra que en la mayoría de los cristales iónicos simples, los dos valores concuerdan con bastante exactitud. Energía de enlace de estructuras cristalims iónicos 69 Si un cristal iónico dado refleja varias veces la radiación de una fuente infrarroja de espectro continuo, la radiación residual resultante será una luz casi monocromática de la frecuencia de resonancia de la red, ya que a otras frecuencias, la reflexividad del cristal será más bien pequeña y, después de varias reducciones, este tipo de luz se atenuará enormemente. Este efecto ha llevado a la terminología de rayos residuales o bien, como se dice en alemán, Reststrahlen, refiriéndose a la radiación reflejada desde un cristal iónico al pico de reflexividad. El efecto característico de Reststrahl, según se produzca o no, puede indicar si el cristal es iónico o bien covalente, ya que el modo de vibraciones ópticas no se puede excitar así en un cristal covalente, eP el que los átomos no llevan una carga neta. La intensidad del pico de Reststrahl en un cristal mixto iónico-covalente, también proporciona una estimación cuantitativa de la fuerza relativa del componente iónico del enlace del cristal. Por supuesto, en relación con el pico de reflexividad, se tiene un mínimo en la transmisión óptica del cristal. Aunque en el cálculo sencillo que se hizo se pasaron por alto los términos de amortiguamiento en la ecuación del movimiento, y no se incluyó ningún otro para explicar las pérdidas de energía del cristal, en realidad, sí se registra una pérdida de energía. Esta pérdida se debe no sólo a la rerradiación del haz reflejado, sino también a otras razones entre las cuales la más importante es la de la inarmonía de las vibraciones reticulares que se origina a las amplitudes grandes, producidas cerca de la resonancia, originando, a su vez, la excitación de otros modos de vibración de la estructura reticular. 3.7 ENERGIA DE ENLACE DE ESTRUCTURAS CRISTALINAS IONICAS3 En un cristal iónico, las fuerzas que mantienen unido el cristal se ongman principalmente en interacciones electrostáticas simples entre los iones positivos y negativos del cristal. Para este tipo de enlace, es bastante sencillo calcular la energía de enlace de la red cristalina sobre una base semiempírica. El planteamiento original de este tema se debe a Madelung y Born. 4 ,S,6 A continuación se verá el ejemplo específico de un cristal de la estructura del NaCl, como se ilustra en la figura l. 7(a); U¡¡ es la energía potencial de interacción entre los iones i y j del cristal. El total de energía de interacción entre el ion i y todos los demás iones del cristal es, entonces, (3.7-1) La prima de la suma indica que el término para el que j = i se debe excluir de la suma, ya que evidentemente, no existe una interacción de enlace entre el ion i y él mismo. Además de la energía coulómbica de interacción ± e2 jr¡¡, en donde r¡¡ es la distancia entre los iones i y j, se debe suponer q•1e existe una fuerza de repulsión la cual crece sólo en distancias interiónicas muy pequeñas. En efecto, esta fuerza de repulsión de corto alcance se origina debido a que cuando los átomos están cerca, 3 Esta sección sigue, en forma general, el planteamiento que le dio C. Kittel en IT'troduction to Solid State Physics, John Wiley & Sons, Nueva York (1956). 4 E. Madelung, Physik, Zeitschr, 11, 898 (1910). S M. Born, Atomtheorie des Festen Zustandes, Teubner, Leipzig (1923). 6 M. Born y M. Goppert-Mayer, Handbuch der Physik, 24/2, 623 (1933). 70 Dinámica de redes cristalinas resisten cualquier intento adicional para obligarlos a ocupar el mismo espacio. Si no existiera esta fuerza, el cristal tendría siempre una energía coulómbica de atracción neta entre iones de cargas opuestas, que sería mayor que la energía coulómbica de repulsión entre iones de cargas iguales, y el cristal simplemente se derrumbaría reduciéndose a un volumen igual a cero. La energía de interacción entre los iones i y j debida a esta fuerza, se representa empíricamente mediante el término A/1/¡. Si el exponente n es un número razonablemente grande, esta interacción de repulsión será muy pequeña a grandes distancias y se hará apreciable sólo en espaciamientos interatómicos bastante reducidos. La energía total de interacción entre los dos iones i y j, se puede expresar como la suma de las interacciones de repulsión de Coulomb y de corto alcance, en la forma (3.7-2) Se debe observar que la fuerza originada en la interacción de repulsión a corto alcance, está dada por la derivada negativa de la energía de interacción correspondiente con respecto a r¡¡, nA/1¡}+ 1 • En (3.7-2) el signo + se aplica a interacciones entre iones de signos iguales y el signo - se refiere a las interacciones entre iones de cargas opuestas. La constante A se limita a expresar la proporcionalidad entre la energía de repulsión a corto alcance y rij 11 • Si el cristal se considera como un elemento compuesto de N iones positivos y N iones negativos, la energía total de enlace de la red, U, se puede expresar como sigue: U=NU;. (3.7-3) Ahora bien, el número total de iones del cristal es 2N, pero, al determinar la energía total de enlace, sólo debe tomarse una vez la energía aportada por cada par de interacciones ij; si se escribiera (3.7-3) con un factor de 2 en el lado derecho, las interacciones U¡¡ y U¡¡ de (3.7-1) se hubieran contado erróneamente como si fueran entidades independientes. La energía U¡¡ dada por (3. 7-2), viene a ser la suma de la energía necesaria para separar los iones i y j situados a una distancia inicial r¡¡, hasta que estén infinitamente separados; la energía reticular total U es, entonces, la energía requerida para convertir un cristal cuyos átomos vecinos más cercanos se encuentran inicialmente a una distancia r, en iones separados, cada uno de los cuales está infinitamente lejos de los demás. Si ahora las cantidades X¡¡ que no tienen dimensiones se definen en tal forma que (3.7-4) en donde r es la distancia entre los átomos adyacentes del cristal, entonces, (3. 7-2) se puede expresar como sigue: (3.7-5) y (3.7-6) Energía de enlace de estructuras cristalinas iónicas 71 No obstante, en (3.7-6), r es ahora independiente del índice de suma j, por lo que A , 1 e2 1 U-(r) = -"" ""'1 n¿ - n+¿ ' X¡i r (3.7-7) B r" ae 2 (3.7-8) r i i xii que se puede escribir así: U-(r)=....!! _ _ ' con r ' B" = A L' 1/x'& (3.7-9) L.' + 1/xii. (3.7-10) j y a= j En la figura 3.14 se muestra una gráfica de la relación (3.7-8), dando a U¡ como una función de la distancia al átomo más cercano r. Si la distancia entre los U; (r) r =o (Separación del ion en equilibrio) 7::7 :;." :í' '/' U; (o)+--........::~_.,1 (Energía de enlace) 1 1 / Energía de Coulomb- ae 2/r 1 Figura 3.14. Energía potencial de un ion de un cristal iónico en función de la distancia interatómica r. El cristal está en equilibrio cuando dicha energía está en un mínimo, o sea cuando existe una separación interatómica igual a la distancia reticular de equilibrio a. átomos adyacentes es grande, la repulsión de alcance corto se puede omitir y la energía de enlace es esencialmente el exceso de la energía coulómbica de atracción, que se acerca a cero conforme r tiende a infinito. A distancias más cortas, la energía positiva de repulsión de corto alcance adquiere importancia y sobrepasa la energía negativa de Coulomb, aumentando con gran rapidez conforme disminuye r. Existe 72 Dinámica de redes cristalinos una posición de energía mínima para el sistema, como lo indica el diagrama, y este punto representa la posición de equilibrio del cristal. El valor de r asociado con este punto es, sencillamente, la distancia interatómica de equilibrio a del vecino más cercano. En este punto, la fuerza coulómbica de atracción entre los iones mantiene un difícil equilibrio debido a la repulsión de corto alcance, siendo igual a cero la fuerza neta ejercida sobre un átomo, dada por - au;;ar. La constante a de la ecuación (3.7-8) que se denomina constante de Madelung, es un número que está determinado completamente por la estructura reticular del cristal. La constante B depende del coeficiente de energía de repulsión A, así como de la estructura reticular. Sin embargo, se puede determinar en términos de la distancia de equilibrio a del vecino más cercano. Para hacer esto, se debe evaluar la derivada de U;(r), a r =a que, de acuerdo con la exposición anterior, debe ser igual a cero, ya que el punto mínimo de la curva de energía potencial se produce a r = a Por tanto, se tiene que nBn cxe 2 - n:tr + - 2 = O, a a de donde, (3.7-11) Al substituir este valor de Bn en (3. 7-8), si se usa (3. 7-3) se encontrará que para la energía total de enlace en equilibrio, 2 1) U 0 = NU¡(a) = - -Ncxe a - ( 1- ~ . (3. 7-12) En esta fórmula no se conoce inicialmente a o n. No obstante, en principio, se puede calcular a evaluando la suma (3. 7-10) en todos los átomos del cristal. En esta ecuación, el signo superior se refiere a las interacciones entre cargas iguales y el signo inferior, a las interacciones entre cargas opuestas. Por tanto, si el origen se escoge como un punto de ion negativo, el signo positivo de (3.7-10) corresponderá a las interacciones con iones positivos y el signo negativo a las interacciones con iones negativos. Para una cadena unidimensional de átomos cargados, alternados, en donde, cada átomo está separado de sus vecinos por una distancia a, se tiene que, al escoger un ion negativo como origen y al usar (3.7-10), (3.7-13) El factor 2 es necesario porque las cantidades aportadas por los átomos a la izquierda del origen y por los átomos a la derecha del mismo, se deben incluir igualmente en la suma. De acuerdo con la expansión de serie, x2 x3 x4 In (1 + x) = -x- -2 +--+ ··· 3 4 (3.7-14) la serie de (3.7-13) se puede obtener haciendo que x = l, de donde, para este caso, ex= 2ln 2. (3.7-15) Energía de enlace de estructuras cristalinas iónicas 73 La evaluación de la constante de Madelung resulta un ejercicio fácil para este ejemplo sencillo. Sin embargo, cuando estos mismos métodos se aplican a estructuras cristalinas reales de tipo tridimensional, se descubre que la suma converge en forma tan lenta que es muy difícil evaluar a directamente en esta forma. Resulta ilustrativo escribir la suma de Madelung para los vecinos más cercanos, los que le siguen en segundo lugar, en tercero, etc., para la estructura del NaCl, con el fin de demostrar la naturaleza de estas dificultades de convergencia. Existen varios patrones matemáticos que se pueden utilizar para contrarrestar estas dificultades, el mejor de los cuales ha sido creado por Evjen 7 y Ewald. 8 En esta obra no se entrará en los detalles de estos métodos, sino que sólo se mencionarán los resultados correspondientes a algunas estructuras de interés. Se ha encontrado que para la estructura de NaCl oc= 1.7476 estructura de CsCl 1.7627 estructura de la zincblenda 1.6381 La tendencia de los compuestos iónicos a cristalizar en estructuras que poseen constantes de Madelung grandes es por demás conocida. Esto se debe a que un valor máximo de a, de acuerdo con (3.7-12), minimiza la energía del sistema dando un cristal con la máxima energía de enlace (negativa). En consecuencia, los cristales muy iónicos raramente cristalizan en estructuras como la de la zincblenda. La constante n de (3. 7-12), que es en realidad el exponente asociado con el potencial de repulsión a corto alcance, se puede expresar en términos de la compresibilidad adiabática del cristal, que se puede medir en forma experimental. Para hacer esto, se puede comenzar con la Primera Ley de Termodinámica que establece que dQ = dU + p dV = T dS, (3.7-16) en donde los símbolos tienen su significado termodinámico acostumbrado. Se considera que la energía interna U se compone totalmente de la energía potencial de interacción entre los iones del cristal, según se expresa en (3.7-12). Esto significa que se supone que la temperatura es mucho menor que la de fusión en una escala absoluta, ya que al aumentar la temperatura, los iones adquieren, además de su energía potencial, cada vez más energía cinética de vibración, que al llegar al punto de fusión excede la energía potencial de interacción entre los iones y con ello se destruye la estabilidad de la estructura reticular. En el caso de un proceso adiabático, dQ = O, en donde dS = O y dU = - p dV, dando p = -(dU) dV S y (3.7-17) La compresibilidad adiabática (compresibilidad medida en tales condiciones que no se intercambie calor con el medio), se puede definir como K=_.!._ (dV) V dp .' 7 H. M. Evjen, Phys. Rev. 39, 675 (1932). 8 P. P. Ewald, Ann.d.Physik 64, 253 (1921). (3.7-18) 74 Dinámica de redes cristalinas en cuyo caso, de acuerdo con (3.7-17), .!.= -v(dp) =v(dz~)K dV • dV • (3.7-19) De igual manera, dU dU dr dV=drdV y (!!!:) 2 d2 U _ dU d 2 r - dr dV 2 + dV dr 2 • . (3.7-20) Sin embargo, el volumen de la celda unitaria de NaCl, con 4 átomos de Na y 4 átomos de Cl, como se ilustra en la figura 1.7(a), es 8r3 ; el volumen por átomo de Na (o por átomo de Cl) es, por tanto, 2r 3 , y el volumen total de un cristal grande con N iones de Na y N iones de Cl, será (3.7-21) de donde, dr 1 dV = 6Nr 2 (3.7-22) y (3.7-23) De acuerdo con (3.7-20), (3.7-22) y (3.7-23), se tiene que d2U -1 dU 1 d2U 2 2 5 dV = 18N r dr + 36N 2 r4 dr 2 ' (3.7-24) Como ya se vio antes, dU/dr =O a r =a, por tanto, de acuerdo con (3.7-24), se de be tener (3.7-25) de donde, recordando (3.7-19) (3.7-26) Energía de enlace de estructuras cristalinas iónicas 15 A partir de (3.7-8), U(r) se puede expresar como sigue: B U(r) = NU¡(r) = N [ ; 2 a.e ] ---¡: , (3.7-27) en donde, (3.7-28) Bn está dada por (3.7-11). Al substituir Bn de la última ecuación, en (3.7-28), y simplificando, haciendo que r =a, se obtiene finalmente, Na.é(n- 1) 18Na a3 =~· (3.7-29) de donde, resolviendo para n, 18a 4 n = l + - -2 • Ka.e (3.7-30) Para el NaCl, el valor medido de la compresibilidad adiabática k, es aproximadamente 4 x I0- 12 cm 2 /dina, en tanto que a= 2.8 x I0- 8 cm. Cuando se substituyen estos valores en la expresión (3. 7-30), se obtiene el resultado n e:: 8, por lo que en este caso, de acuerdo con (3.7-12), se debe esperar que U0 e:: -0.9Nae 2 ja. Entonces, parecería que aproximadamente el 90 por ciento de la energía de enlace de la red está representado por el primer término de (3.7-12), que simboliza el exceso de energía de atracción coulómbica entre iones de cargas opuestas, en relación con la energía de repulsión de Coulomb entre iones de cargas iguales, en tanto que el segundo término, que representa la parte aportada de repulsión a corto alcance, constituye sólo aproximadamente el 1O por ciento del total. El hecho de que n resulta ser un número bastante grande, coincide con las suposiciones originales relacionadas a la forma del potencial de repulsión a corto alcance y, en efecto, sirve para validar hasta cierto punto dichas suposiciones. La energía de cohesión de casi todos los cristales altamente iónicos de tipo I-VII calculados así a partir de (3.7-12) y (3.7-30), concuerdan muy bien con los valores determinados de un modo experimental, como se indica en la tabla 3.1. 9 Esta coincidencia con el experimento no es tan buena en el caso de los compuestos completamente iónicos II-VI, como podría esperarse. Se debe tener en cuenta el hecho de que estos cálculos son, hasta cierto grado, empíricos, y que relacionan un conjunto de cantidades determinadas en forma experimental (espaciamientos reticulares y compresibilidad) con otras (exponentes del potencial de repulsión y energía de enlace). Un cálculo verdaderamente fundamental de la energ:a de enlace del cristal, se etectuará a partir del conocimiento de las propiedades mecánicas ondulatorias de los iones positivos y negativos, y predeciría más que utilizaría, los valores de la constante de red y las compresibilidades; las únicas cantidades medidas que aparecerían en una formulación de esta clase serían e, m, h, etc. Lowdin 10 llevó a cabo 9 Los valores aquí citados fueron tomados de F. Seítz, Modern Theory of Solids, McGrawHill, Nueva York (1940), tablas XXIV y XXVI, páginas 80-83. 10 P. Lowdin, Ark.Mat. Astron. Fysik 35A, Nos. 9, 30 (1947). 76 Dinámico de redes cristalinas TABLA 3.1. Energías de enlace teóricas y experimentales de cristales iónicos Substancia Uo (cale.) kcal./mol U0 (exp.) Exponente kcal./mol de repulsión, n LiCI NaCI KCI RbCI CsCI 193.3 180.4 164.4 158.9 148.9 198.1 182.8 164.4 160.5 155.1 7.0 8.0 9.0 9.5 10.5 NaBr KBr N al KI Rbl 171.7 157.8 160.8 149.0 144.2 173.3 156.2 166.4 151.5 149.0 8.5 9.5 9.5 10.5 11.0 ZnS (Zincblenda) ZnSe PbS PbSe 819.0 790.0 705.0 684.0 851.0 845.0 731.0 735.0 9.0 9.5 10.5 11.0 cálculos de este tipo, cuyos resultados concuerdan bastante con el experimento. Sin embargo, el análisis detallado de este tema está fuera del alcance de esta obra. A pesar de todo, la teoría más sencilla de Born-Madelung tiene un valor considerable, debido a que verifica el simple modelo conceptual del enlace iónico con el que principiamos y porque permite que se entienda con facilidad el papel que desempeñan las fuerzas de repulsión Coulomb y de corto alcance en la determinación de la energía de enlace en las substancias iónicas. EJERCICIOS l. Para la red lineal monoatómica de la sección 3.3, encuentre el coeficiente de atenuación de ondas de frecuencias mayores que Y4fJ!m. 2. Derive la ecuación de movimiento para ondas transversales en la red monoatómica lineal de la sección 3.3. Compare sus resultados con la ecuación de movimiento para ondas longitudinales. 3. Determine la velocidad de fase y la de grupo para ondas de las ramas óptica y acústica, para la red diatómica de la sección 3.4. Grafique sus resultados en función de k. 4. La red de la zincblenda se puede considerar como una serie de planos (111) con espaciamiento alternado a, a/3, a, a/3, a, a/3, • • • , en donde a es 1/4 del lado de una celda unitaria cúbica. Cada plano contiene átomos de un solo tipo, de modo que los espacios atómicos en planos sucesivos son alternados: Zn, S, Zn, S, Zn, • • • . Los planos se mantienen unidos alternativamente mediante un enlace covalente por átomo, normal al plano (111), y 3 enlaces de este tipo por átomo a un ángulo con la dirección [111] cuyo coseno es 1/3, de tal modo que se utiliza la misma cantidad de fuerza por unidad de desplazamiento para estirar un solo enlace o un sistema de tres enlaces dispuestos a este ángulo, cuando un átomo se desplaza a lo largo de la dirección angular [111]. Estudie la red diatómica del tipo que se ilustra en la figura que sigue, con una constante de fuerza {3 que es la misma para cualquier desplazamiento, y luego defina y resuelva las ecuaciones de movimiento para ondas longitudinales en la dirección (111) en la zincblenda, y grafique la relación resultante de w en función de k en la primera Zona Brillouin. ¿Cuál es el borde de esta primera zona? Nota: para la zincblenda, b =a/3, m =/=M en la fJ.gura antcri'-;r. Energía de enlace de estructuras cristalinas iónicas m Zn-3 2n-2 2n-l M tf 2n 2n+l m 11 M tt 2n+2 2n+3 5. Resuelva el problema 4 para obtener las relaciones de w en función de k para ondas longitudinales en la dirección [111] para la red de diamante. Diga si el hecho de que el diamante sólo tiene átomos de una especie es la causa de que no existe una rama "óptica" para esta estructura. Sin entrar en detalles compare resultados obtenidos con los del problema 4. 6. Si el coeficiente de rigidez elástica e para NaCl es 5 X 1011 dinas/cm2, encuentre la constan te de fuerza {j y calcule la frecuencia de Reststrahl de este cristal. 7. Suponga que las vibraciones longitudinales de una cadena lineal de N átomos idénticos, se limitan a obedecer las condiciones periódicas de frontera, de tal manera que el movimiento del primero y el último átomos es idéntico. Encuentre el número de modos normales de vibración para este sistema. 8. Determine la constante de Madelung para la cadena lineal del problema 4, suponiendo que los átomos de masa m tienen carga positiva y los de masa M tienen la misma carga; pero negativa. 9. Suponga que un fluido isotrópico homogéneo con una constante dieléctrica K, se derrama en los espacios interatómicos de un cristal iónico, de tal manera que la interacción coulómbica se reduce por un factor de 1/K. Suponiendo que el potencial de repulsión de corto alcance no varía, calcule el nuevo espaciamiento reticular y la nueva energía de enlace en términos de la energía de enlace y el espaciamiento antiguos. 10. Analice las características de reflexión óptica de Ge, CdS, KBr y GaAs en la región infrarroja lejana del espectro. Finalmente explique sus predicciones desde el punto de vista de la física. 11. La imposición de condiciones periódicas de frontera a una cadena unidimensional de átomos, corresponde físicamente al caso en que el principio y el fin de la cadena se unen para formar un anillo continuo de átomos. ¿A qué sistema físico corresponde una red cuadrada bidimensional de átomos que obedecen a condiciones periódicas de frontera en los bordes opuestos de la red? Explique el significado topológico de una red cúbica tridimendional que obedece a condiciones periódicas de frontera en las caras opuestas de la muestra. LECTURAS RECOMENDADAS M. Born y M. Goppert-Mayer, Handbuch der Physik, Vol. 24/2, J. Springer Verlag, Berlín (1933), p. 623. M. Born y K. Huang, Dynamical Theory of Crystal Lattices, Oxford University Press, Oxford (1956). L. Brillouin, Wave Propagation in Periodic Structures, Dover Publications, Nueva York (1953). C. Kittel, Introduction to So/id State Physics, 2.a edición, John Wiley & Sons, Nueva York (1956), capítulo 3. F. Seitz, Modern Theory of Solids, McGraw-Hill Book Co., Inc., Nueva York (1940), capítulo 2. R. A. Smith, Wave Mechanics of Crystalline Solids, Chapman & Hall, Ltd., Londres (1961), capítulo 3. J. M. Ziman, Electrons and Phonons, Oxford University Press, Nueva York (1960), capítulos 1 y 3. CAPITULO 4 Mecánica cuántica. Generalidades 4.1 INTRODUCCION Durante los últimos años del siglo diecinueve y los primeros del presente, los científicos se encontraron con un gran número de hechos observados en su experimentos que no se podían explicar debidamente basándose en la mecánica y la electrodinámica clásicas. Entre los fenómenos poco comprendidos se incluían algunas de las propiedades térmicas y eléctricas fundamentales de los sólidos. Por ejemplo, el hecho de que algunos sólidos son muy buenos aisladores, con resistividades específicas mayores de 10 12 ohm-cm, y otros son conductores excelentes con resistividades del orden de 10- 5 ohm-cm, no se podía explicar en absoluto desde el punto de vista de la teoría clásic.-. Sin embargo, a partir de 1901 gracias a la explicación dada por Max Planck sobre la distribución espectral de radiación proveniente de cuerpos calientes incandescentes, se pudo demostrar que casi todos estos resultados experimentales hasta entonces inexplicables, demostraron estar de acuerdo con las predicciones de una nueva mecánica la cual difiere en muchos aspectos importantes de la mecánica newtoniana, aunque concuerda con ella en el límite en que las masas y las energías de las partículas se hacen relativamente grandes. Esta nueva y ampliada forma de la mecánica, que resultó especialmente útil en la descripción de acontecimientos que se desarrollan a una escala atómica, se denominó mecánica cuántica. Aunque es imposible presentar en esta obra una relación extensa sobre el tema, se analizarán algunos de sus aspectos más importantes, a fin de proporcionar al lector los conocimientos necesarios para resolver problemas dinámicos simples desde el punto de vista de la mecánica cuántica, y para apreciar los resultados de los cálculos concernientes a sistemas más complejos que se dan más adelante, al explicar el comportamiento físico de cristales reales. 4.2 RADIACION DEL CUERPO NEGRO En la figura 4.1 se ilustra la distribución espectral de la intensidad de radiacwn emitida por un radiador incandescente ideal, llamado "cuerpo negro" detemlinada experimentalmente. Hacia fines del siglo pasado, se realizaron varios intentos para explicar estos resultados a base de la mecánica clásica y la teoría electromagnética, tratando al campo de radiación como si fuera un fluido con propiedades 79 80 Mecánica cuántica. Generalidades termodinámicas tales como temperatura, presión, entropía, etc., que se determinaban mediante las leyes de la electrodinámica y la termodinámica clásicas Se supuso que este fluido estaba en equilibrio con los átomos de la substancia radiante y éstos se consideraban como osciladores armónicos dásicos. Ninguno de estos intentos tuvo éxito para describir la parte de las curvas, correspondiente a longitudes de onda corta, aunque se obtuvieron coincidencias aceptables con los datos experimentales en el límite o sea, para las longitudes de onda largas (la Ley de Rayleigh-Jeans). Los cálculos clásicos que se basaron siempre en la idea de que los osciladores atómicos podían absorber o emitir continuamente energía en cualquier cantidad, grande o pequeña, predijeron invariablemente intensidades espectrales infinitas en el límite de las longitudes de onda corta. Esto dio como resultado la emisión de una energía de radiación total infinita por unidad de tiempo, lo cual constituye un resultado obviamente absurdo. 3000 °K I(X) o 1 2 3 x (micrones) Figura 4.1. Representación esquemática de la distribución de frecuencia de la radiación emitida por un radiador incandescente ideal o "cuerpo negro" a varios valores diferentes de temperatura. En 1901, Max Planck logró explicar la forma de las .curvas de intensidad de radiación espectral correspondientes a la radiación de un cuerpo negro, formulando la hipótesis de que los osciladores atómicos podían radiar o absorber energía sólo en paquetes o grupos discretos (denominados fotones) cuya energía está dada por e= hv = nw, (4.2-1) n = hj2n. (4.2-2) en donde, En este caso, v es la frecuencia del oscilador (o de la radiación absorbida o emitida), w = 2nv, y h es la constante atóm1ca universal (constante de Planck) de magnitud h = 6.625 x 10- 27 erg-sec n = hj2n = 1.054 X 10- 27 erg-sec. Efecto fotoeléctrico 81 Así pues, se supone que los osciladores poseen sólo ciertos estados de energía permisibles de una energía total O, líw, 2líw, 3líw, • • • nlíw, • • • , en donde las transiciones entre estos estados permisibles se efectúan mediante la absorción o emisión de fotones cuya energía es líw. A ciertos científicos de esa época, la hipótesis cuántica les pareció muy extraña, ya que estaban acostumbrados a las ideas de la mecánica clásica; pero la coincidencia que se obtuvo a partir de entonces con los datos experimentales fue excelente y el valor de h que usó Planck para lograr que su teoría concordara con los datos experimentales (6.55 x I0- 27 erg-seg), es solamente uno por ciento menor del valor que en la actualidad se acepta como correcto. Además, es muy importante observar que los éxitos subsecuentes de la teoría cuántica para explicar fenómenos muy diferentes, no dejaron ninguna duda respecto a su validez esencial. A la luz de los conocimientos actuales, no es difícil aceptar el hecho de que la energía, al igual que la materia, puede estar compuesta de partículas discretas e indivisibles. 4.3 EFECTO FOTOELECTRICO Cuando se deja que la luz caiga sobre la superficie de un metal, éste puede expulsar electrones hacia un vacío, en donde los puede recoger un ánodo, como se ilustra en la figma 2.4(a). La máxima energía inicial de estos fotoelectrones emitidos se puede medir insertando un rejilla entre el fotocátodo y el ánodo, y determinando el potencial retardador que se debe aplicar entre la rejilla y el cátodo para reducir la fotocorrriente a cero, como se indica en la figura 4.2{b). Se puede demostrar en esta forma que, si la luz incidente tiene una frecuencia menor que la de una frecuencia de umbral dada (¡Jo, no se produce ningún efecto fotoeléctrico en absoluto, sea cual fuere la intensidad de la luz. Para una radiación incidente de una frecuencia mayor que w 0 , los fotoelectrones se· emiten en una can ti dad proporcional Luz Anodo colector + Foto corriente Iluminación interna Fotocátodo metálico Iluminación leve Potencial de rejilla (o) Figura 4.2. ( b) (a) Diagrama esquemático del aparato usado para estudiar los efectos fotoeléctricos en los metaies, (b) una gráfica de la fotocorriente observada en función del potencial retardador para varios niveles de intensidad de la luz incidente. 82 Mecánico cuántico. Generalidades a la intensidad de la iluminación incidente, haciendo que fluya en el circuito externo una fotocorriente proporcional a la intensidad de la luz. La máxima energía inicial de estos electrones, medida por el método del potencial retardador, es estrictamente proporcional a w- w 0 , en donde w es la frecuencia de la luz incidente. La existencia de la frecuencia de umbral no se puede explicar a base de la física clásica, y no fue sino hasta después de 1905, cuando Einstein describió la naturaleza física del efecto fotoeléctrico basándose en la hipótesis cuántica de Planck. De acuerdo con la explicación de Einstein, los electrones que están dentro del metal deben poseer una energía potencial menor que la de los electrones que están en reposo dentro del vacío, fuera de la superficie metálica; de lo contrario, el metal podría emitirlos espontáneamente en la obscuridad. Este hecho lleva al cuadro conceptual de un metal tal como se ilustra en la figura 4.3. Para que los electrones del metal puedan convertirse en fotoelectrones, deben superar una barrera de energía potencial de una magnitud de por lo menos ecp 0 • El potencial cp0 , denominado función de trabajo en vacío, es una propiedad característica del material del cátodo emisor. De acuerdo con las ideas cuánticas de Planck, la absorción de un fotón cuya energía es menor que ecp 0 por parte del metal, no puede excitar a un electrón hacia el vacío, sino que sólo le imparte cierta energía cinética que finalmente se disipará dentro del metal en la forma de calor por medio de colisiones. Por otro lado, si el fotón absorbido tiene una energía ecp 0 , puede excitar un fotoelectrón hacia el vacío con una energía cinética cero y, si la energía del fotón \ Frecuencia incidente del fotón "'o' etf>0 111 Energía f _ ___, Fotoelectrón emitido al vacío con un E.C. cero e <Po _L~~~~~~~~ Electrones Vacío Figura 4.3. Vacío Metal Modelo conceptual simplificado de un metal, representado como un pozo de po· tencial que contiene electrones libres y en el que se basa la teoría de Einstein sobre los efectos fotoeléctricos. es mayor que ecp 0 , puede excitar a un fotoelectrón hacia el vacío con un exceso de energía cinética que puede ser de la magnitud hw - ecp 0 , siendo hw la energía del fotón incidente. La máxima energía de los fotoelectrones emitidos es, entonces, (4.3-1) en donde la frecuencia de umbral w 0 debe estar dada por W0 = e</> 0 /h. (4.3-2) Todo esto concuerda con los hechos experimentales que se describieron previamente. Además, la ecuación (4.3-1) predice que la pendiente de la curva que da Em en función de w, será la constante de valor h. ¡Cuándo esta pendiente se evalúa basándose en datos experimentales, se encuentra, en efecto, que es una constante y da un valor de h que concuerda exactamente con el valor derivado por Planck de los datos experimentales corrrspondientes a la radiación de cuerpo negro! El efecto Calor específico de los sólidos 83 fotoeléctrico proporcionó así, en unos cuantos años, una confirmación notable de la teoría cuántica, en un campo muy alejado de su aplicación original. 4.4 CALOR ESPECIFICO DE LOS SOLIDOS La física clásica considera que un cristal sólido es un conjunto de átomos que se mantienen unidos en un arreglo periódico por medio de ciertas fuerzas de atracción. Se supone que los átomos son libres para vibrar alrededor de sus posiciones de equilibrio bajo el efecto de las fuerzas presentes y, para lograr una primera aproximación, las fuerzas y los desplazamientos átomicos se relacionaron por medio de la ley de Hook. Entonces, el efecto de la energía térmica consistiría en hacer que estos átomos vibraran como osciladores armónicos alrededor de sus posiciones de equilibrio. Un resultado elemental de la teoría cinética clásica consiste en que si las energías de un conjunto de osciladores clásicos se distribuyen de acuerdo con la ley de Boltzmann en equilibrio térmico, la energía promedio de un oscilador es kT para cada grado de libertad vibratoria, en donde T es la temperatura absoluta y k la constante de Boltzmann (igual a 1.380 x 10- 16 erg¡oK). En una sección posterior se verá cómo se derivó este resultado. Entonces, de acuerdo con la física clásica, puesto que hay tres grados de libertad de vibración independiente, por átomo, se debe esperar que la energía interna térmica total de un cristal compuesto de N átomos idénticos sea U= 3NkT. (4.4-1) La capacidad calórica a volumen constante, Cv, es por definición, la razón de aumento de la energía interna por unidad de incremento de la temperatura, medidas en condiciones de volumen constante o, en este caso. c. = (oUfoT). = 3Nk. (4.4-2) De acuerdo con la fórmula clásica (4.4-2), la capacidad calórica debe ser independiente de la temperatura. Si en (4.4-2) N es igual al número de Avogadro NA (igual a 6.025 x 10- 23 mol- 1 ), se puede ver que la capacidad calórica molar de todos los elementos químicos sólidos debe tener el mismo valor 3NAk, igual o aproximadamente 6 cal °K-- 1 mol- 1 . Este resultado se conoce como la ley de Dulong y Petit, y concuerda bastante con el experimento para muchos elementos a la temperatura ambiente y por encima de ésta. A temperaturas bajas, el resultado clásico no concuerda con l::t experiencia, ya que los datos experimentales indican que la capacidad calórica se acerca a .;ero, conforme la temperatura tiende a cero en la escala absoluta, según se indica en la figura 4.4. Por supuesto, estas mismas observaciones generales se aplican al calor específico a volumen constante cv, que se define sencillamente como c.= (oU/oT)vfV. (4.4-3) En 1911, Einstein explicó las discrepancias entre la teoría clásica y la experiencia, y en 1912, Debye propuso una explicación más exacta basándose en la teoría cuántica. De acuerdo con la hipótesis original de Planck, un oscilador armónico puede poseer sólo ciertos estados de energía discreta que tienen los valores (4.4-4) 84 Mecánica cuántica. Generalidades c. 3Nk Figura 4.4. ley clásica de Dulong • Petit _____ 1_ _______~ Datos experimentales típicos· para el calor específico de una substancia sólida, en función de la temperatura, en comparación con el resultado clásico de Dulong-Petit. en donde w 0 es la frecuencia clásica del oscilador. Como se verá más tarde, esto da como resultado un promedio de energía de oscilador diferente del resultado clásico, y capacidades calóricas que concuerdan con los datos experimentales a todas las temperaturas. También en este caso, la teoría cuántica ha proporcionado una explicación sencilla de un efecto que no podía analizarse de acuerdo con los métodos clásicos, siendo también este campo muy distinto del de la aplicación original. 4.5 EL ATOMO DE BOHR Uno de los aspectos más desconcertantes del comportamiento atómico al que se enfrentaron los físicos del siglo diecinueve, consistió en los espectros de emisión y absorción de los elementos. Las líneas espectrales claras y discretas que se observaron, no podían entenderse en absoluto a la luz de la mecánica clásica y la teoría electromagnética. No obstante, en 1913, Niels Bohr propuso un modelo del átomo del hidrógeno basado en la hipótesis cuántica de Planck, que describe con precisión sorprendente las principales características del espectro del hidrógeno atómico. En el modelo de Bohr, que se basó en el concepto del átomo nuclear propuesto por Rutherford en 1910, se supone que un electrón de masa m y carga -e se desplaza en un órbita alrededor de un núcleo mucho más masivo, de carga + Ze, en donde Z es un entero. La introducción del factor Z permite explicar no sólo el hidrógeno (Z = 1), sino también otros iones parecidos a éste, tales como He+ (Z = 2), u++ (Z = 3), Be+++ (Z = 4), etc., que se componen de un solo electrón y un núcleo pesado. De acuerdo con la electrodinámica clásica, las cargas aceleradas siempre irradian energía, y un sistema como el que propuso Bohr, en donde el electrón está sometido siempre a una aceleración central, perdería energía constantemente en forma de radiación y el electrón giraría en espiral acercándose gradualmente hacia el núcleo. Sin embargo, Bohr supuso que el electrón podía existir en órbitas estacionarias alrededor del núcleo sin irradiar energía en absoluto, a condición de que la cantidad de moPimiento angular relacionada con este movimiento estuviera cuantizada en tal forma que sólo se tuvieran los valores permitidos nh, en donde n es un entero positivo. Entoncc~. b~ transiciones entre los estados estacionarios permitidos n y m El átomo de Bohr 85 se relacionan con la emisión o absorción instantánea de un fotón de frecuencia Wmn tal que (4.5-1) en donde Em es la energía asociada con el estado de la cantidad de movimiento angular mh y En de energía correspondiente al estado de la cantidad de movimiento angular nh. Por supuesto, desde el punto de vista de la dinámica, la órbita del electrón alrededor del núcleo podía ser circular o elíptica; pero para facilitar las cosas, se supondrá que es circular. Los valores permisibles de la cantidad de movimiento angular L están restringidos a enteros múltiplos de h, de tal manera que (n = 1,2,3, ···), (4.5-2) en donde rn es el radio de la órbita con un momento angular nh y Wn es la velocidad angular del electrón dentro de dicha órbita. Para una órbita estacionaria, el radio rn debe ser tal que la fuerza electrostática de atracción entre el electrón y el núcleo, Ze 2 /r~, es justamente la fuerza centrípeta mvMrn necesaria para mantener al electrón dentro de la órbita circular, de donde, (4.5-3) Las ecuaciones ( 4.5-2) y ( 4.5-3) se pueden resolver ya como ecuaciones simultáneas para r n y W 12 , dando n21i2 r =-" Zme 2 (4.5-4) y (4.5-5) La energía cinética del sistema, ek> está dada por Z l me4 _ 1 2 _ 2 2 _ ¡;k- "lmv"- !mr"w" - - -2- 2 • 2n li (4.5-6) La energía potencial eP, es ¡;P = 2 Z 2 mé -Ze ft"n = - -2-2-. n li (4.5-7) Por tanto, la energía total del sistema es (n = 1,2,3, ···). (4.5-8) Como se puede ver, la energía del sistema está limitada a ciertos valores discretos o niveles de energía correspondientes a n = 1, 2, 3, •••. Si Z = l, el sistema 86 Mecánica cuántica. Generalidades l Energía • o ¡¡- ~ 114'1 - 11 Serie de Paschen •3= 1 Serie de Balmer Serie de Lyman me 4 Figura 4.5. Niveles de energía del átomo de hidrógeno según lo pll'dlc ho por la teoría de Bohr. Se indican las transiciones correspondientes a cierta~ lmcas espectrales prominentes. correspondiente al átomo de hidrógeno y el diagrama de niveles de energía resultante se ilustra en la figura 4.5. Las transiciones entre los niveles de energía se logran mediante la absorción o la emisión de un fotón cuya frecuencia está dada por (4.5-1), correspondiendo cada transición de este tipo a una línea posible del espectro. La teoría de Bohr explica con claridad y precisión el espectro del hidrógeno y de los iones semejantes a él, y se puede ver que las frecuencias espectrales predichas y las observadas son muy semejantes. En la exposición anterior se supuso que las órbitas de los electrones son circulares. En general, las órbitas pueden ser elípticas y, en efecto, se puede demostrar que existen series regulares de órbitas elípticas permitidas que satisfacen la condición cuántica ( 4.5-2). Sin embargo, estas órbitas elípticas no establecen nuevos niveles energéticos, sino que sólo representan órbitas para las que la cantidad de movimiento angular tiene un valor mh en donde m es un entero menor que n, así pues, el sistema posee una energía En de acuerdo con lo que determine (4.5-8); pero su cantidad de movimiento angular, aunque sigue siendo un entero múltiplo de h, es menor que el valor máximo nh que corresponde a una órbita circular. También se ha considerado que el núcleo está fijo, lo cual es cierto sólo en el límite en que la relación de la masa nuclear a la electrónica se hace infinita. Para una masa nuclear finita, el núcleo y el electrón girarán alrededor de un centro común de masa. Este efecto se explica fácilmente y el resultado es que la cantidad m de las ecuaciones anteriores se debe substituir por una masa reducida J1 dada por (4.5-9) siendo M la masa nuclear. En el caso del átomo del hidrógeno, la masa reducida difiere de la electrónica en aproximadamente 1 parte por 1850. La hipótesis .te De Broglie 87 Se hicieron numerosos intentos para generalizar el modelo de Bohr con el fin de explicar los espectros del helio y átomos más complejos; durante la década que siguió a la presentación del modelo, todos los esfuerzos fracasaron debido a que no se encontró una forma sencilla para describir las órbitas. En general, los resultados de los cálculos hechos no concordaron con la experiencia, ni se logró que la teoría de Bohr explicara por qué algunas transiciones entre estados electrónicos en átomos complejos, aparentemente, estaban prohibidas. No obstante, el modelo de Bohr proporcionó por vez primera una explicación simple, coherente y exacta de los espectros de átomos monoelectrónicos así como un marco conceptual que permitía entender ciertos aspectos del comportamiento atómico y que resulta útil incluso hasta hoy. 4.6 LA HIPOTESIS DE DE BROGLIE Y LAS PROPIEDADES ONDULATORIAS DE LA MATERIA En 1924, De Broglie sugirió que a una partícula con cantidad de movimiento p, se le podría asociar una onda de longitud de onda A tal que h h 2n p = ¡ = 2n T = ñk. (4.6-1) La condición cuántica de Bohr se sigue directamente de esta hipótesis, si se supone que las órbitas permitidas de la sección anterior alojan un número entero de longitudes de onda de la partícula, definidas por (4.6-1 ). Puesto que la longitud de trayectoria de la órbita es 21Trn, de acuerdo con este concepto, se debe determinar o bien, (4.6-2) Davisson y Germer demostraron experimentalmente que los electrones podían, en efecto, difractarse de los cristales, obteniéndose el mismo patrón para un cristal dado que el que producen los rayos X de longitud de onda A = h/p, según propuso De Broglie. La condición para la difracción de electrones de planos cristalinos es, precisamente, la condición de Bragg siendo A igual a h/p, nA. = nh/ p = 2d sen 9. (4.6-3) Posteriormente se ha demostrado que los átomos neutros, los protones, los iones positivos y otras partículas, presentan el mismo comportamiento ondulatorio, y en cada uno de estos casos se satisface la relación de De Broglie ( 4.6-1 ). 4. 7 MECANICA ONDULATORIA En 1926, Schrbdinger desarrolló un patrón unificado para la mecamca, basándose en las ideas físicas de la teoría cuántica de Planck, y utilizando los conceptos de De Broglie sobre la naturaleza ondulatoria de la materia. Este patrón, que se denomina mecánica ondulatoria, constituye una versión muy general de las leyes de la mecánica, diseñada especialmente para abarcar el campo de los fenómenos ató- 88 Mecánica cuóntictl. Generalidades micos y nucleares. Este planteamiento ha tenido un éxito rotundo y, hasta donde se puede afirmar en la actualidad, constituye una forma correcta de describir el comportamiento físico de la materia en una escala atómica o en cualquier escala, ya que la mecánica ondulatoria proporciona los mismos resultados qu¡; la mecánica newtoniana clásica para los sistemas relativamente grandes y masivos que se pueden observar en forma macroscópica. Casi al mismo tiempo, Heisenberg diseñó otro sistema de mecánica cuántica denominada mecánica de matrices, basada en las mismas ideas físicas que la mecánica ondulatoria. Aunque su formulación matemática difiere bastante de la mecánica ondulatoria de Schrodinger más tarde se demostró que, en realidad, las dos mecánicas constituyen sistemas equivalentes. La exposición de esta obra se confirmará mayormente a la descripción de la mecánica ondulatoria de Schrodinger, que es más sencilla y se relaciona con mayor facilidad a las situaciones físicamente observables. En la formulación de Schrodinger de la mecánica cuántica, una cantidad compleja '11, denominada función de onda, se relaciona con un sistema dinámico. Esta cantidad es una función de tres coordenadas espaciales para cada partícula del sistema, y el tiempo. Las propiedades dinámicas del sistema están íntimamente relacionadas con las propiedades de la función '11 y el comportamiento dinámico del sistema se puede determinar cuando se conoce la función '11 del sistema. Para un sistema de una sola partícula, que será el tema general de este libro, las propiedades de la función de onda '11 se pueden expresar de acuerdo con los siguientes cinco postulados: 1 l. Se tiene una función de onda compleja relacionada con la partícula, '11 (x, y, z, t), en donde x, y, z, son las coordenadas espaciales y t es el tiempo. 2. La expresión clásica correspondiente a la energía total e del sistema (que se conoce con el nombre de Hamiltoniano clásico del sistema) dado por p2 2m + V(x,y,z) =e, (4.7-1) en donde p es la cantidad de movimiento de la partícula, m es su masa y V(x, y, z) es la energía potencial, se pueden convertir en una ecuación ondulatoria por medio de ciertos operadores de asociación con las cantidades dinámicas clásicas, y permitiendo que estos operadores se apliquen a la función de onda como lo indica (4.7-1). Los operadores correspondientes a las cantidades dinámicas pertinentes son: dynamical variable associated operator X, y, O Z f(x,y,z) ~ X, y, O Z ~ f(x,y,z) p ~ ~V ' e ~ (4.7-2) ha ; ot · 1 C. W. ShNwin, lntrodur·tion to Quantum Mechanics, Holt, Rinehart and Winston, Nueva 'orl.. (1959). p;Í¡:ina 14. pJ¡•ina\ li2-63 Con'>Ílltcs<' también respecto a la ampliación de estos P<"tul.ld<" a ~~~ll'llla~ de m..Í\ de una partícula Mecánica ondulatoria 89 Puesto que las componentes cartesianas de operador son (3/3x, 3/3y, 3/3z), es evidente que los operadores correspondientes a las componentes de la cantidad de movimiento Px• Py· Pz son (h/iX3/3x), {h/iX3/3y) y (h/iX3/3z), respectivamente. Así también, puesto que p2 = p • p, el operador correspondiente p 2 debe ser - tJ2( V· V) o - fi2 V2 , de donde, V2 representa al operador laplaceano 32 ¡ax2 + 3 2 /3y 2 + 32 /3z 2 , Al reemplazar las cantidades dinámicas p 2 , V(x, y, z) y e en ( 4.7-1) con sus operadores correspondientes y al permitirles que operen sobre la función de onda '11, se obtiene la ecuación ondulatoria h2 ñ a'l' 2 - 2 - V 'Y + V(x,y,z)'l' = - 7 - . m 1 at (4.7-3) Esta es la ecuación de Schrodinger para la función ondulatoria, que con frecuencia se expresa en la forma ha'Y Jt"'Y = - - ¡ en donde ot ' (4.7-4) Jlf representa el operador hamiltoniano h2 Jt" = - 2 m V2 + V(x,y,z). (4.7-5) 3. Las cantidades 'IF(x, y, z, t) y V'll deben ser finitas, continuas y de un solo valor para todos los valores de x, y, z y t. 4. La cantidad '11*'11, en donde '11* es el conjugado complejo de '11, es siempre una cantidad real. Esta cantidad se interpreta como la densidad de probabilidad en el sentido de que '11*'11 dv es la probabilidad de que las partículas se encuentren dentro del elemento de volumen dv en el instante t. Esta es toda la información respecto a la ubicación real de la partícula, que se puede obtener de la función de onda; en cuanto al sitio exacto en donde se encuentra la partícula en un momento dado y cuál es su trayectoria, esto no se puede determinar en forma precisa de acuerdo con la mecánica cuántica. Por supuesto, para un objeto grande o masivo, '11*'11 es grande sólo dentro de las fronteras clásicas del objeto y se mueve en el tiempo según lo predicen las leyes de Newton; pero, en una escala atómica, será imposible localizar una partícula en forma exacta y seguir su trayectoria con minuciosidad. Puesto que '11*'11 dv es una densidad de probabilidad y, puesto que la probabilidad de que la partícula se encuentre en algún punto en el espacio, es la unidad, es necesario que la función de onda sea normalizada de tal manera que i 'Y*'I'dv=1, (4.7-6) tomándose la integral sobre todo el espacio. S. El promedio o valor esperado (a.) de cualquier variable dinámica a con la que se asocia un operador a 0 p.• se define mediante (01) = i '1'*01op '1' dv, tomándose la integral sobre todo el espacio. (4.7-7) 90 Mecánica cuántica. Generalidades Las características esenciales de toda la mecánica ondulatoria están contenidas en estos cinco postulados. Lo que resta de este análisis estará dedicado a examinar las implicaciones de la misma y a aplicarlas a problemas específicos. No se puede demostrarlas, sólo se puede enunciar que los resultados obtenidos, siempre que se han sometido a prueba por medio de experimentos, han coincidido con las observa· ciones dentro de los límites de la incertidumbre experimental que, en muchos casos, ha sido extremadamente pequeña. Por supuesto, se tratará de demostrar que los resultados de la mecánica ondulatoria son paralelos con los dictados de la intuición y coinciden con los resultados de la mecánica clásica cuando puede esperarse que esto suceda. En relación al último punto, se puede demostrar que la mecánica ondulatoria proporciona los mismos resultados que la mecánica clásica en los que se relaciona con los valores promedios o esperados de cantidades dinámicas. Para hacer las cosas más sencillas, sea una situación unidimensional en la que el sistema dinámico está confinado al eje x. El valor esperado de la cantidad de movimiento Px, de acuerdo con (4.7-7), es, entonces, f oo <Px) = li a 'l'*(x,t) · - -:--a 'l'(x,t) dx, (4.7-8) X 1 _ 00 por lo que, al tomar una derivada de tiempo y diferenciarla bajo el signo de la integral de la derecha, d(px) dt li -- = - i f"" -a'I:'* -a'I:' dx + -li f"" '1' *8- '1' dx 2 -ro at ox i - 00 oxot . (4.7-9) Ahora, el valor de a\f! jat está dado por la ecuación de onda (4. 7-3) y el valor de a\f!* jat se puede expresar en forma similar escribiendo la ecuación de onda en función de \f!* en lugar de hacerlo en función de \f!. Esto se logra escribiendo la función compleja \f!(x, t) como la suma de partes reales e imaginarias 'l'(x,t) = u(x,t) + iu(x,t), (4.7-10) substituyendo esta forma de \f! en (4.7-3) e igualando las partes reales e imaginarias de ambos lados de la expresión resultante, para obtener dos ecuaciones de la forma li 2 2 au --Vu+uV=ñ-. 2m ot (4.7-11) Si se multiplica la segunda de estas ecuaciones por - i y se suma a la primera, se obtiene una ecuación de onda para \f!* ( =u - iv) de la forma li 2 * ñ D'l'* - - vzll'* + Vtl' = - - - . 2m ' it (4.7-12) Dependencia del tiempo de la función de onda En la ecuación ( 4. 7-9), si se expresa mediante (4.7-12), se obtiene 91 a\lt j"ot por medio de (4. 7-3) y a\lt* jat d(px) = - ~ foo [azq¡* o'l' -'V* o3'!1] dx + foo [ V'!l* o'V- '1'* ~ (V'I')] dx 2m -oo ox 2 ax ox 3 -oo OX ax dt = - ~ f<X) [~ 2m = - (a'!l o'V* - '1'* azq¡)] dx- Joo 'V* av '1' dx -ac ox ox OX -oo ' ox 2 ox ~ [o'V* o'V- 'V* az~]oo - Joo 'V* av 'V dx. 2m ox ax OX o -oo -oo (4.7-13) ax De acuerdo con el postulado ( 4) anterior, la integral de la cantidad \lt*\lt = u 2 + v 2 sobre el rango de oo a - oo, debe existir; esto significa que tanto u y v, como sus derivadas, deben tender a cero conforme x se acerca a oo ó - oo. Por tanto, \lt y a\lt jax tienden a cero dentro de estos límites, y el primer término de la expresión (4.7-13) desaparece. No obstante, de acuerdo con el postulado (5) anterior, el segundo término de ( 4. 7-13) representa el valor esperado de la cantidad - aV/ ax, que es la fuerza clásica ejercida sobre la partícula. En consecuencia, se tiene que (4.7-14) que es, sencillamente, la ley del movimiento de Newton. Por tanto, es evidente que en lo que respecta a los valores esperados, la mecánica ondulatoria concuerda con las ecuaciones de la mecánica clásica. 4.8 DEPENDENCIA DEL TIEMPO DE LA FUNCION DE ONDA Se supondrá que la ecuación de Schrodinger (4.7-3) se puede resolver mediante las técnicas matemáticas usuales o sea, separando las variables. Así pues, se supondrán soluciones de la forma 'V(x,y,z,t) = 1/J(x,y,z)r/J(t), (4.8-1) en donde 1/1 depende sólo de las coordenadas espaciales y 41 depende sólo del tiempo. Al derivar (4.8-1) y al substituirla nuevamente en (4.7-3), es evidente que n 2 --rjJV 2m 2 n dr/J 1/1+ Vr/Jl/1= ---:1/1-. z dt (4.8-2) Si se dividen ambos lados de la ecuación entre \lt = 411/J, se tiene que ¡¡z vzlf¡ 1i 1 dr/J 2m 1/J i </> d t - - - + V(x,y,z) = - - - - =e. (4.8-3) 92 Mecánica cuántica. Generalidades En ( 4.8-3), el lado izquierdo es una función exclusiva de las coordenadas espaciales, en tanto .:¡ue la expresión central está en función del tiempo solamente. La única forma en que esta igualdad se puede aplicar a todos los valores de las variables, es que cada expresión por separado sea igual a una constante denominada constante de separación y representada por e en ( 4.8-3). En realidad, son dos ecuaciones separadas, una para cp(t), y la otra para ¡J;(x, y, z), de donde, ie d</Jfdt = - - </J(t) h (4.8-4) 2m (e- V(x,y,z)) 1/1( x,y,z ) -O. _ .1 2 lj¡ + ""j;2 (4.8-5) y La ecuación ( 4.8-4) se puede integrar de tal modo que dé (4.8-6) La constante de integración que normalmente aparecería como un factor multiplicativo ( 4.8-6) se iguala arbitrariamente a la unidad. Al hacer esto, no se pierde la generalidad que se ha venido sosteniendo. De acuerdo con ( 4.8-1), la función de onda dependiente del tiempo, '11, se puede expresar ahora como I.JI(x,y,z,t) = ¡f¡(x,y,z)e-ietfn, (4.8-7) en donde ¡J;(x, y, z) es una solución de ( 4.8-5). La expresión ( 4.8-5) se denomina ecuación independiente del tiempo, de Schrodinger, y sus soluciones ¡J;(x, y, z) se llaman funciones de onda independientes del tiempo o de estado estacionario. La ecuación ( 4.8-5) se puede expresar también como sigue (4.8-8) en donde ;jf es el operador hamiltoniano expresado por (4.7-5). Normalmente conviene, siempre que sea posible, resolver las ecuaciones independiente del tiempo ( 4.8-6) y utilizar lo más que se pueda sólo las funciones de onda independientes del tiempo. Las dependencias del tiempo, siempre que se necesiten, se pueden expresar utilizando ( 4.8-7). Para lograr esto en forma correcta, se deben observar ciertos resultados que se obtienen cuando la función de onda tiene la forma ( 4.8- 7). En primer lugar, si la función de onda tiene esta forma, entonces, (4.8-9) y '11*\lf propiamente dicha es independiente del tiempo e igual a ¡J;*¡J; -; la terminología de funciones de onda de estado estacionario, se aplica a funciones de onda de esta índole. Como consecuencia de este resultado, ¡J¡*¡J¡ tiene la misma interpretación de densidad de probabilidad con respecto a las funciones de onda independientes del tiempo, que la que tiene \lf*\lf con respecto a las dependientes del tiempo. Además, de acuerdo con ( 4.8-9), se sigue que 1 •p*•p dv = 1 ¡f¡*¡f¡ dv = 1, (4.8-10) Dependencia del tiempo de la función de onda 93 y que la condición de normalización para las funciones independientes del tiempo (4.8-7) es, por tanto, la misma que la que corresponde a las funciones dependientes del tiempo. Por último, si las funciones de onda tienen la forma (4.8-7) y si a 0 p. depende sólo de las coordenadas y no explícitamente del tiempo, el valor esperado de ia variable dinámica representado por el operador CXop. se puede expresar como (4.8-11) ya que los factores exponenciales de tiempo se anulan al igual que sucede en (4.8-9), si CXop. no tiene una dependencia explícita del tiempo. Si a 0 p. depende explícitamente del tiemp<', entonces las funciones de onda dependientes del tiempo se deben emplear normalmente para evaluar (a). Se debe observar que estos resultados pueden aplicarse sólo cuando la función de onda total tiene la forma (4.8-7). Si la función de onda total - ('ñ/iXo/ot), es una superposición de funciones de la forma ( 4.8-7) -como puede suceder aun cuando se satisfaga la ecuación ondulatoria dependiente del tiempo- estos tres resultados ya no son válidos y, para calcular las propiedades del sistema, se deben utilizar las funciones de onda dependientes del tiempo. Se puede demostrar fácilmente, usando la función de onda (4.8-7) en (4.7-7), con el operador de energía dependiente del tiempo - (h/i)(o/ot), que el valor esperado de la energía de un sistema en un estado representado por una función de onda de esta clase es, sencillamente, el valor de la constante de separación e. Por supuesto, se puede prever este resultado gracias a la notación seleccionada para la constante de separación. También se puede demostrar, a partir de (4.8-8), que el valor esperado del operador hamiltoniano :tf para un sistema en un estado representado por este tipo de función ondulatoria (el cual, puesto que :tf es un operador independiente del tiempo, se puede calcular empleando la función de onda independiente del tiempo de acuerdo con (4.8-11)), es igual a e, el valor esperado de la energía. Las expresiones (4.8-4) y ( 4.8-5) no imponen ninguna restricción en el valor de e, ya que para cualquier valor de e existe una \}1 que satisface estas ecuaciones. Sin embargo, los requisitos de continuidad, el aspecto finito y el valor único, pueden seleccionar, de entre el continuo infinito de soluciones posibles, sólo ciertas soluciones individuales que satisfagan estas condiciones, que corresponden a ciertos valores discretos de la constante de separación (y, por tanto, la energía) e. De esta manera se puede encontrar que sólo un grupo determinado de soluciones 1/ln(x, y, z) que se relaciona con un conjunto asociado de niveles energéticos En es aceptable como funciones de onda para el sistema, debido a que sólo estas funciones satisfacen la ecuación de onda y, a la vez, las condiciones de frontera. Las funciones de onda aceptables se denominan funciones propias del sistema (tomado del alemán eigen, que significa propias o características), y los niveles de energía correspondientes se llaman valores propios de energía. Los niveles discretos de energía del oscilador de Planck y el átomo de Bohr son, en realidad, valores propios de esta naturaleza. De acuerdo con ( 4.8-6), se puede ver claramente que la frecuencia de la función de onda obedece siempre a la relación de Planck e = liw. (4.8-12) En algunos casos, tanto la ecuación de onda como las condiciones de frontera asociadas con ella se pueden satisfacer para cualquier valor de e, o, cuando menos, para cualquier valor de e dentro de un intervalo finito dado. En tales casos existe un rango continuo de energías permisibles o un continuo de niveles energéticos. Más 94 Mecánica cUJÍntica. Generalidades adelante se verá en qué circunstancias particulares se presentan estas situaciones posibles. 4.9 LA PARTICULA LIBRE Y EL PRINCIPIO DE INCERTIDUMBRE A continuación se examinará la función de onda de una partícula libre, es decir, que no está sujeta a fuerzas y que, por tanto, se mueve en una región de potencial constante. Este estudio se limitará a una geometría unidimensional en la que el movimiento está restringido al eje x. Por conveniencia y, para no perder generalidad, el potencial se puede considerar con un valor de cero, en cuyo caso la ecuación ( 4.8-5) se convierte en (4.9-1) en donde k= J2mejh2. (4.9-2) La ecuación (4.9-1) es de un tipo diferencial ya conocido que tiene soluciones de la forma t/J(x) = Ae±ikx, (4.9-3) en donde A es una constante arbitraria. Estas soluciones satisfacen todos los requisitos de las funciones de onda excepto, en un sentido estricto, la integrabilidad en el intervalo - oo < x < oo. Sin embargo, será necesario aceptarlas aunque, como se verá más adelante, se pueden originar ciertas dificultades para satisfacer los requisitos de normalización. Las funciones de onda dependientes del tiempo del sistema, de acuerdo con (4.8-7), serán 'l'(x,t) = Aei(lkx-wt), (4.9-4) en donde, de acuerdo con (4.9-2), flk2 w = efñ = - . 2m (4.9-5) Las soluciones dependientes del tiempo ( 4.9-4) representan ondas progresivas; si se escoge el signo +, la dirección de propagación es a lo largo del eje + x; si se selecciona el signo --, la dirección de propagación es en sentido opuesto. Por tanto, se puede hacer la misma selección de signo para las funciones independientes del tiempo (4.9-3) para representar ondas que se propagan (en el tiempo) en estas direcciones respectivas. El valor esperado de la cantidad de movimiento de la partícula, de acuerdo con ( 4.8-11 ), está dado por (4.9-6) La partícula libre y el principio de incertidumbre 95 No obstante, de acuerdo con (4.9-3), se puede ver que a¡J¡¡ax = ± ikl/l, por lo que (4.9-6) se convierte en (p}) = ±ñk f 1/1*1/1 dx = ±ñk = ± -:;.h oo -oo (4.9-7) A Esta expres10n es, sencillamente, un enunciado de la relación de De Broglie (4.6-1); por tanto, la relación de De Broglie para partículas libres está contenida implícitamente en los postulados de la mecánica ondulatoria. Además, por lo que establece (4.9-5), es evidente que iz2k2 (p2) B=--=-- 2m 2m' (4.9-8) lo cual concuerda con el resultado clásico. Al intentar normalizar la función de onda ( 4.9-3) de acuerdo con los requisitos de (4.8-10), se encuentra que el valor de A*A debe escogerse en tal forma que sea infinitesimalmente pequeño a fin de que no diverja la integral (4.8-10). Puesto que, de acuerdo con (4.9-3), la probabilidad 1/1*1/1 dx de encontrar la partícula dentro de un intervalo dx alrededor de un punto x es la misma en todos los puntos e igual a A*A dx y, puesto que la probabilidad clásica a priori de encontrar una partícula libre dentro de una región finita específica de una línea infinita, es infinitesimalmente pequeña, no es sorprendente que esta situación se haya presentado. En efecto, esto coincide con lo que se podía haber esperado desde el punto de vista físico. No se intentará resolver esta dificultad de un modo muy riguroso, sólo se observará que no existen problemas graves al aplicar la condición de normalización (4.8-1 0), siempre que se reconozca la naturaleza singular de las circunstancias que determinan la magnitud de A*A y no se intente evaluar esta cantidad explícitamente en términos numéricos. Las soluciones de la ecuación de Schrodinger independiente del tiempo ( 4.8-5) dan funciones de onda de la forma (4.9-3) o (4.9-4), que representan ondas planas que se propagan a lo largo de la dirección ± x. Puesto que la densidad de probabilidad '11!*'11! asociada con estas funciones es independiente del tiempo, las soluciones (4.9-3) son funciones de onda de estado estacionario. Cada función de onda de estado estacionario se relaciona con un valor único de energía E y, por ende, de acuerdo con (4.9-8) y (4.9-7), representa un estado cuya constante de propagación tiene un valor único k y cuya cantidad de movimiento tiene un valor único Px ( = lik). No obstante, puesto que la amplitud de las ondas es constante, éstas se desplazan de un modo uniforme desde oo a - oo, y, en consecuencia, no tienen una ubicación única en el espacio. Dado que las condiciones de frontera de continuidad, de lo finito, de unicidad, etc., se satisfacen igualmente para cualquier valor de E o k, existe un rango continuo de valores permitidos para estos parámetros. Mediante la superposición de soluciones de este tipo, cada una de las cuales corresponde a un valor diferente de E y k, se pueden construir funciones de onda de la forma (4.9-9) Debido a la linealidad de la ecuación dependiente del tiempo de Schrodinger, este tipo de funciones de onda superpuestas son soluciones perfectamente adecuadas para la ecuación dependiente del tiempo (4. 7-3); en cambio, no satisfacen la ecua- 96 Mecánica cuántica. Generalidades ción independiente del tiempo ( 4.8-3) debido a que no tienen la forma ( 4.8-7). La amplitud de probabilidad asociada con esta clase de soluciones, no es independiente del tiempo, como sucede con las soluciones de estado estacionario. El método de superposición se puede aplicar en forma más amplia de manera que un número infinito de soluciones de estado estacionario se combine en una función de onda de la forma 'l'(x,t) = L Anei(kn.x-mntl. (4.9-10) n Los valores de kn se pueden escoger muy cerca unos de otros, separados sólo por intervalos dk, y los valores An pueden asumir la magnitud de cualquier función dada de k en estos puntos, en cuyo caso, la superposición ( 4.9-1 O) se puede convertir, en el límite, en una integral de la forma 'l'(x,t) = f~00 A(k)ei<kx-mt) dk. (4.9-11) Como ejercicio, el lector puede verificar fácilmente el hecho de que ésta constituye todavía una solución a la ecuación dependiente del tiempo de SchrOdinger (4.7-3). La función A(k) de (4.9-11), puede ser cualquier función de k en tanto exista la integral. Supóngase ahora que, en algún instante de tiempo, por ejemplo, t = O, se trata de formar una función de onda cuya densidad de probabilidad '11*'11 se localiza en una región particular del eje x, por ejemplo, entre los puntos x = a/2 y x =- a/2, como se ilustra en la figura 4.6. Esto se puede lograr construyendo una superposición de soluciones de la forma de estado estacionario (4.9-4), perteneciendo a diferentes valores de k, de acuerdo con (4.9-11). Por ejemplo, se puede escoger A( k) = e sen !(k - k 0 )a t(k- k 0 )a ' (4.9-12) en donde e y k 0 son constantes. Se verá directamente que esta selección de A(k) es la correcta si '11*'11 es como se representa en la figura 4.6. Si se substituye (4.9-12) en (4.9-11) y t se hace igual a cero, es evidente que 'll(x,O) = e f"' sen t(k - ko)a eikx dk. -=o t(k- k 0 )a (4.9-13) '11*'11 (/=O) Figura 4.6. La función de densidad de probabilidad de una partícula que, de alguna manera, debe encontrarse forzosamente a lo largo de la región del eje x que se extiende entre a/2 y +a/2. La partícula libre y el principio de incertidumbre 91 Si se hace que (4.9-14) q =k- k 0 , esto se puede escribir en la forma .k 'l'(x,O) =Ce' o.c foo sen !qa . - - - e'q" dq. -oo !qa (4.9-15) Ahora, de acuerdo con el teorema de la integral de Fourier2, una función arbitraria f(x) se puede expresar como una integral de Fourier mediante 1 JO() . f(x) = e'q" dq 2n _ oo JO() f(x')e-•qx . , dx'. - oo (4.9-16) Si la función representada como 'lt*'lt en la figura 4.6, es decir, (x) = 1/a (- a/2 < x < a/2) =O (x > a/2; x < -aí2) (4.9-17) se expresa en forma de integral utilizando (4.9-16), se puede demostrar de un modo directo que Joo 1 sen fqa . f(x) = - - - e'q" dq = 1/a 2n _ oo tqa (- a/2 < x < a/2) (4.9-18) (x > a/2; x < -a/2). =O Utilizando este resultado para expresar la integral en (4.9-15) con mayor sencillez, se encuentra que 3 2nC .k 'l'(x,O) = -- e' 0 " a ( -a/2 < x < a/2) (4.9-19) =0 (x > a/2; x < -a/2). La constante de normalización C se debe escoger en tal forma que satisfaga (4.7-6), según lo cual 4n2;2 a f!a dx = 4n2C2 = 1 -!a a 2 Véase, por ejemplo, R. V. Churchill, Fourier Series and Boundary Value Problems, McGraw-Hill Book Co. Inc., Nueva York (1941), capítulo V. 3 Aunque todas las funciones de superposición A(k)ei(kx-wt) satisfacen el requisito de continuidad de las funciones de onda, la suma real, según lo expresa (4.9-19), no satisface este requisito para x =±a. Esta violación de los requisitos formales no introduce, por tanto, ningún error en los cálculos ya que, evidentemente, la función del pulso cuadrada (4 9-19) se puede "redondear" muy cerca de x =±a para satisfacer la condición de continuidad sin introducir ninguna alteración significativa en la forma de la función A(k). 98 Mecánica cuántica. Generalidades o bien, e = .J~/(2rr). (4.9-20) Entonces, 1 'k 'P(x,O) = J~ e' ""' =0 (- a/2 < x < a/2) (4.9-21) (x > af2;x <- a/2) En otras palabras, si A(k) se escoge como en ( 4.9-12), con e= ,jíi/(2rr), la función de onda en el instante t = O, dada por ( 4.9-15), se puede expresar en la forma sencilla (4.9-21). La amplitud de probabilidad 'lt*(x, O)'lt(x, O) existente en t = O es, entonces, la de la figura 4.6 y la "partícula" se localiza dentro de una distancia & = a alrededor del origen. Sin embargo, para lograr esta localización, es necesario introducir una superposición de funciones de ondas estacionarias correspondientes a varios valores de k y, por ende, a varios valores de can ti dad de movimiento lík. Las amplitudes relativas de las diversas componentes en la sup~osición, están dadas por la función A(k) y, por tanto. por (4.9-12) siendo e=ya/(2rr). En la fi~ura 4. 7 aparece una gráfica de estas amplitudes de contribución en función de ka. Las principales contribuciones provienen de la región cercana a k = k 0 y la contribución desciende rápidamente para componentes con valores de k mucho mayores o mucho menores que k 0 • Se puede considerar que las contribuciones a la superposición de valores de k mayores que k 0 ++~ y menores que k 0 -+~ son despreciables, siendo ~ un parámetro que expresa la anchura efectiva de la parte de la curva de A(k), en donde A(k) asume valores que no son pequeños en comparación al valor máximo A(k 0 ). Si arbitrariamente se escoge un valor tal de ~ que t:J...ka) = 8rr, o sea, una posición correspondiente al segundo cero de la curva a ambos lados de k= k 0 , -siendo ésta una selección ;azonable de acuerdo con el criterio anterior- se tiene que Ak = 8rrfa. (4.9-22) A(k) Figura 4. 7. lli~trihudón de la amplitud de la cantidad de movimiento correspondiente a la ·'lnplltud de (Hl'h.lhilida<l fl<' la figura 4 6. La partícula libre y el principio de incertidumbre 99 El producto de la distancia Ax dentro de la cual se puede considerar que se localiza la partícula, y la incertidumbre !lk en la cantidad de movimiento que se introduce mediante la superposición de estados requerida para lograr esta localización, es 8n ó.k · ó.x =-·a= 8n, a o bien, puesto que k = p/h, ó.p · ó.x = 8nli. (4.9-23) Olvidando los valores numencos que se obtienen de la selección arbitraria de un punto de corte para !::k, y utilizando el símbolo - para indicar "del orden de'', se puede escribir (4.9-24) ó.p . ó.x - li. Para una partícula libre cuya cantidad de movimiento se caracteriza por un valor único singular de k, la "partícula" se extiende a lo largo de todo el espacio. Si la partícula debe estar dentro de una región dada del espacio, entonces, su función de onda, que ahora se debe considerar como una superposición de funciones de estado estacionario con diferentes valores de k, se caracteriza por un "despliegue" de valores de cantidad de movimiento tal que se obedezca a (4.9-24), según se ilustra en la figura 4.6. Fste es un ejemplo específico de un efecto conocido con el nombre de Principio de incertidumbre de Heisenberg, el cual es una consecuencia muy general deducida de la descripción de la naturaleza en términos de la mecánica ondulatoria. El principio de incertidumbre establece que la posición de una partícula y su cantidad de movimiento no se pueden definir simultáneamente con precisión arbitraria; cualquier experimento que se realice para asegurar que la partícula se localizará dentro de una región dada del espacio, introducirá inevitablemente una mcertidumbre en su cantidad de movimiento, que estará dada por (4.9-24). Se debe recalcar el hecho de que este efecto es independiente de la precisión experimental con que se pueden medir las cantidades de que se trata y, en realidad, es una propiedad que tiene la materia en observación. Por lo general, se puede demostrar que las relaciones de incertidumbre tales como ( 4.9-24) existen entre todos los pares de variables dinámicas conjugadas que se podrían usar clásicamente para especificar por completo el estado de movimiento del sistema. Powell y Craseman 4 han escrito un análisis completo y detallado de este tema. Si en (4.9-24) se escribe Ax = v t:.t, en donde v es la velocidad, se obtiene V Ó.p Ó.t "' Ji. (4.9-25) Puesto que, para una partícula libre, E= p 2 /2m, ÁE = p fjp/m = v fjp, (4.9-25) se puede expresar como sigue ó.e · ó.t - li. (4.9-26) Por tanto, la relación de Heisenberg (4.9-24) también se puede expresar como la incertidumbre de energía del tren de ondas multiplicada por la duración de éste. Conviene observar que el comportamiento del "paquete de ondas" que se estudió con anterioridad, se puede expresar como una función del tiempo por medio Powell y B, Craseman, Quantum Mechanics, Addison-Weslcy, Reading. Mas~, (1961) 69-76; páginas 182-184, 4 J, L. pág~nas 100 Mecánica cuántica. Generalidades de (4.9-11), con A(k) según la da (4.9-12). Se puede demostrar que el máximo de la amplitud de probabilidad "11'*"11' se mueve a la velocidad constante hk0 fm, correspondiendo a una cantidad de movimiento constante hk0 según lo predice la m'ecánica clásica. Además de este movimiento clásico del paquete como un todo, también se sabe que el paquete se despliega conforme transcurre el tiempo, en tal forma que siempre se satisface la relación de incertidumbre ( 4.9-24). En los casos de paquetes de ondas que representan objetos grandes o masivos localizados dentro de distancias macroscóp;r ente observables, este efecto de despliegue es tan pequeño que es indetectabh: a una escala de tiempo razonable. s 4.1 O UNA PARTICULA EN UN POZO DE POTENCIAL UNIDIMENSIONAL E INFINITAMENTE PROFUNDO En este ejemplo se examinará el comportamiento de una partícula ubicada en el pozo de potencial unidimensional que se ilustra en la figura 4.8. Para este sistema, se tiene que V(x) =O =00 (O< x <a) (x <O; x >a). (4.10-1) En la región (O <x <a), en donde V0 , la ecuación de Schrodinger independiente del tiempo (4.8-5) se puede reescribir como sigue (4.10-2) en donde k= J2me/1i 2 • V(x) .. ' (4.10-3) . V=O-L....--~-x X=O 1 Figura 4.8. Prt:'~~. X=o 1 Un "pozo" de potencial infinitamente profundo. s L Ikcnherry, Quantum Mechanics for Mathematicians and Physicists, Oxford University Nut>va York (1962}, r:ígina 64. Una partícula en un pozo de potencial unidimensional 101 En esta región, la partícula es libre y la solución ( 4.1 0-2) se puede expresar en la forma (4.9-3). Sin embargo, es más conveniente escribirla en la forma equivalente t/J(x) =A sen kx + B cos kx (0 < x <a), (4.10-4) en donde A y B son constantes arbitrarias. Puesto que la partícula está limitada por barreras de potencial infinitamente altas en x = O y x =a, se supondrá que t/J(x) =O (x <O; x >a). (4.10-5) Esta suposición, que parece ser físicamente razonable, se justificará más tarde en la siguiente sección. Si se requiere que t/l(x) sea continua en las fronteras del pozo de potencial en x =O y x =a, entonces, (4.10-4) se debe reducir a cero en esos puntos. Si se substituyen los valores x = O y x =a en (4.1 0-4) y el resultado se hace igual a cero, es evidente que B =O y que A sen ka= O. (4.10-6) Esta condición se puede satisfacer sólo cuando (n = 1,2,3, ... ), ka= nn (4.10-7) de donde, sólo para una secuencia discreta de valores de k, que se identifican como kn, en donde k. = nnfo (n = 1,2,3, ... ). (4.10-8) Puesto que k está relacionada con la energía por medio de (4.10-3), esta condición se define como un conjunto discreto de valores propios de energía permisibles li2k! n2n21i2 e=--=--• 2m 2ma 2 (n = 1,2,3, ... ). (4.10-9) En la figura 4.9 se muestra un diagrama de los niveles de energía de este sistema. En vista de los requisitos establecidos en ( 4.1 0-8), las funciones de onda del sistema deben tener la forma nnx t/l.(x) = A. sena =0 (O< x <a), (x<O;x>a), (4.10-10) en donde las constantes An están determinadas por los requisitos de normalización ( 4.8-1 0), de acuerdo con los cuales, J oo -oo t/l:t/1. dx = A! f" sen nnx dx = 1 o 2 - a (4.10-11) lo cual da A.= 1/j~. (4.10-12) 102 Mecánica cuántica. Generalidades ·¡ 25<¡ +------- 16<¡ +------- .• 4<¡ +------- •2 7T2h2 E5 o -:l=======~·~~'_2_m_u_2 Figura 4.9. Niveles de energía permisibles para una partícula que se encuentre dentro del pozo de potencial ilustrado en la figura 4.8. La dependencia del tiempo de las funciones de onda se determina fácilmente a partir de ( 4.8-7). Por supuesto, las funciones ( 4.10-1 O) son funciones propias de estado estacionario para las que '1'*'1' es independiente del tiempo. Para este sistema, se sabe que existe un sistema de niveles discretos de energía, dados por ( 4.1 0-9). La ecuación de Schrbdinger ( 4.1 0-2) dentro de la región permitida de movimiento es la misma que para una partícula libre (4.9-1) para la que se permite un rango continuo de valores de energía, y las soluciones ( 4.1 0-1 O) son simplemente combinaciones lineales de las soluciones para la partícula libre de la forma ( 4.9-3) pertenecientes a la misma energía. La diferencia entre los dos casos se basa únicamente en las condiciones de frontera las cuales, en el pozo de potencial, se pueden satisfacer sólo para un conjunto discreto de energías. La condición de continuidad de la pendiente de las funciones de onda (4.10-10) se viola abiertamente en x =O y x =a. Esta situación se origina debido a la singularidad de la función de potencial V(x) en estos puntos y no produce dificultades en la interpretación física de los resultados. Ei comportamiento de la función de onda en estos puntos se puede inferir como un caso límite de los resultados, que se verá en la siguiente sección, en donde se confirman los cálculos que condujeron a ( 4.10-1 0). Las funciones de onda ( 4.10-1 0), se pueden representar como sigue (4.10-13) en la región (O< x <a), vienen a ser superposiciOnes de ondas estacionarias de soluciones de ondas planas para las que k= mr/a y - mrja, es decir, superposiciones de una onda que se propaga en la dirección + x y otra de igual amplitud que va en dirección opuesta. Puesto que las dos componentes de la superposición poseen la misma energía, la combinación lineal ( 4.1 0-13) es una solución de la ecuación de Schródinger independiente del tiempo ( 4.1 0-2) y, por tanto, representa todavía un estado estacionario del sistema. El cuadro físico correspondiente es el de una partícula que se refleja elásticamente en las paredes de un pozo de potencial, en x = O y x =a, y oscila rápidamente hacia un lado y otro dentro del pozo de potencial. La función de onda y la amplitud de probabilidad para la partícula en el estado energético más bajo y en un estado de energía más alto, se ilustran en la figura 4.10. De acuerdo con la amplitud de probabilidad, cuántica la probabilidad de encontrar la partícula en ciertos puntos correspondientes a ceros de 1/1*1/1 (que, en este' ejemplo, Partícula en un pozo unidimensional de profundidad finita 103 .¡,•.¡, .¡, (x) ljl(x) n (\ "- (\ o o o _K -x n~1 V V V n~a (a) Figura 4.10. V (b) Funciones de onda y amplitudes de probabilidad de dos determinados estados de energía permisibles de una partícula que se encuentra dentro de un pozo infinitamente profundo. es igual a l/; 2 , ya que ¡!; ('S real), se hace infinitamente pequeña. La amplitud de probabilidad cuántica para lo~ estados de energía más bajos no concuerda con la amplitud de probabilidad constante que se podría esperar desde el punto de vista clásico y que en la figura se ilustra por medio de las líneas punteadas. Sin embargo, para estados de energía más altos, además de la rápida oscilación de la amplitud cuántica alrededor del valor clásico como un promedio, la coincidencia es aceptable en el sentido de que el valor medio de la amplitud de probabilidad cuántica tomada sobre cualquier intervalo de longitud apreciable es casi igual a la amplitud clásica. 4.11 UNA PARTICULA EN UN POZO UNIDIMENSIONAL DE PROFUNDIDAD FINITA El comportamiento de una partícula dentro de un pozo unidimensional de profundidad finita se puede calcular, siguiendo las líneas generales del planteamiento utilizado en la sección 4.1 O. En este caso se supondrá un pozo de potencial de la forma ilustrada en la figura 4.11, en donde la profuncidad del po:w es V0 . Se deben resolver ecuaciones por separado para la función de onda en las regiones (x<-a), (-a<x<a) y (x>a), y las funciones de onda en estas regiones se denominará, respectivamente, l/1-(x), l/1 0 (x) y l/l+(x). En primer lugar, se tratará el caso de una partícula que está limitada clásicamente a permanecer dentro del pozo, es decir, una partícula para la que - V0 <e< O.* En las regiones fuera del pozo (x < -a; x >a), la ecuación (4.8-5) se convierte en (x<-a;x>a) * N. de T. La partícula posee en esta región los estados ligados. (4.11-1) 104 Mecánica cuántica. Generalidades V(x) o -a~ (x) -x -a- '~'o(x) -Vo Figura 4.11. Un pozo de potencial de profundidad finita. en donde (4.11-2) mientras que, en el pozo, en donde V(x) =- V0 , (4.8-5) se convierte en d2r/Jo 2 -d 2 + k 0 r/1 0 (x) = O (-a<x<a) (4.11-3) X en donde (4.11-4) Como se ha definido, en la condición (- V0 < € <O), k y k 0 son cantidades reales. Las soluciones generales de (4.11-1) y ( 4.11-3) se pueden expresar como sigue (x > a) (4.11-5) r/1 0 (x) = A 0 sen k 0 x + B 0 cos k 0 x (-a<x<a) (4.11-6) rf¡_(x) = A_ekx + B_e-kx (x <-a). (4.11-7) Las condiciones de frontera de la función de onda requieren que dicha función y su derivada sean continuas en x =±a y que la función de onda tienda a cero conforme x "* ± oo. Por tanto, es necesario que r/1 0 ( - a) = rf¡ _ ( - a) r/ló(a) = rf¡~(a) (4.11-8) r/ló( -a)= rf¡'_( -a) (4.11-9) 1/J_(- oo) =O, (4.11-10) en donde las primas indican las derivadas con respecto a x. En la expresión (4.11-10), es evidente que A+= B_ =O. Los cuatro coeficientes restantes se Partícula en un pozo unidimensional de profundidad finita 1OS pueden evaluar mediante la substitución de las soluciones (4.11-5,6,7) en las cuatro condiciones de frontera (4.11-8) y ( 4.11-9), de donde se obtiene un grupo de cuatro ecuaciones simultáneas de la forma =0 - A 0 sen k 0 a + B 0 cos k 0 a (4.11-11) A 0 k 0 cos k 0 a + B 0 k 0 sen k 0 a -A_ ke -ka = O. Para resolver completamente el problema, se deben determinar los valores de las cuatro constantes arbitrarias A 0 , B 0 , A_ y B+. Las expresiones (4.11-11) forman un conjunto de cuatro ecuaciones homogéneas con estos coeficientes desconocidos. Un resultado elemental de la teoría de las ecuaciones algebraicas lineales es que un conjunto de ecuaciones de esta naturaleza no pueden tener otra solución que no sea A 0 = B 0 =A_ = B+ = O, a menos que desaparezca el determinante de los coeficientes del sistema. 6 Esto significa que no existen soluciones de significado físico, a menos que e - 2ka sen k 0 a -sen k 0 a k 0 cos k 0 a k» cos k 0 a cos k 0 a cos k 0 a -k 0 sen k 0 a k 0 sen k 0 a o o -1 =0. k o o k -1 (4.11-12) Para obtener esta expresión, la can ti dad e- ka se sacó por factorización de las columnas tercera y cuarta del determinante de los coeficientes de (4.11-11). Puesto que e-2ka no desaparece para ningún valor real de ka, el determinante debe hacerlo ·a fin de satisfacer ( 4.11-12). El determinante se puede expresar como menores para dar la ecuación que se puede escribir también como (k sen k 0 a + k 0 cos k 0 a)(k 0 sen k 0 a -k cos k 0 a) =O. o, dividiendo entre cos 2 k 0 a, (k tan k 0 a + k 0 )(k0 tan k 0 a- k)= O. (4.11-13) Esta ecuación se satisface si desaparece cualquiera de los factores. Si se hace que (4.11-14) 6 Véase, por ejemplo, N. B. Conkwright, lntroduction to thc Theory of Equations, Ginn and Co., Boston (1941), páginas 144-145. 106 Mecánica cuántica. Generalidades entonces, de acuerdo con (4.11-4) y (4.11-2), (4.11-15) Al substituir esto en ( 4.11-13) e igualando cualquiera de los factores a cero, se tiene que (4.11-13) se satisface si ( 4.11-16) o bien, 1 1 1 1 1 1 1 1 t-- Curvas punteadas 1 y =-k0 ctn k0 o 1 1 1 1 1 Figura 4.12. Diagrama que ilustra la solución de las ecuaciones trascendentales de los valores propios de energía asociados con el pozo de potencial mostrado en la figura 4.11. Una de estas dos ecuaciones quedará satisfecha sólo para un conj,mto dado de valores de k 0 , que se puede representar mediante k 01 , k 02 , k 03 , • • • kon, •••. Existe un conjunto de valores propios de energía Erz que se relacionan con estos valores de k 0 , de acuerdo con (4.11-4), por medio de (4.11-17) Los valores propios kon se pueden obtener gráficamente encontrando las intersecciones de las curvas y = - k 0 ctn k 0 a y y = k 0 tan k 0 a con el círculo y = yp. 2 - k~, como se ilustra en la figura 4.12. Para cada punto de intersección se satisface cualquiera de las dos ecuaciones (4.11-16). Por tanto, existe un grupo finito específico de valores kon y un número finito de niveles discretos de energía asociados a estos valores, a través de (4.11-17). El radio del círculo y = yp. 2 - k~ de la figura 4.11 es, sencillamente, p. que está directamente relacionado con la profun- Partícula en un pozo unidimensional de profundidad finita 107 di dad del pozo de potencial por medio de (4.11-14). Para un pozo poco profundo, J1 ~O, y únicamente habrá un solo nivel de energía en el rango - V0 <e< O. Para pozos más profundos, aumenta el número de estados energéticos y para pozos muy profundos, este número es muy grande. Como se ilustra en la figura 4.12, en un pozo muy profundo, los niveles que están en la parte más baja se caracterizan por valores de kon que están espaciados equidistantemente, correspondiendo muy de cerca a los valores de kn del pozo infinito de la sección 4.10. y dando origen a niveles de energía que, con respecto a la base del pozo...,son semejantes a los del pozo infinito. En la figura 4.13 se proporcionan los diagramas de niveles de energía para varios pozos fmitos. --J ----- ------- ---------------------- Estados de energía para un pozo infinito----Estados de energía para un pozo finito ----- ---- --Figura 4.13. Representación esquemática de los niveles de energía correspondientes a pozos de potencial de distintas profundidades. Una vez se han determinado los valmes kon para los que ( 4.11-11) tiene soluciones físicamente significativas, es necesario encontrar los coeficientes A 0 , B 0 , A_ y B+. Puesto que para los valores de kon que satisfacen (4.11-16) desaparece el determinante del sistema homogéneo (4.11-11 ), las ecuaciones (4.11-11) ya no son independientes linealmente y, por tanto, lo único que se puede obtener directamente de (4.11-11) son las relaciones de los coeficientes. Sin embargo, las magnitudes reales de los coeficientes se pueden encontrar imponiendo la condición de que Una vez que se conocen los coeficientes, las funciones de onda se obtienen de (4.11-5,6,7). El cálculo exacto de los coeficientes es un procedimiento laborioso y no se presentará en detalle. No obstante, se analizarán algunas de las propiedades de las funciones de onda que se obtienen de este modo. Las funciones de onda para los estados energéticos ligados de este problema se ilustran en la figura 4.14. Antes que nada, se observará que la función de onda como un todo es una función par o bien, una función impar de x. En el ejemplo de que se trata, el estado energético más bajo es par, el siguiente es impar, el que le sigue es par, y así sucesivamente de un modo alternado. Esto se debe al hecho de que el potencial V(x) es en sí mismo una función para de x; se puede demostrar de 108 Mecánica cuántica. Generalidades un modo general que, cuando esto sucede, las funciones propias deben ser funciones pares o impares de x. 7 Figura 4.14. Diagramas esquemáticos de las funciones de bnda de los estados energéticos más bajos del pozo de potencial finito de la figura 4.11. De acuerdo con la figura 4.14 y las ecuaciones (4.11-5) y (4.11-7), se puede nr que a pesar de que la energía total de la partícula es negativa y, por tanto, de acuerdo con la representación clásica dicha partícula nunca podría sobrepasar la barrera de potencial para aparecer fuera del pozo, de hecho, la función de onda de la partícula se extiende más allá de los límites del pozo. Por tanto, de acuerdo con la mecánica cuántica, existe una probabilidad definida de que la partícula se encontrará en la región clásicamente prohibida, más allá de las fronteras reales del pozo. La función de onda de la partícula se atenúa exponencialmente en esta región y se acerca a cero en la parte que está lejos del pozo. Este fenómeno, que se conoce como penetración de barrera, es un aspecto común del comportamiento cuántico de la materia. Una partícula que se acerca a una barrera de potencial, de altura y espesor finitos, como se ilustra en la figura 4.15, tiene una probabilidad determinada de penetrar la barrera y aparecer en el otro lado, aun cuando esto pueda estar prohibido de acuerdo con la teoría clásica. La función de onda se atenúa dentro de la barrera, y si ésta es muy alta o gruesa, la atenuación se hace muy marcada y la probabilidad de penetración se reduce mucho. En mecánica cuántica este efecto se denomina túnel y se ha observado experimentalmente en dispositivos semiconductores y en capas aisladoras delgadas. Los efectos de reflexión semiconductores y en capas aisladoras delgadas. Los efectos de reflexión se pueden predecir también de acuerdo con la mecánica cuántica, para las partículas incidentes sobre una barrera, 7 Véase, por ejemplo, E. Merzbacher, Quantum Mechanics, John Wiley and Sons, Nueva York (1961), página 53. Partícula en un pozo unidimensional de profundidad finita 109 •t Vlxl ·- n -+X (O) (b) Figura 4.15. Representaciones hechas de acuerdo con la mecánica clásica (a) y cuántica (b), de una partícula que interactúa con una barrera de potencial cuya altura es mayor que la energía inicial de la partícula. La representación cuántica (b) ilustra el efecto túnel. por ejemplo, como las que se muestran en la figura 4.15, aun cuando poseen más de la energía necesaria para sobrepasar la barrera clásicamente. El efecto túnel proporciona las explicaciones generalmente aceptadas sobre la ruptura eléctrica que se produce en aisladores, la ruptura inversa en rectificadores semiconductores y la desintegración radiactiva de Jos isótopos a-emisores. Hasta ahora, este estudio se ha basado exclusivamente en la suposición de que la energía total e es negativa, dentro del rango - V0 <e< O. En el caso en que e sea positiva, es fácil apreciar en la expresión (4.11-1) que las soluciones 1/1± fuera del pozo tienen una naturaleza oscilatoria, como sucede con la solución 1/1 0 en su interior. En este caso, se encuentra que la ecuación de Schrodinger y todas las condiciones de frontera se pueden satisfacer para cualquier valor positivo de e. Por tanto, existe un rango continuo de estados energéticos permisibles y funciones propias correspondientes que se extiende en forma ascendente desde e= O en la figura 4.13. Esos estados se denominan "estados del continuo". Para ver cómo sucede esto, supóngase que las funciones propias de este rango de energía son funciones pares o impares de x; como se vio antes, esto es válido si V(x) es una función par. De dor.de, para funciones propias pares, es necesario que t/1 0 (x) = A 0 cos k 0 x (-a<x<a) (x >a) (4.11-19) (x < -a) en donde k se define ahora como k= J2me/ñ 2 (e> 0). (4.11-20) Las condiciones de frontera (4.11-8) y (4.11-9) deben aplicarse todavía, de tal manera que los valores y las pendientes de 1/1 0 (x) y 1/J+(x) sean iguales en x =a. De 11 O Mecánica cuántica. Generalidades acuerdo con ( 4.11-19), esto requiere que A 0 cos k 0 a =A+ cos ka+ B+ sen ka (4.11-21) y -k 0 A 0 sen k 0 a = -kA+ sen ka+ kB+ cos ka. Si se dividen ambas ecuaciones entre A 0 y se resuelve el grupo resultante de ecuaciones simultáneas para A+/A 0 y B+/A 0 , se tiene que A+/A 0 = cos k 0 a cos ka+~ sen k 0 a sin ka (4.11-22) ko B+/A 0 = cos k 0 a sen ka- k senk 0 a cos ka. Por tanto, siempre se pueden encontrar valores perfectamente adecuados para A+ y B+ en términos de A 0 , cuyo valor, a su vez, queda determinado por los requisitos de normalización. Esto significa que cualquiera que sea el valor inicial que se escoja para e o k, se puede encontrar una solución para l/1 0 , W+ y ¡J¡_ que satisfaga todas las condiciones de frontera, como se aseguró antes. Se puede realizar un cálculo similar principiando con las funciones propias impares y se obtendrá el mismo resultado. En la figura 4.16 se ilustra el carácter general de las funciones de onda para los estados del continuo. (O) Figura 4.16. (b) (a) Representación e~quemática de la función de onda de una partícula cuya energía tan grande que, en la representación clásica, sobrepasa los límites del pozo de potencial ilustrado. (b) División de los niveles de energía permisibles para el pozo de potencial finito, en un grupo de niveles discretos correspondientes a una partícula clásicamente ligada y a un continuo de niveles correspondientes a una partícula clásicamente no ligada. La función de onda representada en (a) pertenece al último grupo de niveles. El oscilador armónico unidimensioanl 111 Este l.stado de cosas ejemplifica un principio mucho más general. Si la energía total del sistema es tal que la partícula esté limitada clásicamente por medio del potencial V(x) para moverse en una región finita dada del espacio, se tendrá un grupo discreto de funciones propias y niveles de energía que satisfagan todos los requisitos, de las funciones de onda. Por otro lado, para partículas con energías lo suficientemente grandes para que una partícula clásica pueda escapar de cualquier mínimo de potencial del sistema, al infinito en, cuando menos, una dirección, existe también un continuo de estados energéticos y funciones propias correspondientes. 8 Los resultados de la sección 4.1 O para el pozo de potencial infinitamente profundo se pueden obtener a partir de los resultados de esta sección, si se deja que V 0 tienda a infinito. En particular, se puede ver a partir de (4.11-5) y (4.11-7) con A+= B_ =O, que si k se hace indefmidamente grande, como debe suceder para cualquier estado con un energía finita superior a la base del pozo, conforme V 0 ~ c..o, ia función de onda fuera de los límites del pozo tiende a cero. Conforme el pozo se hace cada vez más profundo, la curvatura de la función de onda se hace sumamente grande cerca de x = a y x = - a, en donde las soluciones 1/J +(x) y 1/J _ (x) se unen a la solución 1/J 0 (x), se hace aunque para una profundidad finita de pozo, la pendiente es siempre continua. Sólo en el límite, conforme la profundidad del pozo se acerca a infinito, es cuando se presenta la discontinuidad en la derivada de la función de onda en estos punto, como se mencionó en la sección 4.10. 4.12 EL OSCILADOR ARMONICO UNIDIMENSIONAL El oscilador armónico es una partícula que está ligada a una postcwn de equilibrio por medio de una fuerza proporcional al desplazamiento desde dicha posición; esta fuerza .:;e puede expresar como F = -kx = -dV(x)fdx. (4.12-1) Entonces, el potencial V(x) debe ser una parábola de la forma (4.12-2) De acuerdo con ( 4.12-1 ), la ecuación clásica de movimiento para una partícula de masa m sometida a una fuerza de este tipo es (4.12-3) cuya solución es una función oscilatoria que se puede escribir como x(t) =A sen (w 0 t- 15), (4.12-4) en donde (4.12-5) 8 Una simple prueba de estas afirmaciones se puede encontrar en la obra de L. Pauling y E. B. Wilson, lntroduction to Quantum Mechanics, McGraw-Hill Book, Co., Inc., Nueva York (1935). 112 Mecánica cuántica. Generalidades es la frecuencia clásica del oscilador y en donde A y o son constantes. Siguiendo este resultado clásico, se puede usar ( 4.12-5) para expresar la constante de fuerza k en función de w 0 y m, y volver a escribir el potencial V(x) como (4.12-6) A continuación se procederá a resolver la ecuación de Schrodinger ( 4.8-5) utilizando esta función de potencial; en este caso, (4.8-5) se convierte en d21/1 2m 2 2 dx2 + hl [e- tmw 0 x ]1/J(x) =O. (4.12-7) Para resolver esta ecuación, primeramente es necesario que (4.12-8) P = 2ef(ñw 0 ) (4.12-9) e= x.j~. (4.12-10) Entonces, de acuerdo con ( 4.12-8) y ( 4.12-9), es obvio que d21/J dx2 + (cx.p- cx.2x2)1/J(x) =O, (4.12-11) y, por lo que indica (4.12-10) observando que d2 1/f/dx 2 =cx.d 2 1/1/d~ 2 , d21/J 2 de+ <P-e >1/Jce> =o. (4.12-12) Para valores grandes de 1~1, tales que ~2 ~ (3, (3 se puede despreciar y (4.12-12) se escribe como (4.12-13) Esta ecuación se satisface aproximadamente, para un valor grande de ~. por medio de (4.12-14) puesto que d 2 1/1/de = (~ 2 - l)exp(- ~ 2 /2), lo cual satisface aproximadamente (4.12-13) si ~ 2 ~ l. Esto sugiere que las soluciones 1/1(~) para (4.12-12) podrían expresarse de manera más simple escribiendo (4.12-15) Y transformando (4.12-12) en una ecuación para la función H(~). Esto se logra substituyendo la forma ( 4.12-1 S) en la ( 4.12-12) y como resultado, ( 4.12-12) se convierte en d2 H dH --2e-+<P-t)H<e>=O. de de (4.12-16) El oscilador armónico unidimensional 113 Esta ecuación diferencial se puede resolver mediante una técnica de series de potencias, suponiendo inicialmente que 00 H(') = L ak'k' (4.12-17) k~o por lo que (4.12-18) • 00 (p- 1)H(') = L (p- 1)ak'k· k=O Si estas tres ecuaciones se suman se observa que el resultado es cero de acuerdo con (4.12-16), y se encuentra que oc O= I. [(k+ 1)(k + 2)ak+l + [(p- 1)- 2k]ak],k. (4.12-19) k=O Esta ecuación debe ser aplicable para todos los valores de ~. y, por tanto, el coeficiente de cada potencia ~ debe desaparecer por separado. (Esto se podrá ver con mayor claridad evaluando los coeficientes para la expansión de la función .f(~) = O en la serie de potencia de McLaurin; todas resultan ser cero.) Este requisito establece inmediatamente una relación de recursión entre los coeficientes ak+ 2 y ak, en donde p - l - 2k ak+2 = -(k+ l)(k + 2) ak. (4.12-20) En la solución de cualquier ecuación diferencial de segundo orden, debe haber dos constantes arbitrarias. Por tanto, sean a0 y a 1 las constantes arbitrarias fundamentales que deben determinarse de acuerdo con las condiciones de frontera, en la expresión de la serie (4.12-17) para H(~), y expresar todos los demás coeficientes en función de estos dos mediante la aplicación repetida de la relación de recursión t.4.12-20). En esta forma, es fácil ver que P-l <P- 3) a 3 =- - - - a 1 al= - - - a o 2! p- 5 a4 = - -¡-:-J a2 = a6 = - 3! <P - 1><P - 5) 4! (p- 1)(p- 5)(p - 9) 6! ao etc., ao as= a1 = <P- 3)(p- 7) 5! <P - 3)(p - 1)(P - 11) 7! etc. (4.12-21) a¡ al 114 Mecánica cuántica. Generalidades De acuerdo con (4.12-17), se de be tener H(~) = ao[1- ((J- 1) e+ ((J- 1)((J- 5) ~4- ((J- 1)((J- 5)((J- 9) ~6 + ... ] 2! 4! +a¡[~_ {J- 3 3! 6! e+ ({J- 3)({J- 7) ~S_ ({J- 3)({J- 7)({J- 11) e+ •••] 5! 7! . (4.12-22) Si en la relación de recursión (4.12-20) {3- 1 - 2k debe ser cero para algún valor del índice k, entonces, ak+l = O. Sin embargo, puesto que ak+4 es un múltiplo de ak+l y ak+ 6 es un múltiplo de ak+ 4 , etc., todos los coeficientes subsecuentes que se relacionan con ak por medio de la fórmula de recursión deben desaparecer, y cualquiera de las dos series entre paréntesis rectangulares en (4.12-22) terminaría por convertirse en un polinomio de grado k. Este fenómeno se puede producir sólo para ciertos valores enteros de {3, en efecto, de acuerdo con (4.12-20), sólo ocurre cuando {3 _ 1 es igual al doble de un entero, es decir, cuando (J- 1- 2n =O o bien, p = 2n + 1 (n = 0,1,2,3, ... ). (4.12-23) Al examinar (4.12-22), se ve fácilmente que esta terminación de una u otra serie para producir un polinomio se realiza efectivamente cuando {3 = 1, 3, 5, 7, . . . como lo predice (4.12-23). De esto resulta que las únicas soluciones de (4.12-16), que llevan a funciones de onda aceptables a través de (4.12-15), SO;'l estas soluciones polinómicas. Para entender el porqué de esto, primero se considerará la expansión en serie para la función et 2 , que se puede escribir (4.12-24) Para valores grandes de t las contribuciones de Jos términos iniciales de esta serie son despreciables en comparación con aquellos para los que k es grande. Por supuesto, esto es cierto también en la serie de (4.12-22) para H(~). En la serie ( 4.12-24), la razón del coeficiente bk+l al coeficiente bk es y para valores grandes de k, b~:2 ~ 2/k. (4.12-25) El oscilador armónico unidimensional 115 La razón de los coeficientes ak+ 2 y a k para las soluciones en serie de ( 4.12-16) está dada por la relación de recursión ( 4.12-20) y, para valores grandes de k, se puede ver claramente que también es más o menos igual a 2/k. Entonces las soluciones en serie de H(~). cuando no terminan en polinomios, se comportan como e~ 2 para valores grandes de ~- Sin embargo, de acuerdo con (4.12-15), las funciones de onda reales están dadas por (4.12-26) para valores grandes de ~- Puesto que estas funciones no siguen siendo finitas en ±oo, no son aceptables como funciones de onda para el sistema físico. Las únicas soluciones que son aceptables son aquellas que terminan como polinomios, o sea, las soluciones para las que se obedece (4.12-23). Si una de las dos series encerradas entre paréntesis angulares de (4.12-22) termina como polinomio, la solución para H(~) toma la forma H(e) = a0 (polinomio) + a 1 (serie infinita) o H(~) = a 0 (serie infinita) + a 1 (polinomio). En cualquier caso, para que la solución H(~) sea una función de onda físicamente aceptable, la constante arbitraria que multiplica la solución en serie se debe escoger en tal forma que sea cero, para que la expresión total de H(~) sea sencillamente un polinomio. Si se expresa (3 en (4.12-13) en función de e por medio de (4.12-9), es evidente que las únicas soluciones que dan las expresiones polinómicas para H(n son las que corresponden a un grupo discreto de valores propios de energía (n = 0,1,2,3, ... ). (4.12-27) Una característica notable de este sistema es que su estado más bajo de energía, para el que n = O, está representado no por e0 = O, sino por e0 = -!-hwo. En otras palabras, el estado más bajo de energía del oscilador armónico no se caracteriza por la ausencia de movimiento vibratorio, sino por una energía vibratoria mínima de "punto cero" -thw 0 . En su teoría original de la radiación de cuerpo negro, Planck supuso que los niveles energéticos de un oscilador armónico estaban dados por En= nhw 0 más que por (4.12-27). No obstante, en ese caso en particular, la energía de punto cero no establece ninguna diferencia en el resultado final. Se observará que los pozos de potencial de las secciones anteriores presentaban también este efecto de energía de punto cero. El diagrama de niveles de energía del oscilador armónico se ilustra en la figura 4.17. El espaciamiento equidistante de los niveles es una propiedad singular del pozo de potencial parabólico. Las soluciones polinómicas que representan las funciones propias del sistema, se pueden obtener de (4.12-22), considerando que (3 toma los valores 1, 3, 5, ••• 2n + 1, ••• de acuerdo con (4.12-23). Para cada uno de estos valores, cualquiera de las dos series entre paréntesis rectangulares terminará en un polinomio y todos los coeficientes más allá de cierto punto se convierten en cero. Por Jo común se escoge la constante arbitraria a0 o bien, a 1 , cualquiera que sea el caso, que multiplica el polinomio resultante en tal fom1a que el coeficiente de la potencia más alta de ~ en el polinomio es 2n( = 116 Mecánica cuañtica. Generalidades •t 15 fr •8 2 "'o 13 ñ 7 2 "'o 6 2 "'o 5 ~ hw0 4 ~ fr..,o 3 ~ ,.,o 2 ~ ñ..,o 1 Figura 4.17. 11 ñ t fr..,o o Niveles de energía del oscilador armónico cuántico unidimensional. 2<13-l )/ 2 ). Cuando se hace esto, se obtiene un grupo de soluciones polinómicas fin(~) de la forma H¡<e> = 2e H2<e> = 4e 2 H3<e> = se 3- 12 Hie> = 16e 4 - (4.12-28) 4se Hs(ü = 32es- 160e 3 + 12oe etc., Los matemáticos conocen bien estas expresiones que se denominan polinomios de Hermite; la ecuación (4.12-16) recibe el nombre de Hermite. Los polinomios de Hermite se pueden definir como (4.12-29) Se puede demostrar que la defmición (4.12-29) conduce a los polinomios que satisfacen la ecuación de Hermite (4.12-16). La demostración de esto se propone como ejercicio para el lector. Las funciones de onda reales l/ln(x) se obtienen de las soluciones polinómicas de la ecuación de Hermite por medio de ( 4.12-15) y (4.12-1 0), siendo el resultado (4.12-30) El oscilador armónico unidimensional 117 en donde a está dada por (4.12-8) y en donde la constante de normalización Nn se escoge de tal manera que Se puede demostrar 9 que esta condición requiere que (4.12-31) Las funciones de onda dependientes del tiempo 'l{ln(x, t) se obtienen a partir de las expresiones de (4.12-30) multiplicándolas por el factor e-ientfñ, de acuerdo con (4.8-7). Puesto que más adelante se compararán las propiedades del oscilador cuántico con las de su equivalente clásico, conviene analizar brevemente algunas características del oscilador clásico y, sobre todo, se debe calcular la distribución de probabilidad asociada con éste. Dado que el desplazamiento x(t) de la partícula clásica es como lo establece (4.12-4), se sigue que la energía cinética y la potencial del oscilador clásico están dadas, respectivamente, por de donde, la energía total debe ser (4.12-32) Esta ecuac10n se puede resolver para A en función de e, dando A= ..J2e/mw~, y, si se supone que la energía tiene el valor (n +-t)hw 0 (como debe ser en el caso del oscilador cuántico con el que se desea establecer una comparación directa), se obtiene, para la amplitud del oscilador clásico con esta energía A = J(T,J+i)h = J2n + 1 , mw 0 ex (4.12-33) en donde a está definida por ( 4.12-8). La amplitud de probabilidad es la probabilidad de encontrar la partícula dentro de una región dada dx alrededor del punto x. Para el oscilador clásico, esto es sencillamente, la razón del tiempo dt que la partícula pasa en esta región durante el curso de una vibración, al periodo de oscilación T( = 27r/w0 ). Puesto que dx = v(x) dt, el tiempo que permanece la partícula en este intervalo durante un periodo es 2 d t_-2dx v(x)' 9 D. (4.12-34) Bohm, Quantum Mechanics, Prentice-Hall, Englewood Clit'fs, N. J. (1951), página 305. 118 Mecánica cuántica. Generalidades ya que pasa dos veces por la región durante un periodo completo de movimiento. Dado que, de acuerdo con (4.12-4), v(t)=dx/dt=Aw 0 cos(w 0 t- 8), y, puesto que w 0 t- 8 =sen - l (x/A)= cos- 1 (1- (x/A)2)lf2, v se puede expresar en función de x por medio de -~2 v(x) = Aw 0 J 1- A 2 • (4.12-35) La fracción de tiempo que pasa en dx es P(x) dx, en donde P(x) es la ampli· tud de probabilidad clásica correspondiente a la cantidad cuántica 1/J*l/J. En vista de que esta cantidad es igual a 2dt/T, debido a lo que establece (4.12-34) y la relación T = 21T/w 0 , se tiene que (4.12-36) Si se usa (4.12-33), la amplitud de probabilidad de un oscilador clásico que tiene una energía (n + )líw 0 se convierte en -t (4.12-37) Esta cantidad se comparará con las amplitudes de probabilidad cuánticas 1/J~l/Jn obtenidas a partir de ( 4.12-30). En la figura 4.18 se ilustra el comportamiento general de las funciones de onda correspondientes al oscilador armónico. Se observará que también en este caso la función de onda penetra en la región más allá de los límites de amplitud del movimiento clásico. Además, como se puede esperar, debido al hecho de que V(x) es una función par de x, las funciones de onda son, dternadamente, funciones pares e impares de x para valores ascendentes de n. Para el estado de energía más baja, la amplitud de probabilidad clásica calculada a partir de (4.12-37), y representada por la curva punteada en la figura, no se parece en absoluto a la amplitud de probabilidad desde el punto de vista de la mecánica cuántica. La amplitud de probabilidad clásica predice que la partícula tiene una mayor tendencia a encontrarse cerca de los extremos de la región de movimiento permisible, en tanto que el resultado cuántico predice que es más posible encontrarla en el centro. Sin embargo, para un estado de mayor amplitud y de una energía correspondientemente más alta, se encuentra una coincidencia aceptable entre las distribuciones de probabilidad clásica y cuán tic a, aparte del hecho de que, como es normal, la amplitud cuántica de probabilidad oscila con gran rapidez alrededor de un valor medio semejante al resultado clásico. Conforme la amplitud y la energía relacionadas con el movimiento se hacen detectables en una escala macroscópica, los resultados cuántico y clásico no son apre.ciablemente diferentes. Normalmente existen puntos a lo largo de la trayectoria clá~ca de la partícula, en donde la probabilidad de encontrarla, según lo predice la amJ}litud de probabilidad cuántica, se hace sumamente pequeña. Ortogonalidad de las funciones propias 1 1 '1 1 1 ''1 ti '' 1 j nn -- -- - - - 1 1 n \ 1 : ¡1 1 1 1 11 '- / 1 11 ,. 119 ' ' ' 1 / / ~ lJ o :\ e 6 ( b) Figura 4.18. 4.13 (a) Funciones de onda de los estados de energía más bajos del oscilador armónico cuántico unidimensional. (b) Amplitudes de probabilidad cuánticas (curvas continuas) y distribuciones de probabilidad clásicas (curvas punteadas) correspondientes al o~cilador armónico unidimensional para dos valores de energía, if:wo y lf.l':wo. [Tomado de L. Pauling y E. B. Wilson, lntroduction to Quantum Mechanics, McGraw-Hill, Nueva York (1935).] ORTOGONALIDAD DE LAS FUNCIONES PROPIAS Y LA SUPERPOSICION DE ESTADOS Se puede demostrar que las funciones propias de la ecuación unidimensional de Schrodinger que satisfacen los requisitos físicos de las funciones de onda, presentan siempre la propiedad de ortogonalidad, es decir, que obedecen siempre la ecuación J~oo 1/1!1/Jn dx =O (m# n) =l (m= n). (4.13-1) 120 Mecánica cuántica. Generalidades Estas relaciones son una propiedad característica de la ecuación de Schrodinger y las condiciones de frontera, y se ha encontrado que se aplican sea cual fuere la función de potencial V(x) y sin que tampoco importe la forma matemática que tengan las funciones de onda. Que esto es nece~ariamente cierto, se puede comprobar escribiendo la ecuación unidimensional de Schrodinger para 1/1 n, (4.13-2) y la ecuación de onda 1/1~, que, de acuerdo con (4.7-12) y (4.8-6), debe ser d 2 t/l* 2m dx 2m - ¡r [em - V(x)]t/l!(x) =O. (4.13-3) Si la primera ecuación se multiplica por 1/1 ~, y la segunda por 1/1 n, se restan ambas ecuaciones y se integra de oo a - oo, se obtiene (4.13-4) El integrando del término del lado izquierdo de esta ecuación se puede expresar como la derivada de 1/l~(dl/ln/dx) -- 1/ln(dl/1~/dx) con respecto a x, de donde, ( 4.13-4) se convierte en (4.13-5) Para funciones de onda con un buen comportamiento físico, 1/1 y dl/1/dx tienden a cero conforme x ~ ± oo; por tanto, la cantidad de la izquierda desaparece en los dos puntos extremos y (4.13-6) Si se supone que las funciones de onda 1/1~ y 1/ln pertenecen a dos niveles de energía diferentes, de tal manera que En =1= Em, entonces, se puede satisfacer (4.13-6) si y sólo si (m '# n). (4.13-7) Para m= n, se pierde el factor En -En en (4.13-6); en este caso, de acuerdo con la forma en que se definen las funciones de onda ( 4.8-1 0), se debe tener (4.13-8) Así pues, las funciones dr onda 1/lm, 1/ln exhiben la propiedad de ortogonaltdad. La prop1cdad de ortogonalidad no está restringida a las soluciones de la ecuación de Schrodint'cr. sino que tamhién se relaciona con las soluciones características Ortogonalidad de las funciones propias 121 de una gran clase de ecuaciones diferenciales, incluyendo la de calor, la de la cuerda vibrante y las ecuaciones de ondas electromagnéticas. Se puede ver que las funciones de onda (4.10-10) asociadas con un pozo de potencial infinitamente profundo, satisfacen las condiciones de ortogonalidad ya que, como se sabe y se puede comprobar fácilmente, f mnx nnx sen - - sen - - dx = O. L L 0 L (m -:F n) (4.13-9) Aunque es más difícil hacer la misma demostración para el pozo finito y para el oscilador armónico, es cierto que las funciones de onda (4.11-5, 6, 7) y (4.12-30) que pertenecen también a estos sistemas son también ortogonales. 1 0 Supóngase ahora que se tiene un conjunto infinito de funciones propias 1/Jn(x) que son soluciones a la ecuación de Schrodinger para un potencial dado V(x). Ya se dijo que estas funciones propias deben ser ortogonales y normalizadas de acuerdo con (4.8-10), de manera que obedecen a (4.13-1). Se pueden combinar estas funciones propias en una superposición lineal, de modo que la suma represente una función arbitraria de x, sujeta a ciertas restricciones matemáticas que no son muy severas. Para entender cómo se hace esto, supóngase que una función arbitraria f(x) se puede representar como la combinación lineal de las funciones propias de tal manera que <Xl f(x) = L ant/Jn(x). n=O (4.13-10) Al multiplic<!T esta ecuación por 1/J~(x) e integrar, se encuentra que (4.13-11) En la suma, todas las integrales son cero por virtud de (4.13-1 ), excepto aquella para la que n = m, que da un valor de am. El resultado final es (4.13-12) Si se substituye este valor en lugar de am ( 4.13-1 0), es obvio que f(x) se puede respresentar como (4.13-13) en donde la variable ficticia de integración x' se substituyó con x para evitar confusiones. Para las funciones propias senoidales de la sección 4.1 O, sucede que, esta expansión es simplemente una expansión de serie de Fourier. Se pueden efectuar 10 /bid., página 219. Véase también R. V. Churchill, Fourier Series and Boundary Value Problems, McGraw-Hill, Nueva York (1941), páginas 46-52. 122 Mecánica cuántica. Generalidades expansiones similares en términos de las funciones de Hermite asociadas con el oscilador armónico, y en términos de otras funciones de onda relacionadas con otras funciones de potencial. En la sección 4.9 se vio un ejemplo de una situación en la que los valores propios y las funciones propias están distribuidos en una forma continua, en lugar de discreta. En este caso se encontró que una función arbitraria se podía representar como una combinación de integrales de las funciones propias, de la forma de una integral de Fourier. Este resultado se puede extender a las funciones propias que representan cualquier sistema cuyos valores propios tienen una distribución continua, y el resultado se puede expresar como la ecuación (4.13-13) en el límite en el que los valores propios se amontonan o concentran, después de lo cual la suma en dicha ecuación se convierte en integral. Aunque esta representación integral es importante y hay que mencionarla como dato complementario, no se analizará en detalle, ya que no se utilizará en esta sección. Su aplicación al caso de las funciones propias de la partícula libre puede verse con claridad en la exposición de la sección 4.9. La combinación lineal de las funciones propias tales como (4.13-1 O) no constituye una solución a la ecuación de Schri:idinger, independiente del tiempo relacionada con algún valor particular de energía en, ya que ha perdido la forma (4.8-7); pero, una combinación lineal de las funciones propias dependientes del tiempo de la forma 00 00 n=O n=O f(x,t) = L an '1' n<x,t) = L ani/Jix)e-i""''ll, (4.13-14) que se reduce a (4.13-10) para t =O, es efectivamente una solución para la ecuación de Schri:idinger dependiente del tiempo, (4.7-3). Esto se puede verificar de un modo directo con gran facilidad considerando el hecho de que las funciones propias independientes del tiempo 1/Jn obedecen siempre, de acuerdo con (4.8-8), a la relación .tf 1/Jn =En 1/Jn. Esto permite ver que, aunque se puede construir una superposición de funciones de onda, que obedezcan a la ecuación de Schri:idinger dependiente del tiempo, para representar cualquier función o amplitud de probabilidad en un instante dado (t = O en el ejemplo anterior), en general, la superposición de las funciones de onda no stgue representando esa misma función o amplitud de probabilidad en tiempos posteriores, debido a las diferentes dependencias del tiempo de las componentes individuales de dicha superposición. Así pues, una superposición de funciones de onda no representa por lo general un estado estacionario del sistema. Este tema ya se tocó en la sección 4.8. Si una superposición de funciones propias, tales como (4.13-14), va a utilizarse como cualquier tipo de función de onda para un sistema físico, es necesario normalizarla para que satisfaga ( 4. 7-6). Por tanto, para funciones de onda de la forma (4.13-14), se debe tener (4.13-U) En vista de los establecido por {4.13-1 ), todos los términos de la doble suma son cero, excepto aquellos para los que m = n, en donde el valor de la integral es igual a la unidad. En consecuencia, se encuentra que el requisito de normalización quedará satisfecho a condición de que los coeficientes se escojan de tal modo que (4.13-16) Valores esperados y números cuánticos 4.14 123 VALORES ESPERADOS Y NUMEROS CUANTICOS Supóngase que se hace un gran número de mediciones de una cantidad física f que es una propiedad de un sistema dinámico dado. Estas mediciones se hacen siempre sobre el mismo sistema o en sistemas idénticos que se encuentran siempre en el mismo estado. Si se conserva la propiedad f, es decir, si es constante con respecto al movimiento de dicho sistema, entonces (dentro del error experimental que se supondrá despreciable), se obtendrá el mismo valor de f en cada medición, y si se traza una gráfica de la frecuencia P(j) df con que se obtiene un valor medido en un rango df alrededor de f, será simplemente un "pico" localizado en un valor dado / 0 , que constituye el valor esperado <ft. Esta situación se ilustra en la figura 4.19(a). Si la propiedad f no se conserva en el movimiento, se puede esperar obtener resultados diferentes en cada medición y una gráfica de la frecuencia a la que se observan los valores en un rango df alrededor de f, en función de f, presentará una ··ampliación" alrededor de un valor promedio o esperado (ft, como se ilustra en la figura 4.19(b ). El grado de la ampliación estadística de las mediciones se puede expresar en términos de la desviación estándar a, que se define como (4.14-1) De acuerdo con esto, es evidente que si f es siempre lo mismo que (ft, como sucede en la distribución "pico" de la figura 4.19(a), entonces, a= O, mientras que si f y <ft no son siempre iguales, entonces a es la desviación de raíz cuadrada media de los valores de f en relación con el promedio. La expresión (4.14-1) puede escribirse en diferente forma, haciendo notar que P(f) p (f} fo ( = <t>l (al Figura 4.19. <t> (b} (a) Distribución estadística de muchas determinaciones relativas a una cantidad que es una constante del movimiento (b) Distribución análoga Lurrespondiente a una cantidad que no es una constante del movimiento. le donde, (12 = <12> - 2(/)(f) + <!>2 = <!2>- (!)2. (4.14-2) 124 Mecánica cuántica. Generalidades Uno de los postulados fundamentales es que el valor esperado de una cantidad dinámica está dado por (f) = f~"' 'P*fop'P dx, (4.14-3) en donde fop es el operador correspondiente a la variable dinámica f y en donde 'IJ1 representa la función de onda del sistema para el que se mide f Ahora se investi· garán ciertos valores esperados relacionados con el operador de energía (- h/iXofot), primeramente, para un sistema en uno de sus estados propios, y luego para el mismo sistema en un estado que se representa como una superposición de dos estados propios. En primer lugar, es obvio que para cualquier sistema, el valor esperado de energía (e), se puede calcular a partir de la función de onda dependiente del tiempo 'IJ!(x,t) por medio de (4.14-3), utilizando también (4.7-4). El resultado es o'P) Ji (e) = f oo 'P* ( --:--;-dx, = foo 'P*.Jf'P dx = ($). -oo 1 ut _ 00 (4.14-4) El valor esperado de la energía es, entonces, el mismo que el del operador hamiltoniano evaluado sobre las funciones de onda dependientes del tiempo. Si 'IJ!(x,t) es una función de onda que representa un estado propio estacionario del sistema y que, por tanto, tiene la forma ( 4.8-7), ( 4.14-4) se puede expresar como sigue (4.14-5) El valor esperado del operador hamiltoniano y, por ende, de la energía es, en este caso, el mismo cuando se toma sobre las funciones de onda independientes del tiempo 1/J(x), o bien, que sobre las funciones dependientes del tiempo 'IJ!(x,t). Puesto que :Tf, de acuerdo con (4.7-5), es un operador independiente del tiempo, no opera en factores de tiempo en (4.14-5); por tanto, estos factores se pueden mover más allá del operador :lf y cancelarse entre sí. Si la función de onda 'IJ!(x,t) es una superposición de las funciones propias de estado estacionario de la forma ( 4.13-14), 'P(x,t) = L anl/ln(x)e-ient!A, (4.14-6) " entonces, de acuerdo con (4.14-4), observando nuevamente que :lf no opera sobre los factores de tiempo, (4.14-7) Si se usa (4.8-8), que indica que :1ft/In= Ent/ln, se tiene (e) = L L e"e-i(en-em)t/A m n f"' a!anl/l!l/ln dx, -oo (4.14-8) Valores esperados y números cuánticos 125 que, en vista de la propiedad de ortogonalidad de las funciones propias, se reduce a (4.14-9) todas las integrales de (4.14-8) desaparecen excepto aquellas para las que m= n. Sin embargo, este es el mismo valor que se obtuvo tomando el valor esperado del operador hamiltoniano Yf sobre la función de onda independiente del tiempo t/l(x) = 'l'{x,O) = L a.t/l.(x), (4.14-10) porque entonces, utilizando ( 4.8-8) y las propiedades de ortogonalidad de las funciones propias, = L L a!a.e. m n foo t/l!t/1. dx = L a:a.e. = (e). -oo (4.14-11) n El operador Yf que opera sobre la función independiente del tiempo (4.14-10), es por tanto, totalmente equivalente al operador (-h/iXofot) que opera sobre la función dependiente del tiempo (4.14-6). Cuando se calculen los valores esperados para funciones de ondas superpuestas, se usará este resultado que se debe a la independencia del tiempo del operador Yf y la ortogonalidad de las funciones propias. Si el sistema se encuentra en uno de sus estados propios estacionarios, su función de onda es 1/Jn(x), y, de acuerdo con (4.14-5), (e)= (Jt") = f~oo .¡,:Jt"t/1. dx = f~oo .¡,:(e.t/1.) dx =e. f~oo t/l:t/1. dx =e•. (4.14-12) De igual manera, el valor esperado de e2 se puede determinar evaluando el operador correspondiente independiente del tiempo :lf 2 sobre la función de onda independiente del tiempo,l 1 según lo cual La desviación estándar asociaJa con una serie de determinaciones de energía sobre un sistema, en uno de sus estados propios estacionarios será, de acuerdo con (4.14-2), (4.14-12) y (4.14-13) (4.14-14) 11 Estrictamente hablando, este enunciado se debe (y se puede) demostrar mediante los métodos usados para derivar (4.14-9) y (4.14-11). 126 Mecánica cuántica. Generalidades Entonces, se obtendrá una distribución "pico" en donde cada medición dará el mismo valor de energía en. Ahora se supondrá que la función de onda del sistema es una superposición de dos funciones propias, de la forma (4.14-15) de tal manera que (4.14-16) en donde, de acuerdo con (4.13-16), (4.14-17) El valor esperado de la energía se puede evaluar ahora calculando el valor esperado del operador :if sobre la función de onda (4.14-16). Por supuesto, los resultados se pueden obtener como un caso especial de (4.4-11),.por ló cual (4.14-18) en donde and :ff 2 1 -a.= a:an. (4.14-19) Del mismo modo, el valor esperado de e2 se puede determinar evaluando y empleando la función de onda (4.14-16), lo cual da (.Yt' 2 ) = f~.., (a!t/1! + a:t/f:)Jf.Yf(amt/Jm + ant/Jn) dx = f~..,a!amt/J!.Yf(.Yft/lm) dx + f~.., a:ant/J:.1f(.Yft/ln) dx + f~.., a!ant/J!.Yt'(.1ft/ln) dx + f~oo a:amt/J:..it'(.rt't/lm) dx. (4.14-20) Sin embargo, .rt'l/lm = em 1/lm y Hl/ln =en 1/ln; al aplicar estas fórmulas dos veces a cada una de las cuatro integrales de ( 4.14-20) se obtiene (4.14-21) Las dos primeras integrales de (4.14-21) son la unidad y las otras dos son cero, debido a la ortogonalidad de las funciones propias 1/Jn. La ecuación se reduce. en este caso, a (4.14-22) Valores esperados y números cuánticos 127 La desviación estándar asociada con mediciones de energía en un sistema cuya función de onda es la superposición (4.14-15), es (4.14-23) La desviación estándar es cero sólo cuando a = O, a = 1, ó em = en; en cada uno de estos casos, la función de onda ( 4.14-16) se reduce a una sola función propia del sistema. Sin embargo, en general, se tendrá cierto "despliegue" relacionado con mediciones de energía de un sistema de esta índole, en donde las determinaciones no dan siempre el mismo valor de energía. En realidad, si se piensa un P(•) Figura 4.20. Distribución estadística de energías para sistemas cuyas funciones de onda son superposiciones de las mésima y nésima funciones propias poco, se verá que la distribución de frecuencia de "dos picos" de la figura 4.20 coincide con los valores de (e) y (e 2 ) dados por (4.14-18) y (4.14-22). Si se estudian los valores esperados de potencias más altas de e, se llegará a la conclusión de que sólo esta distribución es consistente con todos los valores esperados. 12 En la actua\\d.ad., \a \n.terpretadón. -pteva.\ec¡,den.te de este resultado es o,.ue, cuando se mide la energía en un sistema, el acto mismo de la medición hace que el sistema pase a uno de sus estados propios, si no está ya en uno de ellos, y que la probabilidad de que el valor medido de la energía esté asociado con uno u otro estado propio, es propor.::ional a la cantidad a~am relacionada con el estado propio en la función de onda de superposición. Si la cantidad a 2 asociada con el valor esperado de cierta cantidad dinámica es .::ero, se dice que esa cantidad se conserva en el movimiento o que es una constante del movimiento. De acuerdo con (4.14-14), es evidente que se conserva la energía de "Jn sistema en uno de sus estados propios. Si se puede encontrar un operador A con la propiedad de que (4.14-24) 12 C. W. Sherwin, op. cit. páginas. 118-122. 128 Mecánica cuántica. Generalidades en donde An es una constante, se dice que An es un valor propio del operador A. Para tal operador, (4.14-25) y (4.14-26) por lo cual, (4.14-27) y la cantidad dinámica representada por A se conserva, y el valor esperado del operador A está dado por el valor propio An· Evidentemente, el operador hamiltoniano Jf es tal, que sus valores propios son las energías En· Cualquier otro operador A, que posea la propiedad (4.14-24) con respecto a las funciones propias del sistema, conmutará siempre con el operador hamiltoniano, es decir, siempre se encontrará que AJf =ffA, (4.14-28) Jt' Al/In= Jt'().nl/ln) = AnJfl/ln = AnBnl/ln (4.14-29) A.tfl/ln = A(enl/ln) = enAI/1. = enA.nl/ln = ff Al/In· (4.14-30) ya que, entonces, y La inversa de este enunciado es verdad también; si un operador A conmuta con el operador hamiltoniano, como sucede en (4.14-28), el operador tiene la propiedad ( 4.14-24) con respecto a las funciones propias 1/1 n, y la variable dinámica que representa es una constante del movimiento ya que en este caso se satisface ( 4.14-27),13 Cuando se trata de sistemas más complejos, tales como el átomo de hidrógeno, que se estudia en la siguiente sección, las relaciones (4.14-24) y (4.14-28) son muy útiles para demostrar que ciertas cantidades dinámicas son constantes del movimiento. Se constatará, recurriendo a (4.14-24), que el total de la cantidad de movimiento angular orbital del electrón dentro del átomo de hidrógeno, y su componente z, son constantes del movimiento. 4.15 EL ATOMO DE HIDROGENO El átomo de hidrógeno es un sistema compuesto de un protón y un solo electrón que interactúan como resultado de su atracción electrostática mutua. El potencial clásico de este sistema es, sencillamente, V(r) = - e2 /r, (4.15-1) 13 Si se desea ver la demostración inversa ·de esta expresión, véase E. Merzbacher, op. cit., página. 160. El átomo de hidrógeno 129 en donde e es la carga electrónica y r la distancia entre el electrón y el protón. En este estudio se considerará que la masa del protón es infinita en comparación con la del electrón. En esta aproximación, cualquier movimiento del protón puede considerarse como despreciable, ya que se supone que el movimiento es el que realiza el electrón alrededor de un núcleo fijo. Puesto que la masa del protón es alrededor de 1850 veces la del electrón, esta aproximación es aceptable. El movimiento del protón se puede tomar en cuenta si se utiliza una masa reducida, como se hizo en el análisis de la sección 4.5 en relación con el átomo de Bohr. Considerando la simetría esférica del potencial (4.15-1) conviene usar el sistema de coordenadas esféricas ya conocido, donde x = r sen Ocos rjJ y = r sen Osen rjJ z = r cosO, r X Figura 4.21. Sistema de coordenadas esféricas utilizadas en el estudio del átomo de hidrógeno. como se ilustra en la figura 4.21, en donde se puede escribir la ecuación independiente del tiempo de Schrodinger como (4.15-2) con (4.15-3) En (4.15-2), m 0 representa la masa del electrón. Se puede proceder mediante la técnica ya conocida de separación de variables, en la que se supone que las soluciones tienen la forma 1/J(r,O,r/J) = R(r)E>(O)<'P(r/J), (4.15-4) 130 Mecánica cuántü:::. Generalidades en donde R(r) es una función de r solamente, independiente de 8 y 1/>; 8(8) es una función sólo de 8, y cl>(if>) es una función exclusiva de 1/>. Al substituir esta forma para la solución, en (4.15-2), observando que 3¡J¡f3r = 0cl> dR/dr, 31/1/38 = Rcl> d0/d8 y 31/1/31/> =R@Jd~/dl/>, multiplicando la ecuación resultante por r2 sen 2 8/(R~), y transponiendo, se tiene que Puesto que la expresión de la izquierda, que es una función solamente de r y 8 es igual a otra expresión que es una función exclusiva de 1/>, las dos expresiones se deben igualar por separado a una constante que, por razones que se verán en breve, se representará por medio de m 2 . A continuación se limitará el estudio, por un momento, a la última igualdad que aparece en (4.15-5). Esta se puede reacomodar ligeramente de tal modo que se lea (4.15-6) que es una ecuación diferencial cuya solución se puede escribir como sigue (4.15-7) Puesto que la función de onda completa ¡J¡ debe tener un solo valor, es necesario que cl>m(l/>) tenga un solo valor también. En otras palabras, es necesario que (4.15-8) por lo que, de acuerdo con (4.15-7), o bien, e±2,.mi =l. (4.15-9) Esta condición se puede satisfacer sólo si m es un entero positivo o negativo o bien, cero. Los valores permisibles de m están limitados, entonces, a m= O, ±1, ±2, ±3, ···, de otra manera, la función de onda tendrá múltiples valores. Ahora se comprenderá por qué la constante de separación se escogió de tal manera que se representara mediante m 2 • Si m es un número real, entonces m 2 debe ser positiva. Si la constante de separación de ( 4.1 S-5) hubiera sido negativa, las soluciones ( 4.1 S-7) habrían sido exponenciales y no sinusoidales y la condición de valor único (4.15-8) nunca se habría satisfecho. Así pues, la constante de separación se escogió de este modo para asegurar que tendría siempre un valor positivo y, por ende, excluyera inmediatamente las soluciones indeseables. El átomo de hidrógeno 131 En (4.15-5), la expresión de la izquierda se puede igualar a m 2 , y la ecuación resultante dividirse entre sen 2 fJ y reacomodarse en tal forma que se exprese como sigue 1d ( r 2 -dR) R dr dr 2 2 2 0r ( e ) = - - -1- - sde( n ( ) dE>) m =fJ, +2m- e+- +-li 2 r E> sen O d() d() sen 2 () (4.15-10) Una vez más, puesto que la primera expresión es una función exclusiva de r y la segunda lo es sólo de fJ, las dos deben ser iguales, independientemente, a una constante {3. La segunda igualdad de (4.15-10) se puede escribir en la forma 1 d ( dE>) m 2 E> sen() dO sen() d() - sen 2 () + {JE>(O) = O. (4.15-11) Esta ecuación es muy conocida en la física matemática y se denomina ecuación de Legendre. Sin entrar en muchos detalles matemáticos, 14 se observará que las únicas soluciones de esta ecuación que no violan los requisitos de lo fmito para las funciones de onda son aquellas para las que {3 tiene valores de O, 2, 6, 12, 20, • • • , de donde, para aquellas en que fJ = l(l + 1) con (l = 0,1,2,3, · · · ). (4.15-12) En estos casos, las soluciones de (4.15-11) se reducen a un polinomio en cos fJ y sen fJ más o menos en la misma forma en que las soluciones de la ecuación de Hermite se reducen a polinomios en ciertas condiciones. Estas soluciones polinómicas se pueden representar como las funciones asociadas de Legendre P'f(8), definidas por dlml Pr(()) =senlml () d(cos O)lml P,(cos O) (4.15-13) 1 d 1(cos 2 ( ) - 1)' P,(cos ()) = 211! d(cos 6)1 (4.15-14) en donde Las funciones P1 (cos fJ) son las llamadas polinomios de Legendre, las primeras de las cuales son P 0 (cos O)= 1 P¡{COS ()) = cos () (4.15-15) P 2 (cos O)= t(3 cos 2 ()- 1) P 3 (cos 9) = !(5 cos 3 ( ) - cos 9) etc. 14 Por ejemplo, véase R. B. Leighton, Principies o[ Modern Physics, McGraw-Hill Book Co., Inc., Nueva York (1959), página 168. 132 Mecánica cuántica. Generalidades Por supuesto, cuando m= O, las funciones asociadas P?(e) se reducen a los simples polinomios de Legendre P1( cos 8). La función E>( 8) de ( 4.15-11) se escribe casi siempre en la forma 0 (8) = J(2l + l)(l- m)! pm(e) lm 2( 1 + m) ! 1 , (4.15-16) siendo el factor de multiplicación Pf(8) una constante de normalización. La parte angular de la función de onda, representada como un producto de 8 1m(8) y <I>m(cf>) se escribe con frecuencia en la siguiente forma = ( -l)m J( + 21 1)(l- m)l . Pr(e)eim<J>. 4n(/ +m)! (4.15-17) Las funciones Y 1m (e ,e/>) se conocen como armónicas esféricas. Para una fuerza central en donde el potencial es una función exclusiva de r, la parte angular de la función de onda está dada siempre por ( 4.15-17), sea cual fuere la forma particular que tome V(r). La porción radial de la ecuación ( 4.15-1 O), tomando ~ = l(l + 1) como lo requiere ( 4.15-12), se convierte ahora en _1_ .!!_ (r 2 dR) + 2m 0 (s + e 2 )R(r) _ 1(1 + 1)R(r) =O. r r2 r 2 dr dr li 2 (4.15-18) Esta expresión se denomina ecuación de Laguerre. Las soluciones cuyo comportamiento en r = oo permite calificarlas como funciones de onda, son aquellas que se pueden expresar en términos de los polinomios de Laguerre. Estas funciones con las que se asocia un conjunto discreto de valores propios de la energía E, se pueden expresar como sigue _ _ Rnl(r)- ( 1 1)' ]1/2 [(2 nli2 2)3 (2n[n + /] e moe . n- - · !)3 -p¡z 1 zt+ 1 p Ln+l (p), (4.15-19) en donde 11 = 1,2,3, .... (4.15-20) y en donde (4.15-21) Las funciones L ~':/(p) son funciones asociadas de Laguerre, definidas por ds L~(p) = -1S L,(p), (p (4.15-22) en donde Lr(P) son los polinomios de Laguerre que, a su vez, se definen como d' L,(p) = eP -1 ,(p'e-P). (p (4.15-23) El átomo de hidrógeno 133 Las energías en para las que existen funciones de onda aceptables están relacionadas con los valores de n en (4.15-19) por medio de 15 (4.15-24) La ecuación ( 4.15-24) para los niveles de energía del átomo de hidrógeno concuerda con el resultado ( 4.5-8) de la teoría de Bohr; los niveles energéticos, según se ilustran en la figura 4.5, y dados por la teoría de Bohr son los mismos que los que predice la mecánica ondulatoria. Existen tres números cuánticos, n, l y m en el planteamiento de la mecánica ondulatoria para el átomo de hidrógeno. Los valores posibles de n están dados por (4.15-20). Los polinomios de Laguerre Lr(P) de (4.14-23) se pueden identificar como polinomios de grado r. Estos polinomios se pueden derivar sólo r veces antes de que el resultado de la derivación repetida dé cero como resultado. De donde, para las funciones de onda que no sean cero de la forma que se puedan obtener del polinomio Lr, el número de derivaciones s necesarias para generar la función asociada de acuerdo con (4.15-22), debe ser igual o menor que r. Entonces, para funciones de onda con significado físico, es necesario tener en (4.15-22) L:, L: s ~ r, (4.15-25) 21 + 1 ~ n +l. (4.15-26) o, en (4.15-19) Si se resta l + 1 en ambos lados de esta desigualdad, (4.15-26) se reduce a l~n-1. (4.15-27) De igual manera, la función asociada de Legendre P{'(fJ) se obtiene del polinomio de Legendre P1(cos fJ) mediante una derivación de m veces. Para una función de onda distinta a cero de la forma P{'(fJ), el número de derivaciones m debe ser igual o menor que el grado l del polinomio. Por tanto, se debe tener (4.15-28) para funciones de onda de interés físico. Las condiciones expresadas en (4.15-20), ( 4.15-27) y ( 4.15-28), sirven para definir las expresiones bien conocidas para el rango posible de valores correspondientes a n, l y m, n = 1,2,3,4, ··· l = 0,1,2,3, ··· n- 1 (4.15-29) m =0,±1,±2,±3, ···±l. Por lo común los estados para los que l = O, 1, 2, 3 se mencionan como estados s, p, d y f, respectivamente. Así pues, para indicar un estado para el que n = 2 y l =O, se dice estado 2s, en tanto que uno con n = 3 y l = 2 se representa como estado 3d. 15 Los detalles matemáticos de este desarrollo están dados por R. B. Leighton, op. cit., páginas. 171-17 5. 134 Mecánica cuántica. Generalidades Las funciones de onda completas para el átomo de hidrógeno, de acuerdo con lo establecido en ( 4.15-4), deben ser (4.15-30) en donde Rn 1(r), E>,m(l1>, y <~~m(C/>) son según lo establecen, respectivamente, (4.15-7), (4.15-16) y (4.15-19), y en donde Nnlm es una constante de normalización seleccionada en tal forma que f 1/J:,ml/lnlm · r 2senO dr dO df/J =l. (4.15-31) Se encuentra que las funciones de onda (4.15-30) son ortogonales, de modo que f 1/J:I'm'l/lnlm · r 2 senO dr d(J df/J =O, (4.15-32) a menos que n = n', l = l' y m= m' simultáneamente. Las funciones de onda dependientes del tiempo se o_btienen a partir de las funciofles independientes del tiempo y multiplicándolas por e- 1 ent/fl. TABLA 4.1. Funciones de onda del átomo de hidrógeno m=O .P1oo = Nlooe-'hP 1s 1=0 1=1 (4 estados) m=O m=O m=±1 .P2oo = N2oo(2- p)e-'hP .P21o = N21ope- 'hP cos 8 .P21±1 = N211pe-~'>P sen8 e± 1"' 2s 1=0 1= 1 m=O m=O m=±1 m=O m=±1 m=±2 .P3oo = N3oo(6- 6p + p2)e- 'hP .P31o = N31op(4- p)e- 'hP cos 8 .P3t±1 = N311p(4 -p)e-'l.zP sen8 e± 1• .P32o = N32op 2e_ 'hP(3 cos 2 8- 1) .P32± 1 = N321p 2e- 'hP sen8 cos 8 e± 1"' if¡ 32 ±2 = N 322 p2e- 'lzP sen 2 8e±Z1"' m=O m=O m=±1 m=O m=±1 m=±2 m=O m=±1 m=±2 m=±3 .P4oo = N4oo(24- 36p + 12p 2 - p3)e- 'hP 4s .P4to = N4tope- 'hP(20- 10p + p2) cos 8 } 4p3 .P4t±l = N411pe-'lzP(20- 10p +p 2) sen8 e± 14> .P4zo = N42oP 2(6 -p)e- 'hP(3 cos 2 8- 1) .P42±1 = N42tP 2(6 -p)e-'hPsen8 cos 8 e± 1• .P4z±Z = N4••P 2(6- p)e-'l.zP sen 2 8 eu 1• .P43o = N43op 3e-'hP(j-cos 3 8- cos 8) .p43±1 = N43tp 3e- 'h•(5 cos 2 8- 1) sen 8 e± 1"' .P43±2 = N432p 3e-'h.Psen 2 8 cos 8 e± 21 "' .P43±3 =N433p 3e-'hPsen 3 8 e± 3'"' n=1 1=0 n=2 n=3 1=2 (9 estados) n=4 1=0 l= 1 1=2 1=3 (16 estados) N nlm } 2p3 3s } 3p3 ) 3d' )4d' }·;, = _ [ cmoe 2 ) 3 (n -1- 1)!(/- m)!(2/ + 1)]'/.z nli' 4rr(2n[n + /]!) 3(/ + m)! El átomo de hidrógeno Figura 4.22. 135 Representaciones fotográficas de la densidad de electrones asociada con varios estados propios del átomo de hidrógeno. El eje polar yace sobre el plano de la página y está orientado verticalmente. De acuerdo con (4.15-24), es evidente que la energía depende sólo del número cuántico principal n de este sistema particular. Existen muchos estados cuánticos independientes [correspondientes a los diversos valores permisibles para l y m, de acuerdo con (4.15-29)], que tienen el mismo número cuántico principal n y que, por tanto, pertenecen al mismo nivel de energía. Este fenómeno se conoce como degeneración y un nivel energético que contiene más de un estado cuántico independiente se conoce con el nombre de nivel degenerado. Gracias a ( 4.15-29), se puede ver mediante un simple recuento de los estados, que la degeneración o multiplicidad asociada con el nivel de energía En, cuyo número cuántico principal es n, es simplemente n 2 • Las expresiones algebraicas para algunas de las funciones de onda del átomo de hidrógeno se ilustran en la tabla 4.1 y, en la figura 4.22 se muestran algunas representaciones de la densidad de probabilidad de algunos de estos estados. Se observará que los estados s- (l = O) son siempre esféricamente simétricos, en tanto que los estados p-, d- y f, etc., tienen dependencias angulares que pueden ser muy complejas. El estado 2p- para el que m = O, tiene dos lóbulos que señalan hacia las direcciones ± z, en tanto que los estados 2p- para los que m = ± 1 tienen la forma de "ondas" y son simétricos alrededor del eje z. Por tanto, todos los estados 2p- 136 Mecánica cuántica. Generalidades Figura 4.22. (continúa). La escala no es uniforme en todos los diagramas. [Tomado de R. B. Leighton, Principies of Modern Physics, McGraw-Hill, Nueva York (1959).] tienen amplitudes de probabilidad que son simétricas alrededor del eje z. Se podría preguntar cuál es la razón de esta aparente preferencia por el eje z. Después de todo, el potencial V(r) es esféricamente simétrico, lo cual permite en primer lugar escoger cualquier eje polar del sistema de coordenadas esféricas, y se seleccionó éste de un modo puramente arbitrario. Entonces, ¿por qué parece que este aspecto es en apariencia preferible o, más concisamente, se prefiere en realidad este eje en un sentido físico? En la sección 4.13 se hizo notar que las superposiciones lineales de las funciones ondulatorias en estado estacionario que pertenecen a diferentes niveles de energía, no representan amplitudes de probabilidad que son independientes del tiempo. Puesto que las diversas funciones propias de estado estacionario independientes que pertenecen al mismo grado energético degenerado tienen el mismo factor de dependencia del tiempo e-iEntffi, sin embargo, se sigue que los estados de esta naturaleza pueden superponerse y la amplitud de probabilidad de la superposición sigue siendo independiente del tiempo. En la sección 4.10 se vio un ejemplo de este tipo [en relación con la ecuación (4.10-13)]. Por ejemplo, de acuerdo con la tabla 4.1 y (4.15-29) es evidente que existen tres estados independientes 2p para el átomo de hidrógeno. No obstante, no existe ninguna diferencia si se considera que El átomo de hidrógeno 137 estos estados son los mismos que se indican en la tabla 4.1 ó si se les toma como tres superposiciones linealmente independientes de dichos estados. Mediante la superposición adecuada de los tres estados dados en la tabla 4.1, se podrían producir tres funciones de onda independientes en superposición, que correspondan a las amplitudes de probabilidad con lóbulos que señalen a lo largo de los ejes x-, y- y z-, en lugar del lóbulo polar y la configuración en "dona" de las funciones de la tabla. Si se hace una superposición lineal adecuada y subsecuente de estas tres funciones de onda, se puede hacer que estos tres lóbulos señalen en cualquiera de tres direcciones ortogonales dadas. Esto demuestra que las funciones de onda de la tabla 4.1, en las que un eje polar arbitrariamente escogido parece tener un grado único o preferencial, forman sólo una representación de las funciones de onda del sistema y que, a través de la superposición correcta de estados cuánticos degenerados, se podría formar una representación en la que el eje polar estuviese en alguna otra dirección. Además, por supuesto, si así se deseara, se podría superponer el estado 2s a lo largo de los tres estados 2p. No obstante, no se podría sumar en un estado 3s o 3p y seguir conservando una amplitud de probabilidad independiente del tiempo. o3/2R/Z 3/2 2 o 1 o Figura 4.23. k R 10 ~ 1 1 10 15 Gráficas de la función de onda radial Rn¡(r) correspondiente a 11lgunos estados del átomo de hidrógeno. [Tomado de R. B. Leighton, Principies of Modern Physics, McGraw-Hill, Nueva York (1959).] En la figura 4.23 se muestra una gráfica de la función de onda radial Rn¡(r) para varios de los estados de energía más bajos del átomo de hidrógeno, y en la figura 4.24 se muestra una gráfica de la densidad de probabilidad radial, que es la probabilidad de encontrar al electrón dentro de una capa esférica de un espesor dr, alrededor del radio r. Puesto que el volumen de una capa de esta naturaleza es, 138 Mecánica cuántica. Generalidades 47rr2 dr, la densidad de probabilidad radial debe ser proporcional a r 2 R~ 1nl(r). 1 demostración de este aserto se propone como ejercicio para el lector. Los máxim< en la densidad de probabilidad radial para las funciones de onda s, como se ilust1 en la figura 4.24, son muy semejantes (aunque no idénticas) a los radios de Bot rn, según lo establece (4.5-4). Ya se observó, gracias a la ecuación (4.15-24), que el número cuántico pri1 cipal n está asociado con la energía total del sistema. Más tarde se verá que 1< números cuánticos 1 y m están relacionados con la cantidad de movimiento angul: del sistema. En el movimiento planetario clásico se conserva la cantidad de mov 25 Zr o; Figura 4.24. Gráficas de la distribución de probabilidad radial r2R~ 1 (r) para algunos estado~ d átomo de hidrógeno. [Tomado de R. B. Leighton, l'rinciples of Modern Physic McGraw-Hill, Nueva York (1959).] miento angular orbital. Como se verá en breve, esto se aplica también al plante: miento de la mecánica cuántica. La cantidad de movimiento angular clásica L de ur partícula se define por medio de L = r X p, (4.15-3: en donde p es la cantidad de movimiento lineal y r es el vector de radio a partir d un origen arbitrario hasta la partícula. De acuerdo con esta definición y el enur ciado de los operadores de cantidad de movimiento lineal (4.7-2), se puede construJ de un modo muy directo un conjunto de operadores que representen las comp< nentes cartesianas de una cantidad de movimiento angular. El resultado es L L y =zp" -xpz =~[z~-x!_] i OX oz z =xpy -yp" =~[x!_-y!_] i iJy ox . (4.15-3~ El átomo de hidrógeno 139 Estos operadores se pueden expresar de acuerdo con las coordenadas esféricas (r, O, cp) mediante una transformación de coordenadas directa, pero tediosa. En este caso, los operadores se convierten en L x li[ a - ctn () cos "~',¡,. -a<Pa] = -¡ - sen "~',~,. -ao L = ~ [cos ,¡,. 0 - ctn Osen,¡,.~] ' "~' ao ¡ (4.15-35) "~' a<P li a L.= i a<P · El operador que representa el cuadrado del total de la cantidad de movimiento angular se puede obtener a partir de (4.15-3 5) como 2 2 2 2 L = Lx + L, +L.= -li 2[ a( a) + sen1 Oa<joJ 1 sen OoO sen() ao 2 2 ] 2 • (4.15-36) A continuación se examinará lo que sucede cuando este operador opera sobre las funciones de onda 1/lnlm del átomo de hidrógeno, según lo indica (4.15-30). Se encuentra que (4.15-37) Sin embargo, el operador L 2 es independiente de r y opera sobre la función de onda producto (4.15-30) en tal forma que (4.15-37) se puede escribir como sigue (4.15-38) Si a esta expresión se aplican sucesivamente las relaciones (4.15-6), ( 4.15-11) y (4.15-12), es evidente que (4.15-39) Esta ecuación demuestra que el operador L 2 es tal que tiene la propiedad especial dada por (4.14-24) con respecto a las funciones de onda 1/lnlm· En consecuencia, de acuerdo con (4.14-27) y (4.14-25), la variable dinámica asociada con el operador debe ser una constante del movimiento y su valor esperado es h2 l(l + 1). Así pues, se conserva el cuadrado de la cantidad del movimiento angular, por lo que la propia cantidad de movimiento angular debe conservarse, y el valor esperado de la cantidad de movimiento angular debe ser (L) = J (L = lijl(l + t). 2) (4.15-40) 140 Mecánica cuántica. Generalidades En forma similar, se puede demostrar que la componente z de la cantidad de movimiento angular se conserva también. En este caso, a partir de (4.15-35) y (4.15-30), se tiene que li a li a<I>m Lzt/Jnlm = ¡ oc/J R",(r)E>,m(O)<I>m(cP) = ¡ R",(r)E>,m(O) oc/J • (4.15-41) Sin embargo, ocfJm/ocp = imeím<P = imcfJm(C/J), de donde (4.15-41) se convierte en (4.15-42) En consecuencia, el operador Lz tiene también la propiedad especial (4.14·24) y, por ende, Lz es una constante del movimiento cuyo valor esperado debe ser (4.15-43) Se conserva tanto el total de la cantidad de movimiento angular como su componente a lo largo del eje polar (cuya dirección, como ya se vio antes, se puede escoger de un modo arbitrario). El número cuántico /, que especifica el total de la cantidad de movimiento angular orbital, se denomina a veces número cuántico orbital. El número cuántico m, que especifica la componente z del momento angular, se llama a veces número cuántico magnético, ya que la degeneración de los estados que tienen los mismos valores de n y /, pero distintos para m, se pueden eliminar aplicando un campo magnético. Las orie'ltaciones posibles del vector de cantidad de movimiento angular L con las restricciones impuestas por las condiciones cuánticas ( 4.15-40) y (4.15-43), se ilustran en la figura 4.25 para los estados en los que l = O, 1 y 2. El vector L debe tener, al mismo tiempo, una longitud total dada por (4.15-40) y una proyección a lo largo del eje z establecida por ( 4.15-43). Esto da como resultado un grupo discreto de orientaciones posibles para el vector, como se indica en los diagramas. Es evidente que estos diagramas pueden generalizarse para aplicarlos a sistemas que tienen valores más altos de /. También se debe aclarar que, si se aplica un campo magnético constante a lo largo del eje z, el momento magnético del electrón dentro de su órbita (que es proporcional al total de la cantidad de movimiento angular L,="Íi f¡ Figura 4.25. 1=0 /= 1 /=2 L=O L="Íiff L,=O, ± "Íi L="Íi {6 L,=O,±"Íi ±2"Íi Posibles orientaciones para el vector de cantidad de movimiento angular bajo las restricciones impuestas por (4.15-40) y (4.15-43) para l =O, 1 y 2. El espín electrónico 141 orbital) tendrá una interacción con el campo aplicado, de modo que el átomo experimentará una fuerza que trata de alinear al vector del momento magnético (y, por ende, el vector de su cantidad de movimiento angular orbital) con el campo aplicado. Por consiguiente, los estados cuyo valor de m permite una alineación par.:ial o completa, deben tener una energía más baja que los que corresponden a orientaciones casi antiparalelas. Los estados cuánticos que tienen dife¡entes valores de m, los cuales se degeneran en ausencia de un campo magnético, al aplicarles dicho ~po se dividirán en m niveles separados aunque muy proximos uno del otro. Este fenómeno se conoce con el nombre de efecto de Zeeman. Estos resultados sirven para explicar adecuadamente las propiedades eléctricas, magnéticas y espectroscópicas observadas en el átomo del hidrógeno. En principio, los átomos de estructura más compleja se pueden manejar con los mismos métodos; por otra parte, puesto que estos átomos representan sistemas de tres o más cuerpos, no se pueden obtener soluciones analíticas de forma cerrada, debido a lo cual es necesario recurrir a la teoría de perturbaciones. Un método de esta índole se basa en la técnica de dividir el operador hamiltoniano del sistema en una parte principal .:uya solución se conoce o se puede obtener analíticamente, y una parte más pequeña que contiene todos los términos que pueden originar dificultades analíticas. O, por lo menos la mayoría de ellos. Entonces, se supone que la solución tiene la forma de una combinación lineal de funciones propias de la primera parte del hamiltoniano y las constantes relacionadas con la combinación lineal se determinan de tal modo que la función de onda sea una función propia aproximada del hamiltoniano completo. Aunque estos métodos son muy útiles para resolver una gran ,·ariedad de problemas prácticos, no se analizarán aquí con más detalle. 16 4.16 EL ESPIN ELECTRONICO, EL PRINCIPIO DE EXCLUSION DE PAULI Y EL SISTEMA PERIODICO En el cálculo de las funciones de onda y los niveles de energía de átomos con muchos electrones (He, Be, Li, etc.,) que se hace desde el punto de vista de la mecánica cuántica, generalmente se supone que cada electrón se mueve dentro de un potencial esféricamente simétrico, debido al núcleo y a una distribución espacial promedio de todos los demás electrones. En esta aproximación, la función de onda total del sistema se puede expresar como un producto de funciones de onda de un solo electrón. La función del potencial de cada electrón es esféricamente simétrica y la parte angular de las funciones ondulatorias de un solo electrón se pueden seguir expresando de acuerdo con los armónicos esféricos (4.15-17). No obstante, la porción radial de estas funciones de onda es más compleja que en el caso del átomo de hidrógeno. Debido a que las funciones de onda de un solo electrón pueden dividirse en sus partes radiales y angulares, cada electrón se puede considerar como representado por tres números cuánticos n, m y l, al igual que en el 1-tidrógeno. Sin embargo, puesto que la función radial de onda no tiene ya la forma (4.15-19), correspondiente a un simple potencial de Coulomb, los estados que tienen el mismo valor de n, pero un valor diferente de l, ya no están degenerados y la energía total del electrón depende del número cuán tic o orbital l así como de n. En vista de estas observaciones, los niveles de energía de átomos complejos se pueden calcular y ya se pueden hacer predicciones acerca de los espectros de dichos 16 Para obtener un estudio completo de este tema véase, por ejemplo, C. W. Sherwin, op. cit., capítulos 7-10 o bien, E. Merzbacher, op. cit., capítulos 16-20. 142 Mecánica cuántica. Generalidades átomos. No obstante, estas predicciones no concuerdan por completo con la experiencia, a menos que se efectúen dos correccciones adicionales. La primera de éstas es la hipótesis del espín electrónico, que fue introducida por Goudsmit y Uhlenbeck en 1925, según la cual, cada electrón, además de la cantidad de movimiento angular orbital que tenga, debe poseer una cantidad de movimiento angular intrínseco o cantidad de movimiento angular de espín, de magnitud L 8 = -!-h..J3, cuya componente a lo largo de cualquier eje de campo dado puede tener dos valores posibles hm8 = ± h/2. En consecuencia, el electrón puede existir en dos "estados de espín" correspondientes a dos valores posibles de m8 • Estos dos estados de espín se mencionan con frecuencia como estados de "espín ascendente" y "espín descendente". Se puede considerar que el electrón tienen un número cuántico de cantidad de movimiento angular total del espín s, que sólo puede tener un valor de 1/2, en cuyo caso, análogamente a lo que establece (4.15-40), la cantidad de movimiento angular del espín es (L.) = nJ s(s + 1) = nJ3¡2, (4.16-1) y un número cuántico m8 que representa la componente z de la cantidad de movimiento angular del espín que puede tener los valores ± 1/2, análogamente a (4.15-43), la componente z de dicha cantidad de movimiento es (L•• ) = m.ñ = ± ñ/2. (4.16-2) Así pues, la degeneración de todos los estados electrónicos que se producen en el hidrógeno y en átomos más complejos, se duplica debido a que haya dos estados del espín del electrón. La cantidad de movimiento angular intrínseca del electrón es una consecuencia de la relatividad y se obtuvo de los primeros principios cuando se formuló la ecuación de onda del modo covariante relativísticamente, como lo demostró Dirac en 1928. La incorporación del espín electrónico al formalismo de la mecánica ondulatoria en realidad no constituye ninguna suposición nueva en esta rama de la física. El otro factor que se debe introducir en la explicación del comportamiento de sistemas de muchas partículas, de acuerdo con la mecánica ondulatoria, es el principio de exclusión de Pauli, que establece que en un sistema dado (que puede ser un átomo, una molécula o todo un cristal compuesto de muchos átomos interactuantes), no hay dos electrones que puedan ocupar el mismo estado cuántico, considerándose los estados de espín opuestos como si fueran estados diferentes. Aplicándolo a un átomo complejo, el principio significa que no puede haber dos electrones en el átomo que posean los mismos números cuánticos, n, l, m y m8 • Para otros sistemas, esto significa que no puede haber más de g electrones que ocupen un nivel energético que se haya degenerado g veces. Aunque los electrones obedecen al principio de Pauli, hay otras partículas tales como los fotones, que no lo hacen. En general, las partículas tales como los electrones cuyo espín es múltiplo de (s = f, f, f, • • • ) obedecen al principio de Pauli, en tanto que otros, como los fotones cuyo espín intrínseco es entero (s =O, 1, 2 • • • ), no lo obedecen. Este hecho origina diferencias muy importantes en el comportamiento estadístico de los grupos de electrones y fotones, lo cual se verá en el siguiente capítulo. La adición del espín electrónico y ta principio de Pauli al planteamiento de la mecánica ondulatoria de átomos de muchos electrones, ayudó a explicar el sistema periódico de los elementos basándose en la ocupación sucesiva de los estados electrónicos de los átomos. Este enfoque se ilustra en la tabla 4.2, en donde se indica la configuración electrónica de cada átomo. El espín electrónico 143 TABLA 4.2. Configuraciones electrónicas y el sistema periódico 1s 2s H He Li Be B e N o F Ne 3s 3p S Cl A 1s 2 )2s 2 2p 6)3s 1s 2 )2s 2 2p 6)3s 2 1s2)2s 2 2p 6)3s 23p 1s2)2s22p6)Js2Jp2 1s2)2s22p6)Js2Jp3 1s2)2s22p6)Js2Jp4 1s2)2s22p 6)3s2 3ps 1s2)2s22p6)Js2Jp6) K Ca Se Ti V Cr Mn Fe Co Ni Cu Zn Ga Ge As Se Br Kr 1s 2 )2s 22p 6)3s 23p 6)4s 1s 2)2s 22p 6 )3s 23p 6 )4s 2 1s 2)2s 22p 6 )3s 23p 6 3d)4s 2 1s 2 )2s 2 2p 6 )3s 2 3p 6~d 2 )4s 2 1s2)2s22p6)Js2Jp6Jd3)4s2 1s2)2s22p6)Js2Jp63ds)4s 1s2)2s22p6)Js2Jp63ds)4s2 ls 2)2s 22p 6)3s 23p 63d6)4s 2 1s 2)2s 22p 6)3s 23p 63d 7 )4s 2 1s2)2s22p6)Js2Jp6JdB)4s2 ls2)2s22p6)Js>Jp6Jdlo)4s 1s2)2s22p6)Js2Jp6Jdlo)4s2 ls 2)2s 22p 6)3s 23p 63d 10)4s 24p 1s2)2s22p6)Js2Jp6Jdlo)4s24p2 ls2)2s22p6)Js2Jp6Jdlo)4s24pJ ls 2)2s 22p 6)3s 23p 63d 10)4s 24p 4 ls2)2s,2p6)Js2Jp6Jdlo)4s24ps ls 2)2s 22p 6)3s 23p 63d 10)4s 24p 6) ... etc. Na Mg Al Si p 4s 3d 4p ls 1s 2 ) 1s 2 )2s 1s 2 )2s 2 1s 2 )2s 2 2p 1s,)2s,2p> 1s 2 )2s 2 2p 3 1s,)2s,2p4 1s2 )2s 2 2p 5 1s2 )2s 2 2p 6) Según la representación de esta tabla, el átomo más simple, H, tiene un solo electrón, que en la configuración de energía más baja del sistema, debe encontrarse en un estado ls. El siguiente átomo, He, con dos electrones, puede tener dos electrones ls con espins opuestos en la configuración de energía más baja (o estado fundamental o basal). Esta configuración se denota con ls 2 Puesto que sólo hay dos estados relacionados con el nivel n = 1, 1 = O, el siguiente átomo más complejo, 144 Mecánica cuántica. Generalidades Li, debe tener, de acuerdo con el principio de Pauli, la configuración de estado basal ls 2 )2s, con lo cual se indica que el tercer electrón pasa al siguiente estado energético más bajo, o sea, 2s. El cuarto elemento, Be, tiene dos electrones 2s más; pero puesto que sólo existen dos estados 2s, el principio de Pauli requiere que el quinto elemento, B, tenga un electrón en el nivel 2p, que es el más bajo en energía, excepción hecha de ls y 2s; así pues, B tiene la configuración de estado basal ls 2 )2s 2 2p. Existen seis estados 2p posibles que corresponden a los números cuánticos n = 2, l = 1, m = O ± 1 y m 9 = ± 1/2. Los cinco elementos siguientes, C, N, O, F y Ne tienen un electrón 2p adicional para llenar el nivel 2p. La capa 2p llena es esféricamente simétrica y muy estable, como sucede en la capa ls llena, y los elementos Ne y He, que tienen estas configuraciones, son gases inertes. Los elementos subsecuentes llenan, entonces, las capas 3s y 3p, como se indica en la tabla, y terminan con otro gas inerte, A, que tiene una capa 3p llena con 6 electrones. Los elementos que tienen arreglos similares de los electrones externos o de valencia en los grupos n = 2 y n = 3, poseen propiedades químicas similares. Cuando se llena el nivel 3p, los dos elementos siguientes agregan electrones en los estados 4s y no en los niveles 3d, como podría esperarse. Esto se debe simplemente, a que el estado 4s tiene una energía más baja que el estado 3d. Luego viene una serie de 8 ''elementos de transición" que tienen una capa interna 3d incompleta. Cuando este nivel 3d se llena por fin, se sigue llenando la capa 4p concluyendo con otro gas inerte, Kr. El resto de la tabla se puede elaborar siguiendo, por lo general los mismos lineamientos. En todos los casos, la estructura de la capa externa de elementos químicamente relacionados, tales como Li, Na, K, Rb, y Cs es idéntica. Por tanto, es evidente que la teoría cuántica explica satisfactoriamente no sólo la estructura de los niveles energéticos observados espectroscópicamente, en el caso de los átomos complejos, sino que también explica la disposición de los átomos en el sistema periódico y la regularidad con que se distribuyen en dicha tabla las propiedades químicas de los elementos. EJERCICIOS l. Demuestre que el valor esperado de la energía es igual a la constante de separación é, para un sistema que tiene funciones de onda dependientes del tiempo, de la forma (4.8-8). Demuestre que el valor esperado del operador hamlltoniano, tomado sobre la función de onda independiente del tiempo es igual a é para este tipo de sistema. 2. Demuestre que si z 1 y z 2 son dos números complejos cualesquiera, entonces (z 1 z 2 )* = zjz~; demuestre que el conjugado complejo de una cantidad compleja expresado en forma polar feifJ (f. 8 real) es {*e-ifJ. 3. Para la partícula libre de la sección 4.9, la velocidad de fase, de acuerdo con (4.9-5) es w/k =f'k/2m =p/2m. Sin embargo, desde el punto de vista clásico, la velocidad de una partícula libre es p/m. Explique por qué discrepan en un factor de 2. 4. Verifique directamente que la función de onda (4.9-11) correspondiente a una partícula libre, satisface la ecuación de Schrodinger (4.7-3) cuando V= O. 5. Verifique la ecuación (4.9-18) expresando la función (4.9-17) como un integral de Fourier con la ayuda de (4.9-16). 6. Encuentre (x)n, {px)n, {pi>n para el nésimo estado propio del pozo de potencial infinitamente profundo de la sección 4.10, y demue~tre explícitamente que En= {p~)n/2m, para las partícula libre. 7. ¿Cuál es la razón de las amplitudes que tienen las funciones propias del continuo del pozo de potencial finito de la sección 4.11, en la región (-a <x <a), a la amplitud que hay en las regiones (x <-a, x >a)? 8. De acuerdo con la definición (4.12-29), demuestre 4ue dHn(~/d~ = 2nHn-i (~). Nota: observe que dn(xf(x))/dxn =X dnffdxn + ndn-i {/dxn-i. 9. A partir de (4.12-29), corrobore que Hn+i(~=2~n(~)- 2nHn_¡(~). 10. De acuerdo con los re~ultados de los problemas 8 y 9, demuestre que las funciones Hn(~) satisfacen la ecuación de Hermite (4.12-16). El espín electrónico 145 11. Encuentre el valor esperado de la energía potencial <v>n para el nésimo estado propio de un oscilador armónico cuántico unidimensional: Nota: use las propiedades de ortogonalidad de las funciones de onda. 12. Determine el valor esperado de la energía cinética <K>n correspondiente al nésimo estado propio de un oscilador armónico cuántico unidimensional y utilice el resultado del problema 11 para demostrar que (V)n +<K>n = hvo<n +-!), lo cual concuerda con lo que se puede mtuir. 13. Mediante la evaluación de la desviación estándar, demuestre que la cantidad de movi::~iento de una partícula libre es una constante del movimiento. 14. En relación con los estados propios del átomo de hidrógeno, demuestre que la probabi.Jdad de encontrar al electrón dentro de una capa esférica de espesor dr y radio r es r2R~ 1 (r). Suponga que los armónicos esféricos Y¡m(O, cp) están normalizados. 15. Demuestre directamente que la fórmula de la desviación estándar indica a= O para los vperadores L2 y Lz para el átomo de hidrógeno. 16. Obtenga las expresiones (4.15-36) para L2, a partir de las expresiones (4.15·35) para Lx,Ly y Lz. 17. Utilice los métodos de la sección 4.15 y demuestre que si (€") se puede evaluar como ·JI'") usando las ecuaciones de onda independientes del tiempo, entonces, (en+t) se puede :epresentar como (Jt'•+t) usando estas mismas funciones. Indique en forma inductiva la manera <!n que esto significa que {f(e)) se puede obtener a partir de (/(Jt')) empleando las funciones de ·Jnda independientes del tiempo, en donde /(€) es una función de € que se puede representar .:omo una serie de potencias convergente. LECTURAS RECOMENDADAS D. Bohm, Quantum Mechanics, Prentice-Hall, Inc., Englewood Cliffs, N.J. (1951). E. Ikenberry, Quantum Mechanics for Mathematicians and Physicists, Oxford University Press, Nueva York (1962). R. B. Leighton, Principies of Modern Physics, McGraw-Hill Book Co., lnc., Nueva York (1959). E. Merzbacher, Quantum Mechanics, John Wiley & Sons, Inc., Nueva York (1961). L. Pauling y E. B. Wilson, Introduction to Quantum Mechanics, McGraw-Hill Book Co., lnc., Nueva York (1935). J. L. Powell y B. Craseman, Quantum Mechanics, Addison-Wesley Publishing Company, Inc., Reading, Mass. (1961). C. W. Sherwm, lntroduction to Quantum Mechanics, Holt, Rinehart and Winston, Inc., Nueva York (1959). J. C. Slater, Quantum Theory of Matter, McGraw-Hill Book Co., Inc., Nueva York (1951). CAPITULO 5 Mecánica estadística. Generalidades 5.1 INTRODUCCION El objetivo de la mecamca estadística es analizar el comportamiento de un gran conjunto de partículas o sistemas idénticos, en una forma estadística o probabilística, derivando los valores más probables de las propiedades del conjunto sin inquirir en detalle los valores de estas propiedades para una partícula dada en un momento determinado. Este estudio se limitará a un conjunto de sistemas idénticos que se supondrán independientes unos de otros, excepto que pueden actuar entre sí o con el medio ambiente externo, sólo a través de procesos instantáneos que conservan la energía y la cantidad de movimiento. Por ejemplo, estos sistemas podrían ser las partículas de un gas monoatómico ideal de partículas libres que pueden interactuar unas con otras o con el medio circundante, interviniendo en colisiones instantáneas, o bien podrían representar sistemas de otros tipos. Los campos de fuerza externos (eléctrico, magnético o gravitacional, etc.,) también pueden ejercer su influencia en estos sistemas. En tales circunstancias, se puede tratar a ::ada sistema de un modo independiente de los demás, y se puede describir el comportamiento de cualquier sistema de acuerdo con sus coordenadas en un espacio de fase sesquidimensional cuyas coordenadas son (x, y, z, Px, Py. Pz). Se supone que estas coordenadas son independientes y ortogonales, y la especificación completa del estado de movimiento de cualquier partícula perteneciente al conjunto se expresa asignando valores a estas seis coordenadas espaciales; entonces, su comportamiento subsecuente se puede describir, en principio, basándose en estos conocimientos. El postulado básico de la mecánica estadística es que la probabilidad a priori de que un sistema esté en cualquier estado cuántico dado, es la misma para todos los estados cuánticos del sistema. Esto significa, por ejemplo, que la probabilidad a priori de que una partícula libre se encuentre dentro de una región (Ax, Áy, &) alrededor de (x, y, z) es la misma para todos los valores de x, y, z, y la probabilidad de que su cantidad de movimiento esté comprendida dentro de una región (¡jpx, ¡jpy, ¡jpz) alrededor de (px,Py.Pz) es idéntica para todos los valores de (px, Py, Pz). Se debe subrayar el hecho de que este postulado se refiere sólo a las probabilidades a priori, es decir, a las probabilidades que prevalecen en ausencia de cualquier restricción dinámica. Las probabilidades a priori en cualquier conjunto de sistemas se modifica casi siempre mediante restricciones externas impuestas al sistema, tales como requisitos de que el número total y la energía total de todos los sistemas que pertenecen al conjunto se mantengan constantes. 147 148 Mecánico estadística. Generalidades Primero se tratarán las partículas pertenecientes al conjunto, como si fueran las clásicas "bolas de billar," considerando que se pueden distinguir unas de otras y suprimiendo que un número cualquiera de ellas puede encontrarse en un solo estado cuántico. Después de esto se investigará el efecto que tiene el principio de exclusión de Pauli y cuál es el efecto de la imposibilidad de identificación de las partículas elementales que se están estudiando. Se recurrirá con mucha frecuencia a los resultados del capítulo anterior e, incluso, en el caso del planteamiento estadístico de las partículas clásicas, se utilizará el marco cuántico de los niveles energéticos y los estados cuánticos, aunque no sea absolutamente necesario hacerlo, con el fin de conservar la misma consistencia y uniformidad. 5.2 LA FUNCION DE DISTRIBUCION Y LA DENSIDAD DE LOS ESTADOS Para calcular las propiedades promedio de un conjunto de partículas, por lo general se necesita conocer la forma en que dichas partículas están distribuidas, en promedio, en lo que respecta a la energía. Si el número promedio de partículas del sistema que ocupa un solo estado cuántico de energía e se designa como f(e) y si se hace que g(e)de sea el número de estados cuánticos del sistema, cuya energía está dentro de un rango de alrededor de e, entonces, el número de partículas del sistema cuya energía está dentro del rango de alrededor de e está dado por N(e)de, en donde N( e) de = f(e)g(e) de. (5.2-1) La cantidad f(e), como se definió antes, se denomina función de distribución del sistema, y depende de las probabilidades relacionadas con la distribución de las partículas del sistema entre los estados cuánticos disponibles. La cantidad g(e), que depende sólo de la forma en que los estados cuánticos mismos están situados en lo que respecta a la energía, se llama densidad de los estados. Si se conocen estas dos cantidades, el valor promedio de cualquier cantidad a que se puede expresar como una función de la energía total e, se puede evaluar como f f ~f rx(e)N(a) de <!X> = " - - - : o - - - N(e) de = rx(e)f(e)g(e) de, (5.2-2) la integral de N(e)de tomada sobre todos los valores posibles de e da simplemente N, que es el número total de partículas del sistema. Si la cantidad a es una función de las coordenadas del sistema q¡( = x,y,z, para i = 1, 2, 3, respectivamente) y las cantidades de movimiento p¡( = Px• Py. Pz, en la misma forma) que no se puede expresar como una función exclusiva de la energía total e, entonces e se puede expresar como La función de distribución y la densidad de los estados 149 una función de las coordenadas y las cantidades de movimiento, como la suma de las energías cinética y potencial, 1 " , + V(q¡), ¡¡ = -2 L. p¡ m¡ (5.2-3) y el valor promedio de ex evaluado como una integral sobre las coordenadas del espacio de fase como JI (a.)= a.(p¡.q¡}f(p¡,q¡) dp dq . (5.2-4) JJJ(p¡,q¡} dp dq En este caso, f(p¡, q¡) representa la función de distribución .f(E) en donde E se expresa en función de p¡ y q¡ por m~dio de (5.2-3), y las cantidades dp y dq representan los elementos de volumen en el espacio de cantidades de movimiento y en el espacio de coordenadas expresadas en cualquier forma (cartesianas, cilíndricas, esféricas, etc.) que pueda ser conveniente para la integración. La ecuación (5.2-4) no contiene ningún factor de densidad de estados g{p¡, q¡) debido a que, como se verá en breve, en sistemas del tipo que se está estudiando, la densidad de los estados cuánticos en el espacio de fase es constante y se cancelan en el numerador y el denominador de (5.2-4). Las expresiones (5.2-2) o (5.2-4) se mencionarán con frecuencia cuando se calculen los promedios. Puesto que el factor de densidad de estados g( E), según se define en relación con (5.2-1), depende sólo de la dtstribución de los estados cuánticos del sistema en cuanto a la energía, debe existir la posibilidad de calcular g{E) a partir de la solución de la ecuación de Schrodinger. Esto se puede hacer en relación con las partículas libres tal y como se definieron en la sección 5.1, suponiendo que el sistema está confinado en el interior de un recipiente rígido cuyas dimensiones son x 0 ,y 0 ,z 0 en las direcciones x-, y- y z-, respectivamente. En efecto, este recipiente es un pozo de potencial infinitamente profundo para las partículas que se encuentran en su interior, siendo el potencial igual a cero para cada partícula que se encuentra dentro del recipiente, a condición de que las interacciones de las partículas estén restringidas a colisiones instantáneas. En este caso, dentro del recipiente, la ecuación de Schrodinger se puede escribir de acuerdo con ( 4.8-5) como sigue (5.2-5) en donde (5.2-6) De acuerdo con los resultados dados en las secciones 4.10 y 4.11, se puede llegar a la conclusión de que 1/1 =O, fuera del recipiente. De acuerdo con (4.9-3), se puede esperar que una solución válida para (5.2-5) sería una onda plana de la forma (5.2-7) Se puede verificar con facilidad que, en efecto, esta solución satisface lo establecido en (5.2-5). En realidad, la ecuación (5.2-7) se puede obtener como una solución de (5.2-5) mediante la técnica de separación de variables que se usó con el lSO Mecánict1 estadística. Generalidades átomo de hidrógeno, suponiendo inicialmente una solución de producto de la forma t/1 = X(x) Y(y) Z(z). Sin embargo, para que (5.2-7) sea una solución de (5.2-5), las cantidades kx, ky y kz de (5.2-7) se deben relacionar en tal forma que (5.2-8) y, en este caso, se puede considerar que estas cantidades se comportan como las componentes de un vector k que se conoce como vector de propagación. Si se estudia el carácter físico de la función de onda dependiente del tiempo que se relaciona con (5.2-7) por medio de (4.8-7), 'P(x,y,z,t) = Aei(k·r-wr) (5.2-9) (w = efh), debe ser evidente que la dirección de k es la misma que aquella en la que avanza el frente de la onda. La explicación física real de esto quedará asignada como tarea para el lector. Utilizando los métodos desarrollados en el último capítulo, se puede demostrar que el valor esperado de la cantidad de movimiento vectorial p está dado por (p) = hk, (5.2-10) y que p (y, por tanto, k) es una constante del movimiento. Para las condiciones de frontera, se requerirá que la función de onda en cualquiera de las caras del recipiente sea igual a la de la cara opuesta. Estas condiciones de frontera periódicas o cíclicas se vieron con anterioridad en relación con las vibraciones de red (sección 3.3). En una geometría unidimensional, estas condiciones de frontera representan un sistema que equivale topológicamente a un anillo. En tres dimensiones, las condiciones periódicas de frontera dividen todo el espacio en regiones exactamente similares cuyas dimensiones son (x 0 , y 0 , z 0 ), siendo la función de onda la misma en cada una de ellas, y cualquiera de estas regiones se puede usar para representar el interior del pozo de potencial correspondiente al recipiente. Procediendo de esta manera y suponiendo que los bordes del recipiente se extienden a lo largo del eje x desde O hasta Xo, a lo largo de la dirección y, de O a y 0 y en la dirección z, de O a z 0 , las condiciones de frontera se convierten en tf¡(O,y,-z) = tf¡(x 0 ,y,z) t/l(x,O,z) = tf¡(x,y 0 ,z) (5.2-11) tf¡(x,y,O) = tf¡(x,y,z 0 ), lo cual requiere que en (5.2-7) se tome (nx = 0,± 1,±2, ···) (ny = 0,± 1,±2, ···) (nz = 0,± 1,±2. ··· ), (5.2-12) La función de distribución y la densidad de los estados 151 y luego, (5.2-7) se reduce a 1/l(x,y,z) = Ae lni(nxx + nll'y + ~) xo Jlo zo • (5.2-13) De acuerdo con (5.2-2) y (5.2-6), esto significa que sólo es permisible un grupo discreto de valores de energía dados por (5.2-14) De acuerdo con (5.2-10), los valores permisibles de (kx, ky, kz) se pueden expresar como los valores permisibles de (px,Py,Pz) en la forma Py = hny/Yo (5.2-15) Si se graficaran todos los valores permisibles de la cantidad de movimiento, haciéndolos corresponder a todos los valores enteros posibles de (nx, ny, nz) en (5.2-15), como puntos en un espacio ortogonal de cantidad de movimiento cuyas coordenadas son (px, Py, Pz ), se obtendría una red ortogonal simple de los puntos,• que representan los valores permisibles de la cantidad de movimiento, en donde las dimensiones de la célula unitaria (h/x 0 , h/y 0 , h/z 0 ) corresponden a los cambios unitarios en (nx, ny, nz) en (5.2-15). El volumen del espacio de cantidad de movimiento correspondiente a un solo estado cuántico del sistema es, simplemente, el volumen de la celda unitaria (5.2-16) en donde V es el volumen físico del recipiente. De acuerdo con esto (y con la gráfica de los puntos que representan las cantidades de movimiento permisibles), se observa que la densidad con la que están distribuidos los estados cuánticos permisibles en el espacio de cantidad de movimiento, es uniforme sobre todo el espacio, [lo cual se mencionó anteriormente en relación con las ecuaciones (5.7-4)]. En (5.2-16), no se tomó en cuenta el espín; para partículas con espín de l/2, como los electrones, existen dos estados permisibles de cantidad de movimiento por cada punto reticular dentro del espacio de cantidad de movimiento correspondientes a las dos orientaciones posibles de espín de la partícula. Si se toma esto t'n cuenta, (5.2-16) debe escribirse en la forma (5.2-17) Para valores grandes de x 0 ,y 0 y z 0 , tales como los que se relacionan con un recipiente de dimensiones macroscópicas, el volumen VP de (5.2-17) se hace muy pequeño y los estados de cantidad de movimiento (5.2-15) y los estados de energía (5.2-14) se concentran excesivamente en comparación con los intervalos de energía y cantidad de movimiento que se pueden apreciar macroscópicamente. Entonces, para un sistema de dimensiones razonables, estará justificado el considerar que los valores permisibles de energía y cantidad de movimiento están distribuidos t'n una forma substancialmente continua dentro del espacio de cantidad de movimiento. 152 Mecánica estadística. Generalidades Ahora se verá una superficie dentro del espacio de cantidad de movimiento (px, p , Pz), estando todos estos puntos a una energía constante e. De acuerdo con (5.2-6), (5.2-8)__rj_5.2-10), la ecuación de esta superficie debe ser la de una esfera de radio p = ..j2me, o bien, P2 = Px2 + Py2 + Pz2 = 2 me. (5.2-18) Esta superficie aparece ilustrada en la figura 5.1. En esta misma figura se muestra una esfera similar cuya superficie representa todos los puntos de energía e + de. La capa esférica entre estas dos esferas representa la región del espacio de cantidad de movimiento correspondiente a las energías comprendidas en el rango de e a e +de. El volumen del espacio de cantidad de movimiento contenido dentro de. esta capa es dVP = 4n:p 2 dp. (5.2-19) Sin embargo, de acuerdo con (5.2-18), p dp =m de, (5.2-20) dVP = 4n:p ·m de= 4n:mjlme de. (5.2-21) por lo cual, El número de estados cuánticos que se pueden encontrar en este volumen del espacio de cantidad de movimiento se determina dividiendo este resultado entre el volumen de tal espacio, relacionado con un solo estado cuántico dado por (5.2-17). Por definición, el resultado 8 fin:v 3 2 g(e) de = "h 3 m' J-e de, (5.2-22) es el factor de densidad de estados que se menciona en (5.2-1). Por supuesto, este resultado se refiere sólo a las partículas libres suje~as exclusivamente a interacciones tales como choques instantáneos. Para otros sistemas, sobre todo aquellos en los que Cantidad de movimiento p, energía • Cantidad de movimiento p + dp, energía • + d• P, Figura 5.1. Superficit>s esféricas correspondientes a energías constantes e y e +de graficadas en el c<pacio de cantidad de movimiento (px, Py, Pz) de una partícula. La distribución Maxwe/1-Boltzmann 153 se produ..~.: L'!n3C..-iooes mutuas de largo alcance entre partículas, el factor de densidad de esudos sería mucho más complejo. Así también, el resultado (5.2-22) pertenece estrictamente hablando sólo a un recipiente de la forma de un sólido rectangular. No obstante, puesto que sólo en el resultado fmal aparece el volumen d~l recipiente, por simple intuición se deduce que se obtendría la misma densidad de ntados para un recipiente de volumen semejante, independientemente de su forma. Se puede demostrar que esto es verdad. 5.3 LA DISTRIBUCION MAXWELL-BOLTZMANN Si no existen restricciones respecto a los valores de energía y cantidad de movimiento que una partícula del sistema pueda poseer, la probabilidad asociada con todos los estados cuánticos es la misma y el promedio del número de partículas por estado cuántico será independiente de la energía. Esto significa que la función de distribución fte) será constante. Esta simple situación no es muy importante desde el punto de vista físico, ya que un sistema que está térmicamente aislado del medio que lo rodea debe obedecer la restricción de que la suma de las energías de todas las partículas del sistema debe ser constante, y éste es precisamente el tipo de sistema que se estudiará aquí. En este caso que es más apegado a la realidad se reduce la proporción de partículas que ocupan estados de energía sumamente altos, y la función de distribución ya no es constante con respecto a la energía. Para determinar cuál es la función de distribución en estas condiciones, será necesario proceder en primer lugar de acuerdo con los lineamientos clásicos, imagi· nando que las partículas del sistema son objetos identificables tales como las bolas de billar numeradas. Todo esto se hará dentro del marco de los estados cuánticos y los niveles de energía, aunque, haciendo caso omiso del principio de exclusión de Pauli, se permitirá que un número de partículas ocupe un estado cuántico dado del s1stema. Se supondrá que se trata de un sistema aislado de N partículas distinguibles, .:on una energía total constante U que se puede distribuir entre n niveles de energía e1 , e2 , e2 , • • • e¡, • • • En. Desde el punto de vista estadístico, el conjunto tendrá la distribución de energía que corresponde a una distribución aleatoria de partículas entre los niveles, y en donde el número de cada nivel está dado por .V 1 ,N2 ,N3 , · ··N¡,···Nn. De todas las distribuciones fortuitas de N partículas ~ntre n niveles energéticos, algunas ocurrirán con una probabilidad relativamente alta desde un punto de vista puramente estadístico, y otras serán muy poco probables. Esta situación es análoga al hecho de lanzar simultáneamente dos monedas en las que la distribución (1 águila, 1 sol) es más probable que la distribución (2 águila, O sol) o bien, (O águila, 2 sol). La distribución que tiene la máxima probabilidad de ocurrir es la distribución de partículas entre niveles que se pueden producir dentro de un número máximo de formas estadísticamente independientes. En consecuencia, se supondrá que el estado de equilibrio del sistema corresponde íntimamente a esta distribución estadística de partículas entre niveles que tienen la máxima probabilidad en las condiciones del problema. El cálculo del número de maneras en que las partículas identificables se pueden distribuir entre los niveles energéticos de un sistema, equivale a la determinación del número de formas en que una cantidad de objetos numerados se puede distribuir entre un conjunto de recipientes también numerados. Así pues, es necesario estudiar el problema de determinar la cantidad de formas para distribuir N objetos identificables entre n recipientes, de tal manera que haya N 1 en el primero, N 2 en el segundo, • • • , N¡ en el iésimo, etc. Este número será proporcional a la probabilidad 154 Mecánica estadística. Generalidades con la que pueda ocurrir una distribución en donde N 1 , N 2 , • • • , Nn objetos se encuentran dentro de los recipientes 1, 2, 3, • • • , n. En primer lugar, se supondrá que se cuenta sólo con dos recipientes en los que se pueden colocar los objetos, como se ilustra en la figura 5.2. En general, se tendrán N 1 objetos dentro del recipiente 1 y N 2 en el recipiente 2, con N 1 + N 2 = N = const. (5.3-1) Sea Q(N 1 , N 2 ) el número de formas estadísticamente independientes de llegar a la distribución (N 1 ,N2 ) de objetos en los recipientes (1, 2). Ahora, Q(O,N2 ) es evidentemente igual a 1, porque la única forma de lograr esta distribución es poner todos los N objetos dentro de la segunda caja, como se indica en la figura. De igual manera, Q(l, N 2 ) =N, ya que para alcanzar esta distribución se puede poner el objeto 1 dentro del primer recipiente y el resto en el segundo, el objeto 2 dentro del primer recipiente y el resto en el segundo, y así sucesivamente hasta N objetos. Existen N formas de seleccionar un objeto para colocarlo dentro del primer recipiente y, por tanto, N maneras de llegar a la distribución deseada. Si se tienen dos objetos dentro de la primera caja, entonces Q(2,N2 ) =N(N- 1)/2! . Este resultado se obtiene debido a que hay N formas de escoger el primer objeto que va al primer recipiente; pero sólo N- 1 maneras de escoger el segundo de los objetos restantes. Así también, las dos distribuciones en las que el objeto numerado a se escogió como el primero y el objeto numerado {J como el segundo para colocarlo dentro del primer recipiente, y en donde {J se escogió como el primero y a como el segundo, son en realidad idénticos, y los mismos dos objetos acaban por colocarse dentro de la primera caja; por tanto, el factor N(N- 1) se debe dividir entre dos. Para el caso en que se tienen tres objetos dentro de la primera caja, existen N formas de escoger el primero, N- 1 formas de escoger el segundo y N - 2 maneras de escoger el Nz Compartimiento Núm. 2 (j) ® ®---0---® Partículas Q(O,N2 ) = 1 2 Q(I,N2 )=N N formas de escoger a Q( 2 N)=N(N-I) ' 2 21 N-1 formas de escoger (3 (pero las dos distril:iuciones que aparecen a la izquierda son la misma) N formas de escoger a N-1 formas de escoger p N-2 formas de escoger 'Y (pero las 3! distril:iuciones ilustradas son la misma) Figura 5.2. Jo'ormas posibles de distribuir N partículas identificables entre dos recipientes. La distribución Maxwell-Boltzmann tercero, en tanto que hay 3! 1SS formas de permutar entre sí los objetos enumerados a, (3, y 'Y como si se les hubiera seleccionado en primero, segundo y tercer lugares, por lo que Q(3, N 2 ) = N(N- 2)/3! . Por supuesto, se puede confirmar con este procedimiento, entonces, recordando (5.3-I), se puede establecer que Q(N¡,Nz) = N(N-1)(N-2)···(N-N 1 +1) N! N1! = N 1 !(N- N 1)! N! N 1 !N 2 ! (5.3-2) Supóngase ahora que el segundo recipiente se divide en dos subcompartimientos que contienen v 1 y v2 objetos en donde, por supuesto, (5.3-3) como se ilustra en la figura 5.3. El número de formas independientes que logra la distribución (v 1 , v 2 ) entre los subcompartimientos de la segunda caja es, de acuerdo con (5.3-3), (5.3-4) Sin embargo, ahora se podría considerar que el sistema tiene tres recipientes distintos y que el número total de maneras de acomodar los objetos, requerido para que haya N 1 en el primer recipiente, v 1 en el segundo y v2 en el tercero [que se denominará Q(N 1 ,v 1 ,v 2 )], será sencillamente el producto de Q(N1 ,N2 ) y Q(v 1 ,v 2 ), ya que para cada arreglo (N1 , N 2 ), habrá Q(v 1 , v 2 ) maneras de acomodar las par- IN· Compartimiento : 1 Figura 5.3. m ~ 2 Subdivisión del segundo recipiente en dos subcompartimientos; de hecho, se puede considerar que el sistema así obtenido se ha dividido en tres recipientes diferentes. tículas entre los subcompartimientos y existen Q(N 1 ,N2 ) maneras básicas de llegar a una distribución (N1 , N 2 ) para los dos recipientes originales. De donde, se encontrará que (5.3-5) A continuación, el trabajo se limita a marcar de nuevo los tres recipientes como las cajas 1, 2 y 3, y denominar a los objetos dentro de cada una N 1 , N 2 y N3 en lugar de N 1 , V 1 y v 1 , en cuyo caso (5.3.-5) se puede expresar como sigue N! Q(N¡,Nz,N3) =N 1 N 1 N 1. 2. 1 3. (5.3-6) 156 Mecónica estadística. Generalidades Una vez más, se puede imaginar que el tercer compartimiento se subdivide como antes y, utilizando el mismo procedimiento se obtiene una expresión para el número de acomodos requeridos a fm de distribuir N objetos entre cuatro cajas en un forma tal que se obtenga una distribución (N 1 , N 2 , N 3 , N 4 ). Mediante la aplica· ción repetida de este procedimiento el resultado se puede extender indefinidamente por inducción hasta abarcar el caso en que se tengan n cajas. De acuerdo con (5.3-3) y (5.3-6), es evidente que se encontrará (5.3-7) en donde el símbolo TI indica un producto ampliado, en la misma forma en que el bien conocido expresa una suma. La probabilidad real relacionada con una distrioución dada de N objetos entre n cajas, es el número de diferentes maneras de acomodar objetos en Q(N 1 , • • • Nn) cajas, requerido para obtener esta distribución particular, dividido entre el número total de maneras de acomodar N objetos en n cajas sin tener en cuenta la distribución resultante de objetos entre las cajas. Como se puede demostrar con facilidad, este último factor es nN. La probabilidad relacionada con una distribución dada es, entonces, Q(N 1 , • • • Nn)/nN. Sin embargo, se encontrará que es más conveniente manejar sólo las cantidades Q(N 1 , • • • Nn), que son proporcionales a las probabilidades reales, ya que sólo se tiene el interés de determinar los valores de N 1 , • • • Nn que le dan un máximo a la probabilidad y, si Q(N 1 , • • • Nn), es un máximo, también lo es la probabilidad asociada. Ahora se identificará el iésimo recipiente con el iésimo nivel energético del sistema, y el número de objetos N¡ de dicho recipiente con la cantidad de partículas pertenecientes a ese nivel. Sin embargo, se debe permitir un margen por si los niveles energéticos degeneran y se supondrá que hay g¡ estados cuánticos independientes asociados con el iésimo nivel energético, cada uno de los cuales tiene la misma probabilidad a priori de estar ocupado, de acuerdo con el postulado fundamental de la sección 5.1. Entonces, cada nivel de energía se debe considerar no como un solo recipiente, sino como un grupo de g¡ recipientes, según se ilustra en la figura 5.4. Para un nivel energético dado, por ejemplo, el iésimo que contiene N¡ partículas y g¡ estados cuánticos independientes, existen gf'i formas de acomodar las partículas en los estados o recipientes pertenecientes a tal nivel, porque existen g¡ opciones independientes respecto al lugar en que se puede colocar la primera partícula y para cada una de éstas, hay g¡ selecciones del sitio donde se puede colocar la segunda, y ¿ Degeneración g; = 4 .: r-·-'-le. •• 1 • r--1- --1-- Nivel Población N¡ Figura 5.4. 1 4 2 6 . ~··· 2 7 --- 1 1 •1 • _L n 2 La subdivisión de los niveles energéticos en diferentes estados cuánticos de acuerdo con ~u dcgenerac.:ión. Dichos estados desempeñan el mismo papel que los recipientes del desarrollo e~tadístico, y cada uno tiene el mismo peso estadístico. La distribución Maxwell-Boltzmann 157 así sucesivamente hasta N¡ factores. Cada uno de estos arreglos constituye una forma estadísticamente, independiente de distribuir partículas entre los estados cuánticos del sistema, ya que estos estados cuánticos son de igual probabilidad, y no así los niveles energéticos. Si el primer nivel de energía e 1 , fuera el único nivel degenerado, se tendrían i( 1 maneras independientes de establecer una distribución específica de partículas entre los niveles energéticos, como se indica en (5.3-7), ya que existen muchas maneras de permutar las partículas entre los distintos estados degenerados pertenecientes al primer nivel, y por cada uno de éstos queda todavía el mismo número de maneras de asignar las partículas a los otros niveles del sistema, de tal modo que se obtenga la distribución (N1 , N 2 , • • • Nn). Si además el segundo nivel estuviera degenerado, se tendrían posibilidades por cada una que existió antes, siendo ahora el número total de formas independientes en que se logra una distribución dada de las partículas entre los niveles, ¡{ 1 veces la que se establece en ( 5 .3-7). Es obvio que cuando se incluye la degeneración de todos los niveles, el resultado (5.3-7) se deberá multiplicar por 1{ 1 21:3 • • • tf:n, lo cual da 112 112 11 N! nn g¡N, º( N¡,N2, ... Nn ) = - n -TIN¡!i=l (5.3-8) i= 1 cuando se incluye la degeneración. Ahora se supondrá que la distribución real (N 1 , N 2 , • • • N n) de partículas entre los estados energéticos que se observa en equilibrio, es esencialmente la que se suele obtener en el número máximo de formas estadísticamente independientes, en otras palabras, la distribución para la que la cantidad Q de (5.3-8) es un máximo. Entonces, Q debe maximizarse con respecto a los parámetros N 1 , N 2 , • • • Nn, teniendo en cuenta la~ restricciones n L1 N¡ = N = const. (5.3-9) i= y n L e¡N¡ = U = const. (5.3-10) i= 1 Esta maxnmzacwn se logra con mayor facilidad utilizando la técnica matemá· tica denominada método de los multiplicadores de Lagrange y se hará un breve paréntesis para describir este tema. Supóngase que se da una función f(x 1 , x 2 , • • • x n) de n variables y hay que determinar los valores de x 1 , x 2 , • • • Xn que maximizan f, a condición de que alguna otra constante dada <P{x 1 , x 2 , • • • xn) permanezca constante. Para un valor máximo (o mínimo) de f, df =O y si cp permanece constante dcp = O, de tal manera que si f es un máximo o un mínimo en estas condiciones, entonces df + (/. d<f> =o (5.3-11) sea cual fuere el valor que el multiplicador arbitrario indeterminado a pueda tener. ~o obstante, (5.3-11) se puede expresar como 158 Mecánica estadística. Generalidades De acuerdo con esta ecuación, la condición ( 5.3-11) se satisface con toda seguridad si para cada i a¡ o</J OX¡ OX¡ -+IX-=Ü (5.3-13) {i = 1,2, ·· · n), y como además se dio la información inicial de que (5.3-14) las ecuaciones {5.3-13) y (5.3-14), tomadas juntas, representan un grupo de n + 1 ecuaciones simultáneas que se pueden resolver para las n cantidades x 1 ,x 2 , • • • Xn que maximizan (o minimizan) a f y [para el multiplicador indeterminado] a que se introdujo en (5.3-11). Si existen dos funciones auxiliares cf>(x 1 , x 2 , • • • Xn) y ¡J¡(x 1 , x 2 , • • • Xn) que se deben mantener constantes mientras se maximiza la función f, entonces se introducen dos multiplicadores arbitrarios a y {3, y es necesario que df + IX d</J + f3 dlj¡ =O, (5.3-15) que lleva, en .la misma forma, a un conjunto de n + 2 ecuaciones a¡ o<P oi/J OX¡ OX¡ OX¡ (i = 1,2, ·· · n) -+IX-+/3-=Ü (5.3-16) (5.3-17) (5.3-18) ¡J¡(x 1 ,x 2 , ••• x.) = 1/1 0 = const. paras las n + 2 incógnitas x 1 , x 2 , • • • x n, a y (3. A continuación se procederá a aplicar este método con el fin ce encontrar la distribución N 1 , N 2 , • • • Nn para la que (5.3-8) es un máximo. Para facilitar las operaciones matemáticas lo que en realidad se maximizará es In Q y no Q propiamente dicha; pero puesto que el logaritmo es una función monotónica de un solo valor de todas las variables comprendidas, cuando In Q es un máximo, también lo es Q. Si se toma el logaritmo de los dos lados de (5.3-8), se tiene que In Q(N 1 ,N 2 , ···N.)= In N!+ n n i= 1 i= 1 L N¡ In g¡- L In N;!. (5.3-19) Se supondrá que este sistema es tan grande que para cada nivel t:¡! se puede aproximar, utilizando la aproximación de Stirling según la cual, para x ~ 1, lnx!:::;;-xlnx-x. (5.3-20) Cuando se usa esta aproximación, {5.3-19) se convierte en In Q = In N! + L N¡ In g¡ - L N; In N¡ + L N;, i i i (5.3-21) La distribución Moxwell-Boltz1111lnn 159 que se debe maximizar bajo las restricciones L N¡= N (5.3-22) I/J(N¡,N2, ··· Nn) = L e1N 1 =U. (5.3-23) </J(N¡,N2, ··· Nn) = ¡ ¡ De acuerdo con (5.3-16), esto requiere que o(ln Q) o</J oi/J iJNi oNi oNi a [ LN 1 lng 1 - ¿N1 lnN1 + LN1] - - +1X-+{J-=- oNi 1 1 1 (j = 1,2, ··· n). (5.3-24) Al desarrollar las derivadas de {5.3-24), se observa que los únicos términos de las sumas cuyas derivadas con respecto a N¡ no sean cero son aquellos para los cuales i = j; por tanto, ( 5.3-24)se puede reducir a (j = 1,2, ··· n). (5.3-25) Resolviendo para In (N¡/g¡) y desarrollando los exponenciales, esta expresión se puede escribir en la forma (5.3-26) La ecuación ("5.3-26) proporciona el número promedio de partículas por estado cuántico del sistema y, por ende, representa por definición la función de distribución de energía f(e). Esta función de distribución particular de energía, que se obtuvo como {5.3-26) de acuerdo con la suposición clásica de partículas identificables y sin utilizar el principio de exclusión de Pauli, se conoce como función de distribución de Maxwe/1-Boltzmann. Conviene explicar la forma en que las dos constantes a y 13 se relacionan con las propiedades físicas del sistema. En primer lugar, a la constante 13 se le asignará el valor p = -1/kT, (5.3-27) en donde T es la temperatura absoluta del sistema y k es una constante denominada constante de Boltzmann, y se considerará que esta ecuación junto con {5.3-26) definen lo que se entiende por temperatura. A su debido tiempo se verá que esta definición conduce a todas las bien conocidas características de temperatura que se asocian con un gas ideal y, entonces se podrá ver claramente que, antes de definir la temperatura, ya se podían identificar las propiedades de un gas ideal a partir de (5.3-26). Después se podría proceder a la identificación de p con el valor dado arriba, basándose en una comparación de los resultados así obtenidos y la ecuación termodinámica ya conocida del estado de un gas ideal (a partir de la cual se define más comúnmente la temperatura). Se demostrará que el valor de k se puede relacionar con la constante medida del gas ideal R y el número de Avogadro. 160 Mecánica estadística.. Generalidades Si se utiliza el valor de (J dado en (5.3-27), la expresión (5.3-26) ahora se puede escribir como N.J = gJ.e"e-• 1/kT. (5.3-28) Luego, el valor de la constante a se puede expresar de acuerdo con el número total de partículas N ya que, de acuerdo con (5.3-9) y (5.3-28), N= L N¡= e" L g¡e-•JfkT, j (5.3-29) j por lo cual e"= N (5.3-30) L g¡e e tkT• 1 j y N = g .e"e-•JtkT = 1 Ng .e-•¡tkT L g¡e • ¡kr J • 1 J (5.3-31) j Si los niveles energéticos del sistema están muy próximos unos de otros, como sucede con los niveles del gas de partículas libres que se vio en la sección anterior, la cantidad g¡ de (5.3-28) se puede considerar como g(e)de y la cantidad N¡ de la ecuación se considerará como N(e)de, de acuerdo con lo expuesto en relación con la ecuación (5.2-1). El número de partículas dentro de un rango energético de alrededor de e dentro de este límite, estará dado, de acuerdo con (5.3-28), por N(e) de= e"e-•fkTg(e) de= f(e)g(e) de. (5.3-32) Para un gas ideal de partículas libres, el factor de densidad de estados g(e) está dado por (5.2-22). Obsérvese que la forma de (5.3-32) es la misma que la de (5.2-1), siendo !(e)= e"e-efkT. Una vez más, como se vio en relación con (3.3-31), se puede evaluar la constante a teniendo en cuenta la condición de que el número total de partículas dentro del sistema será una constante N, por lo cual N = f N(e) de = e" f g(e)e-•fkT de, (5.3-33) y -f N e"-~---- (5.3-34) g(e)e-•fkT de' en donde las integrales se toman sobre todas las energías disponibles para las partículas del sistema. Se debe observar que la cantidad Q de (5.3-8) está íntimamente relacionada con la entropía termodinámica del sistema. En equilibrio, el estado del sistema es tal que Q. el número de formas estadísticamente independientes de distribuir las par- La estadístiCil de Maxwell-Boltzmann para un gas ideal 161 f(•l 7j ura S.S. Representación esquemática de la función de distribución de energía de MaxwellBoltzmann para tres temperaturas distintas. ulas entre los estados cuánticos, es un maxtmo como lo es la entropía del sisna Por ahora no se entrará en detalles; pero se puede demostrar 1 que la relación stente entre estas dos cantidades es S-= k In Q, (5.3-35) donde S es la entropía. LA ESTADISTICA DE MAXWELL-BOLTZMANN PARA UN GAS IDEAL A continuación se analizarán las propiedades de un gas ideal de partículas es del tipo que se estudió en la sección 4.2. Para este sistema, el factor de sidad de estado g(€) d€ está dado por (5.2-22), debido a lo cual, de acuerdo con :-34), "'- N e - 8j2 ¡¡; V m 3!2 f"" Jf.e-c!kT de h3 (5.4-1) o La integración se toma entre los límites cero e infinito, ya que la energía de partículas es totalmente cinética y, por ende, positiva. La integral de (5.4-l) se de expresar en una forma más sencilla mediante la substitución x = efkT, (5.4-2) 1 J. E. Mayer y M. Goppert-Maycr, Statistical Mechanics, John Wiley & Sons, Nueva York !.'1), capítulo 4. 162 Mecánica estadística. Generalidades por lo cual, (5.4-1) se convierte en (5.4-3) La integral se puede expresar ahora como una función r-, 2 ya que f(n) se define como (5.4-4) siendo entonces la integral de (5.4-3) igual a f(3/2), que, a su vez, es igual a Si se inserta este valor en (5.4-3), se tiene que N ( h2 e"= 2V 2mnkT )3/2 ' ..J1i72. (5.4-5) que permite escribir la función de la distribución de Maxwell-Boltzmann para un gas ideal como (5.4-6) Nótese que el valor de e" dado por (5.4-5), es dependiente de la temperatura. También conviene destacar quue este valor de e" pertenece sólo a la función de densidad de estados de partículas libres (5.2-22) y que para sistemas que tienen otras funciones de densidad de estado relacionadas con ellas, el valor de e" será diferente del que se da en (5.4-5). En la f~ura 5.5 se muestra una gráfica de la distribución de Boltzmann (5.4-6) para varias temperaturas. De acuerdo con (5.4-6) y (5.2-22), es obvio que la distribución real de la densidad de partículas con respecto a la energía está dada por N(e) de =f(e)g(e) de= 2rrN r;,.e-•tkT de ( rrk T)312 \/ . (5.4-7) La energía interna total y el calor específico del gas se puede obtener fácilmente a partir de estos resultados. Puesto que la energía de las partículas en el rango de alrededor de e es eN( e) de, la energía interna total del gas es U= E'"eN(e) de, (5.4-8) o bien, utilizando (5.4-7), (5.4-9) 2 Véa~c. pm <'Íl"mplo, I. S. y 1·~ S. Sokolnikoff, Hif{her Mathematics for Engineers and 1'/n•sicil'l.\, Md;raw-llill Hook Co., lnc., Nueva York (1941), página~. 273-276. La estadística de Maxweii-Boltzmann para un gas ideal 163 Esta integral se puede evaluar en términos de las funciones r-, substituyendo (5.4-2). Al desarrollar la integral de este modo, y observando que r(5/2) = (3/2)r(3/2) = 3 .Jrr/4, se encuentra (5.4-10) U =tNkT, por lo cual, la energía interna promedio por partícula, U/N, es 3/2kT que es un resultado importante y muy conocido. La capacidad calorífica del gas a volumen constante es la razón de aumento de la energía interna con respecto a la temperatura, por lo cual, de acuerdo con (5.4-10), e (au) ar =1Nk = V V , (5.4-11) independiente de la temperatura. El calor específico Cv es simplemente la capacidad calorífica por unidad de volumen. El objetivo final es derivar la ecuación de estado para un gas de Boltzmann ideal a partir de las propiedades dinámicas de la partícula y la función de distribución. N:> obstante, antes de llegar a esto, es necesario convertir las distribuciones de energía (5.4-6) y (5.4-7), en distribuciones de velocidad apropiadas e investigar brevemente cómo se pueden usar estas funciones de distribución de velocidad. En la tabla 5.1 se proporciona el valor de algunas integrales definidas que se utilizan muy a menudo cuando se trabaja con las distribuciones de velocidad de Boltzmann. En un gas de partículas libres que no poseen ningún grado interno de libertad, toda la energía se basa en la energía cinética de las partículas. Esto se puede relacionar con la velocidad mediante la expresión (5.4-12) de donde de= mv dv, (5-4.13) y la distribución de energía ( 5.4-7), se puede escribir directamente como una distribución de velocidad de la forma m N(v) dv = 47tN ( 21tkT )3/2v2e-mv>f2kT dv. (5.4-14) Esta función expresa el número de partículas el sistema cuvas velocidades quedan dentro de un rango dv alrededor de v, o el número de partículas que quedan dentro de una capa esférica cuyo espesor es dv y el radio es v, dentro del espacio de velocidad. Suponga que ahora se desea conocer cuántas partículas del sistema tienen velocidades tales que la componente x de la velocidad se encuentre dentro de un rango dvx alrededor Vx, la componente y está en el rango dvy alrededor de vy y la componente z está dentro de un rango derivada de Vz alrededor de Vz, o sea el número de partículas que quedan dentro de un elemento rectangular de volumen (dvxdvydvz) en el espacio de velocidad centrado alrededor del valor (vx, vy, Vz). Este 164 MecániCtJ estadístiCtJ. Generalidades TABLA 5.1. Integrales Maxwell-Boltzmann* =- 4 kT m = ~; e~Tr2 = ~e~Tr = 3~; e~Tr 2 = e~Tr =-- 32 256 =-64 *La segunda columna de la tabla da el valor de la integral definida que aparece en la primera columna. La tercera columna indica el valor ~ la integral definida cuando a se hace igual a m/2kT, como casi siempre sucede cuando se trabaja con distribuciones de velocidad de Boltzmann. La cuarta columna expresa el resultado que aparece en la tercera columna como un múltiplo de 12 velocidad térmica media e, en donde e= v8kT/Trm. número se denominará N(vx, Vy, Vz)dvx dvy dvz. Ahora se procederá con más cuidado, principiando con (5.4-6) que, de acuerdo con (5.4-12), se puede escribir como N ( h2 !( V V V ) = - - - '"' '' z 2V 2nmkT )3/2 e-m(v 2 x+v 2 ~+v 2 ,)/2kT (5.4-15) Entonces, como lo requiere (5.2-1), (5.4-16) en donde g(vx, vy, ~·.)dvx dvy dvz es el número de estados cuánticos dentro del elemento de espacio de velocidad dvxdvvdvz. De acuerdo con (5.2-17) el número de La estadística de Maxwell-Boltzmann para un gas ideal 165 estados dentro de un elemento de volumen dpx dpy dpz del espacio de cantidad de movimiento es (2V/h3) (dpxdPydPz), por lo cual, (5.4-17) Puesto que la densidad de estados en el espacio de cantidad de movimiento, es constante, también lo es la densidad de estados en el espacio de velocidad. Si se substituyen (5.4-15) y (5.4-17) en (5.4-16) y simplifica el resultado, se obtiene )3/2 m N(v V V) dv dv dv =N ( - x• Y' z x y z 21tkT e-mlu'"+u'y+u'.)/lkT dv x dv dv Y z· (5.4-18) Una tercera función de distribución de velocidad N(vx)dvx, que representa el número de partículas cuya componente x de velocidad queda dentro del rango dvx alrededor de Vx, sean cuales fueren los valores de las componentes y- y z- de velocidad para dichas partículas, está íntimamente relacionada con la función de distribución (5.4-18). La función de distribución N(vx)dvx se puede calcular a partir de (5.4-18) integrando sobre todos los valores posibles de vy y Vz, siendo el resul· tado (5.4-19) Los valores de las integrales definidas requeridas al integrar (5.4-18), se tomaron de la tabla 5.1. En la figura 5.6 se ilustra una gráfica de la distribución N(v) y N(vx) como funciones de la coordenada de velocidad aprÓpiada. Si se conocen estas tres funciones de distribución de velocidad, es muy fácil evaluar los promedios sobre las distribuciones de velocidad. Por ejemplo, la velocidad (o) Figura 5.6. ( b) (a) Representación esquemática de la distribución de Maxwell-Boltzmann de las velocidades de partículas, N(v) a tres temperaturas distintas. (b) La distribución correspondiente de las componentes x de la velocidad, N(vx). 166 Mecánica estadística. Generalidodes térmica promedio e para una partícula en una distribución de Boltzmann, se obtiene a partir de (5.4-14) escribiendo ra) J, vN(v)dv 1 312 a) (v) = o =-. 4nN (~-) f v3e-mv2f2kT dv Soa) N(v)dv N 2nkT Jo (5.4-20) = J8kT/nm, en donde la integral se evaluó con la ayuda de la tabla 5.1. Ahora ya se puede pasar al estudio de la ecuación de estado de un gas ideal. Supóngase que las partículas chocan contra una área unitaria de la pared de un recipiente lleno con dicho gas, como se ilustra en la figura 5.7. Si la pared es un plano orientado en sentido normal al eje x, las componentes de la cantidad de movimiento Py y Pz de las partículas que chocan contra la pared, se conservan, si las colisiones de las partículas con las paredes son elásticas, lo cual se supondrá, es el caso de que se trata. En cada colisión, la componente de velocidad Vx dirigida hacia la pared, cambia a - Vx, alejándose de la pared. La transferencia de cantidad de movimiento de la partícula a la pared, por colisión, es entonces 2mvx. La trans- r---- las partículas de 1 velocidades Vx dentro l de este volumen chocarán-,-_ contra la pared durante 1 el período dt 1 Unidad de área 1 1 1 1 L____ _ -v.dt Pared de recipiente -x Figura S. 7. Colisión elástica de una partícula contra la pared de un recipiente rígido, siendo Vx la componente x de la velocidad de dicha partícula. ferencia de cantidad de movimiento a la pared en el intervalo de tiempo dt es esta cantidad por el número de partículas que chocan con la pared durante este período; para partículas cuya componente x de velocidad es Vx, se trata sencillamente del número de tales partículas dentro de un volumen que se extiende a una distanciad= vxdt detrás de la pared, o el número por unidad de volumen por vxdt, de donde, vxdt • N(vxXJvxfV. La transferencia de cantidad de movimiento en el tiempo dt para partículas cuya velocidades quedan dentro del rango dvx alrededor de Vx, entonces, es La estadística de MaxweU-Boltzmann para un gas ideal 167 o bien, (5.4-21) La razón total de transferencia de cantidad de movimiento a las paredes, mediante las colisiones en que intervienen partículas con todos los valores posibles de vx, se puede obtener integrando sobre vx, lo cual da, con ayuda de (5.4-19) y la tabla 5.1, dpx2m NJrn foo V 2 e -mv2xf2kT dV--NkT ----. dt V 2nkT 0 x x V (5.4-22) Sin embargo, de acuerdo con la ley de Newton, el cambio en el tiempo de la cantidad de movimiento por una unidad de área de la pared del recipiente es igual a la fuerza ejercida sobre una unidad de área de la pared que, por definición, es la presión P. En consecuencia, la ecuación (5.4-22) se reduce a PV = NkT, (5.4-23) que es la ecuación de estado para un gas de Boltzmann de partículas independientes. La ecuación anterior tiene la misma forma que la ley del gas ideal ya conocida, aunque ésta se suele escribir PV = nRT, (5.4-24) en donde n es el número de moles de gas en el sistema y R es una "constante molar de gas" determinada en forma experimental, que es la misma para todos los gases "ideales". Si el sistema tiene n moles de gas, el número de partículas estará dado por N= nNA, en donde NA es el número de Avogadro igual a 6.026 X 10 23 moléculas por mol. En estas condiciones, (5.3-23) toma la forma PV = nNAkT, (5.4-25) por lo cual, comparando (5.4-24) con (5.4-25), es obvio que la constante de Boltzmann k debe estar dada por (5.4-26) de donde, la constante de Boltzmann es la constante de gas por partícula del sistema. Su valor se puede derivar de NA y R y es igual a 1.380 x lQ-16 ergs/°K, o bien, 8.615 x 1Q- 5 eV¡oK. Ahora se ve con claridad que el valor de la constante {3 en la función de distribución que se supuso en (5.3-27), se escogió correctamente. Si se hubieran desarrollado los cálculos hasta este punto sin suponer ningún valor para {3, se habría llegado a la ecuación (5.4-23), PV = -N/{3, (5.4-27) 168 Mecánictl estadístictl. Generalidades y, para que esos resultados concuerden con la ley de los gases (5.4-24) establecidos experimentalmente, habría sido obligatorio escoger N -N/P = nRT =NA RT, o bien, (5.4-28) .S ESTADISTICA DE FERMI-DIRAC En el desarrollo de la función de distribución de Maxwell-Boltzmann, se considera que las partículas pueden distinguirse; pero en la práctica es imposible distinguir un electrón de cualquier otra partícula elemental. Es más, se admitió que un número cualquiera de partículas ocupara el rniemo estado cuántico del sistema, a pesar de que muchas de ellas, sobre todo los electrones, obedecen al principio de exclusión de Pauli, que no permite que un estado cuántico acepte a más de una partícula. Si estas condiciones adicionales se imponen al sistema, los cálculos de la sección 5.4 se deben modificar, dando como resultado otra función de distribución que se conoce como función de distribución de Fermi-Dirac. Esta distribución tiene una importancia enorme, ya que describe la conducta estadística de los electrones libres en los metales y los semiconductores; además, muchas propiedades eléctricas y térmicas de los sólidos que no se pueden comprender en absoluto a la luz de lo establecido con las estadísticas clásicas, se deducen como una consecuencia directa de la estadística de Fermi-Dirac. Si las partículas del sistema no se pueden distinguir, tampoco se pueden identificar numéricamente, como se supuso cuando se analizaron las diversas posibilidades ilustradas en la figura 5.2. En realidad, todas las diferentes distribuciones presentadas en cada hilera de la figura 5.2 que dan Q(N1 ,N2 ) para cualquier valor particular de N 1 , serían iguales si se eliminaran los números que identifican las partículas, en cuyo caso el factor (5.3-7) se reduce a la unidad. Sin embargo, en el iésimo nivel energético se pueden permutar las N; partículas entre los g; estados cuánticos pertenecientes a ese nivel, y se puede hacerlo de muchas maneras cada una de las cuales constituye una forma estadísticamente independiente de lograr un arreglo en el que N; partículas estén en el iésimo nivel energético del sistema, como se ilustra en la figura 5.8. El producto de los números posibles de permutaciones de partículas entre los estados cuánticos sobre todos los niveles energéticos del sistema, da entonces el número de formas independientes de efectuar una distribución dada de partículas entre los niveles de energía. ~f;~:~:!Y~:el 1·1·1·11·1·11 Estado Núm. 1 2 Figura 5.8. 3 4 5 s 7 1·1 9 ,. Una posible distribución de partículas entre los estados cuánticos del iésimo nivel de energía de un sistema en el que se aplica el principio de exclusión de Pauli. Estadística de Fermi-Dirac 169 En el caso de Fermi-Dirac, en el que se supone que se aplica el pnncipio de exclusión de Pauli, se permite que haya, como máximo, una partícula por estado cuántico. En relación con la figura 5.8, que describe el iésimo nivel de energía del sistema, existen g¡ formas de seleccionar el punto en el que !>e debe insertar la primera partícula, g¡ - 1 formas de escoger en donde se inserta la segunda, ya que la segunda no puede ocupar el mismo estado cuántico que la primera, g¡ - 2 formas de escoger en donde insertar la tercera, y así sucesivamente. El número total de maneras de acomodar N¡ partículas en el iésimo nivel obtenido sobre esta base, es g.l g1(g 1 - l)(g 1 - 2) ... (g 1 - N 1 + 1) = ( . -·~·)' g, (5.5-1) 1. No obstante, las partículas no se pueden distinguir entre sí y por tanto, en un arreglo dado de partículas las N¡! formas de permutadas unas con otras y entre estados, no se consideran como permutaciones diferentes. Fl número real de formas independientes de lograr una distribución de N¡ partículas en el iésimo nivel, se obtiene dividiendo (5.5-1) entre N¡! , lo cual da (5.5-2) N 1!(g1 - N 1)! El número total de formas independientes de lograr una distribución de (N 1 , N 2 , • • • Nn) partículas indistinguibles entre n niveles energéticos, en donde no se tiene más de una por estado cuántico, es sólo el producto de los factores individuales de la forma (5.5-2) sobre todos los niveles, es decir, (5.5-3) Ahora se procederá a maxlffiJZar el logaritmo de esta cantidad con respecto a las variables N 1 , N 2 , • • • Nn por el método de los multiplicadores lagrangeanos utilizados en la sección 5.3. De acuerdo con (5.5-3), se tiene que In Q1 = L In g1!- L In N1! - L ln(g 1 - N1)!, i i i (5.5-4) que, utilizando la aproximación de Stirling (5.3-20) se puede describir In Q1 = L [g 1 In g1 - N 1 In N 1 - (g 1 - N 1) In(g 1 - N1)]. (5.5-5) 1 Nuevamente, se requiere que el número total de partículas del sistema y su energía total se mantengan constantes, lo que significa que las ecuaciones (5.3-22) y l5.3-23) deben aplicarse también en este caso, de donde, se puede escribir, al igual que antes (j = 1, 2, ... n), (5.5-6) 170 Mecánica estadística. Generalidades en donde cp y 1/1 están dados por (5.3-22) y (5.3-23). Al substituir (5.5-5), (5.3-22) y (5.3-23) en esta ecuación, se obtiene - a~J ~ N In N + ~ (g 1 1 1- N 1) ln(g 1 - N 1)] +oc a~i (~ N + pa~i (t e N =O. 1) 1 1) (5.5-7) Al desarrollar las derivadas de la sección 5.3, se encontró que (5.5-8) o bien, reacomodando, haciendo las exponenciales, y resolviendo para N¡/g¡ =!(e¡), f(e.) = N ·fg · = 1 1 1 1 11 1 + e " "1 • (5.5-9) Esta es la función de distribución de Fermi-Dirac. Al igual que en la sección 5.4, se considerará que el valor de (3 es p = -1/kT, (5.5-10) y más adelante se explicará el porqué de este paso. Lo más aceptado es expresar a como (X= (5.5-11) 8¡/kT, en donde e¡ es un parámetro con las dimensiones de la energía que se denomina energía de Fermi o bien, nivel de Fermi del sistema. Por tanto, la ecuación (5.5-9) se convierte en N·= J gi (5.5-12) 1 + e<•J tt)fkT ' o bien, si se supone que los niveles se juntan formando un continuo, de modo que g¡(e¡)-+ g(e)de, entonces, g(e)de N(e)de = g(e)f(e) de = 1 + e<• •tlikT. (5.5-13) Para un gas de partículas independientes tales como electrones libres, g(e)de se representa mediante (5.2-22), al igual que un gas de Maxwell-Boltzmann. La energía de Fermi e¡ es, en general, una función de la temperatura cuya forma y dependencia de temperatura depende primordialmente de la densidad de la función de estados del sistema, al igual que en el caso del parámetro correspondiente e" de la distribución Maxwell-Boltzmann. Su valor se determina mediante la condición (5.3-22) o bien si se trata de un continuo de niveles, por medio de N = const. = f g(e)de 1 + e<• •tlfkT = f g(e)f(e)de. (5.5-14) Estadístico de Fermi-Dirac 171 La integral se toma sobre todas las energías disponibles para las partículas del sistema. Para un gas de Fermi de partículas independientes, g(e) está dada por (5.2-22) y e¡ se determina mediante N= B.j21tVm312 roo Jede Jo 1 + e<• e¡)/kT. h3 (5.5-15) Desgraciadamente, esta integral no se puede evaluar en una forma analítica, de modo que e¡ no se pueda determinar como una función simple de la temperatura. Sin embargo, en un gas bidimensional de partículas libres, se puede demostrar, mediante los métodos usados para derivar (5.2-22), la función de densidad de estados es 41tmA g(e)de = """"'h2 de, (5.5-16) e independiente de la energía (ejercico 3, capítulo 5). En esta fórmula, A representa el área del "recipiente" bidimensional. Para este sistema, (5.5-14) se convierte en 41tmA roo N= -¡¡r- de Jo i + e<•-•¡)/kT• (5.5-17) que se puede evaluar en forma cerrada, haciendo que uno resuelva para e¡ y se obtiene e1(T) = kT ln(e•t<O)/kT- 1), (5.5-18) Nh 2 e¡(0)=-41tmA (5.5-19) en donde es el valor que ej(1) toma conforme T tiende a cero, como está dado por (5.5-18). Los detalles del cálculo de este resultado son muy instructivos y quedan asignados como ejercicio para el lector. La variación de la energía de Fermi del gas bidimensional de partículas independientes se ilustra en la figura 5.9. Se notará en este caso, que la energía de Fermi es una función monotónica decreciente de la temperatura. La energía de Fermi para el gas de Fermi tridimensional, con la función de densidad de estados (5.2-22), presentará el mismo comportamiento general, excepto que en este caso, la variación de la energía de Fermi con respecto a la temperatura es lineal cuando los valores de ésta se mantienen razonablemente bajos, en tanto que para el ejemplo bidimensional, la variación es mucho más compleja a temperaturas bajas. Para muchos sistemas, incluyendo estos dos, la variación del nivel de Fermi con respecto a la temperatura es p~queña sobre el rango de temperaturas físicamente posibles; en la figura 5.9, la temperatura a la que e¡= O sería del orden de 75000°K para un gas de electrones con la densidad de electrones libres correspondiente a la del cobre metálico. Por esta razón, en muchas aplicaciones la dependencia de temperatura de la energía de Ferrni se puede desechar o aproximar mediante una función lineal u otra apropiada de la temperatura. La función de distribución de Fermi propiamente dicha, 1 /(e) = 1 + e<•-•,>tkT ' (5.5-20) 172 Mecánica estadística. Generalidades ., (T) Figura 5.9. Representación esquemática de la variación de la energía de Fermi en función de la temperatura, en un gas bidimensional de electrones libres, de acuerdo con (5.5-18). se muestra en la figura 5.10 para varios valores de temperatura. Puesto que sólo una partícula puede ocupar un estado cuántico dado, el valor de f(e) para una distribución de Fermi a una energía partícular es justamente igual a la probabilidad de que un estado cuántico de dicha energía esté ocupado. En el cero absoluto, como se puede ver fácilmente en la figura 5.10 y por la ecuación (5.5-20), la función de distribución de Fermi se convierte sencillamente en una función de escalón f(e) = 1 (e< e1 ) =O (e> e1 ). (5.5-21) Conforme aumenta la temperatura, los bordes del escalón se redondean y la función de distribución varía rápidamente desde casi la unidad hasta casi cero sobre un rango de energía de algunos múltiplos de kT alrededor del valor e = e1. Al mismo tiempo, el valor de e¡ cambia y la variación ilustrada en la figura 5.10 es aproximadamente la que se asocia con el gas electrónico tridimensional, cuya densidad de estados está dada por (5.2-22). A temperaturas muy elevadas, la función de Figura 5.10. Representación esquemática de la función de distribución de Fermi para cuatro diferentes temperaturas. Obsérvese la variación de la energía de Fermi con la temperatura. La dependencia de la energía de Fermi en relación a la temperatura, tal como se muestra aquí, es típica para un gas tridimensional de electrones libres; pero la variación real en cualquier sistema en particular depende críticamente de la función de densidad de estados (o nivel de degeneraciones) del sistema. Estadístictl de Fermi-Dirac 173 distribución pierde su característica de escalón y varía con más lentitud en función de la energía. De acuerdo con (5.5-20), es evidente que el valor de !(e) a e= e¡ es sólo l/2, es decir, (e1 ) =t. (5.5-22) de donde, un estado cuántico al nivel de Fermi tiene la probabilidad de ocupación de l/2. En la figura 5.11 se muestra la distribución real de la densidad de partículas .V(e) como una función de la energía para un gas de Fermi de partículas independientes, dada por (5.5-13) con la función de densidad de estados (5.2-22). Nuevamente, en T =O, la curva tiene un carácter escalonado; así la porción para la que (e< e¡) es la parábola de densidad de estados (5.2-22) y para la que (e> e¡) es .:ero. Al aumentar la temperatura, este aspecto escalonado se hace cada vez menos pronunciado, como se ilustra en el dibujo. A temperaturas bajas, cuando la función de distribución de Fermi es escalonada, se dice que la distribución está sumamente degenerada. A temperaturas bajas, la distribución de Fermi-Dirac se puede representar como una esfera en el espacio de cantidad de movimiento en el que todos o casi todos los estados cuánticos de energía menor que e1 están llenos, en tanto que todos o la mayoría de los estados de energía mayores que e1 están vacíos. De acuerdo con f 5.2-14), la ecuación de la superficie de esta "esfera Fermi" debe ser Px2 + Py2 + Pz2 = 2 me¡, (5.5-23) de donde, el radio es ..J2me1 , como se ilustra en la figura 5.12. A temperaturas muy altas, la superficie de la esfera de Fermi está definida muy deficientemente debido a la desaparición de bs aspectos escalonados de j(f), y el concepto resulta menos útil. Entonces, se llega a la conclusión que ta integral (5.5-15) no puede evaluarse en forma exacta y esto no permite encontrar una expresión simple para la energía de Fenni de un gas de Fermi tridimensional a todas las temperaturas; sin embargo el .:arácter simple (5.5-21) que adopta la función en T= O permite evaluar er de un modo muy sencillo en el cero absoluto. Si se utiliza (5.5-:ll) para representar !(e) en T =O, se puede volver a escribir (5.5-14) utilizando la función de densidad de estados (5.2-22) como N = 8J2nm 312 r•¡(O) Jede = 16j2nm 3 ' 2 [e¡(0)] 3 ' 2 V h3 3h 3 Jo (5.5-24) N(.) Figura 5.11. Representación esquemática de la densidad electrónica como función de la energía asociada a un gas tridimensional de electrones libres. 174 Mecánica estadística. Generalidades ( r- eje .lal papel l Figura 5.12. La distribución de Fermi al cero absoluto correspondiente a un gas de electrones libres, representada, por medio de una esfera de electrones dentro del espacio de cantidad de movimiento. Esta representación es útil siempre y cuando T<t.Tp. Resolviendo esta ecuación para ej(O), se obtiene (3N)2/3 . h2 e¡(O) = - 8m 1rV (5.5-25) De un modo similar, se puede obtener la energía interna de un gas de Fermi al cero absoluto, siendo el resultado U0 _ 1th 2 (3N) 3-5 _3NV e¡(O). V- 40m 1rV 5' (5.5-26) Los detalles de estos cálculos se omiten, pero se proponen como ejercicio para el lector. Para energías mucho mayores que er, e<e-e¡)fkT es mucho mayor que la unidad y para tales energías, la función de dÍstribución de Fermi-Dirac (5.5-20) se puede escribir aproximadamente como (5.5-27) Si todas las energías disponibles para el sistema satisfacen la condición e- e1 ~ kT, (5.5-28) es decir, si e¡ es muchas unidades kT menor que cualquier energía que pueda tener una partícula perteneciente al sistema, entonces (5.5-27) constituirá una buena aproximación de (5.5-20) para todas las partículas del sistema. Sin embargo, la función de distribución aproximada (5.5-27) es, sencillamente, la función de distribución de Maxwell-Boltzmann de (5.4-6) con a= e¡/kT. Entonces, si se conserva la condición (5.5-28) para todas las partículas del sistema, la distribución Fermi-Dirac y la de Maxwell-Boltzmann son casi iguales. Estadística de Fermi-Dirac 175 Para el gas bidimensional de Fermi, donde la energía de Fermi está dada por (5.5-18), si T es tan grande que kT'> e¡(O), el exponente e¡(O)/kT será pequeño, de tal manera que el exponencial se puede aproximar mediante 1 + [e¡(O)/kT], dando e (T) = kT In e¡(O) 1 kT = 81 (O)[ kT 1 B¡(O)] e1(0) n kT kT kT] = -e¡(O) [ e¡(O) In e¡(O) . (5.5-29) De acuerdo con esto, se advierte que conforme T aumenta, e¡(T)-+- oo. Puesto que la energía más baja que puede tener cualquier partícula del sistema es cero, es evidente que la condición (5.5-28) se satisfará para temperaturas lo suficientemente altas y la función de distribución será aproximadamente la misma que la de la distribución de Maxwell-Boltzmann a temperaturas muy elevadas. Se puede demostrar que el mismo resultado se aplica al caso tridimensional. Estos resultados también pueden esperarse si se emplea un enfoque físico, ya que a altas temperaturas, las partículas se distribuyen sobre un rango muy amplio de estados energéticos, y el número de partículas en cada rango de energías disponibles es tan pequeño que siempre hay mucho más estados cuánticos disponibles que partículas que puedan ocuparlos. En estas circunstancias, la probabilidad de que dos o más partículas ocupen el mismo estado cuántico siempre se hace sumamente pequeña de modo que no importa mucho si la función de distribución obedece al principio de Pauli (distribución Fermi-Dirac) o no lo obedece (distribución Maxwell-Boltzmann). 3 Puesto que la cantidad e¡(O), que deber ser obligatoriamente mucho menor que kT para que las dos distribuciones coincidan, es proporcional a la densidad de partículas N/A por (5.5-19), la reducción de la distribución de Fermi a una reducción de Maxwell-Boltzmann se desarrollará a temperaturas más bajas en gases menos densos. Por las mismas razones, de acuerdo con ( 5.5-19), se producirá a temperaturas más bajas en gases en las que la masa de las partículas m sea grande. Debido a ello, las substancias gaseosas ordinarias a temperaturas normales obedecen a la estadística de MaxwellBoltzmann mejor que a la estadística Fermi-Dirac (o Bose-Einstein). Sin embargo, para un gas denso de partículas muy ligeras, tales como los electrones libres de un metal, la energía de Fermi al cero absoluto es bastante grande y la condición (5.5-28) se puede satisfacer para todas las partículas del sistema sólo a temperaturas tan altas que sean físicamente inalcanzables. Por tanto, cuando se trata de un gas denso de electrones libres, debe utilizarse la estadística de Fermi-Dirac. No obstante, en los semiconductores, la forma peculiar de la función de densidad de estados es tal que la distribución de Maxwell-Boltzmann casi siempre es una aproximación aceptable de la distribución de Fermi-Dirac o prácticamente igual a ella. Esta situación se examinará más detalladamente en un capítulo posterior. 3 Se podría alegar que aun en este límite la distribución de Fermi-Dirac debe diferir de la de Maxwell-Boltzmann en virtud de que no se pueden identificar las partículas. Sin embargo, se puede demostrar, como se verá en la siguiente sección, que la función de distribución de partículas no distinguibles, que no obedecen el principio de exclusión de Pauli (la distribución Bose-Einstein), se aproxima a la función de distribución Maxwcii-Boltzmann en este límite. Una forma más exacta de explicar la situación sería afirmar que, en el límite de altas temperaturas, la distribución Fermi-Dirac se acerca a la distribución Bose-Einstein que, a su vez, se acerca a la distribución Maxwell-Boltzmann. 176 Mecánica estadística. Generalidades Si se hubiera escogido para el multiplicador (3, otro, diferente al dado por (5.5-10), no se habría encontrado, por lo general, la correspondencia entre los sistemas Fermi-Dirac y Maxwell-Boltzrnann en el límite de las temperaturas altas que, como ya se vio, se puede esperar por razones físicas. Por tanto, se debe llegar a la conclusión de que el valor de (3 dado por (5.5-10) está físicamente justificado. 5.6 LA DISTRIBUCION HOSE-EINSTEIN En la sección anterior se demostró que la distribución estadística de FermiDirac (5.5-20) es la que caracteriza el comportamiento de un conjunto de partículas no distinguibles que obedecen al principio de exclusión de Pauli. Puesto que no todas las partículas elementales obedecen el principio de Pauli (siendo la excepción más conspicua los fotones), es necesario considerar el comportamiento de las partículas no distinguibles, que no obedecen este principio. También en este caso, puesto que las partículas no están numeradas, el factor ( 5.3-7) se reduce a la unidad y sólo es necesario considerar las posibles permutaciones de N¡ partículas idénticas entre g¡ estados cuánticos de iésimo nivel energético; pero ahora sin ninguna restricción en lo que respecta al número de partículas que pueden ocupar cualquier estado cuántico dado. Sea un arreglo lineal de N¡ partículas y g¡ - 1 particiones que serían necesarias para dividir estas partículas en g¡ grupos, como se ilustra en la figura 5.13. No es difícil ver que el número de formas de permutar las N¡ partículas entre g¡ niveles, es igual al número de permutaciones independientes de objetos y particiones de la figura 5.13. Puesto que se tiene un total de N¡+ g¡- 1 partículas más las particiones, éstas se pueden arreglar linealmente en (N¡+ g¡- 1)! formas; pero puesto que las permutaciones que se hacen entre las partículas y entre las particiones no se consideran como acomodos independientes, el número de acomodos se debe dividir entre el número de maneras de permutar las partículas entre ellas mismas (N¡! ) y nuevamente entre el número de maneras de permutar las particiones entre ellas mismas ((g¡- 1)! ), dando (N;+ g¡- 1)! N;!(g;- 1)! (5.6-1) formas de realizar una distribución de N¡! partículas no distinguibles entre g¡ estados que pueden alojar a cualquier número de partículas. Fl número Qb de formas estadísticamente independientes de lograr una distribución (N 1 , N 2 , • • • Nn) de partículas entre los niveles energéticos del sistema, de acuerdo con estas reglas, es •• • •• •• •• • ••• • iésimo nivel de energía: degene.r.ación 9; =9 poblac10n N;= 14 Figura 5.13. Una posible distribución de partículas entre los estados cuánticos del iésimo nivel de un sistema en el que no se aplica el principio de exclusión de Pauli. < ncr?,ético La distribución de Rose-Einstein 177 simplemente el producto de los factores de la forma (5.6-l) sobre todos los niveles del sistema por lo que (5.6-2) Ahora se puede maxlinizar esta cantidad con r~specto a las variables N¡, N 2 : • • • Nn, utilizando el método de los multiplicadores de Lagrange y de acuerdo con las restricciones (5.3-22) y (5.3-23). Los cálculos no se incluirán aquí; pero se sugiere que los ejecute el lector como ejercicio. El resultado es 1 (5.6-3) Esta fórmula se conoce como función de distribución Bose-Einstein. También ahora se puede identificar (3 como {3 = -1/kT, (5.6-4) mientras que a puede determinarse de acuerdo con el número de partículas del sistema, al igual que se hizo en los casos Maxwell-Boltzmann y Fermi-Dirac. Para el caso de un continuo de niveles muy poco espaciados entre sí, g¡ ~ g(c)d€ y N¡~ N(c)dc, lo cual da (5.6-5) Para la función de densidad de estados de partículas independientes ( 5.5-16) correspondiente a un gas bidimensional de partículas libres, el parámetro a se puede calcular explícitamente en la misma forma que e¡ para este sistema, de acuerdo con la estadística Fermi-Dirac. Se puede demostrar entonces que conforme T se incrementa, a~- oo, en cuyo caso el factor exponencial del denominador de (5.6-5) se hace mucho mayor que la unidad y la distribución Bose-Einstein (5.6-5) tiende a (5.6-6) que es una función de distribución del tipo de Maxwell-Boltzmann. Se puede obtener el mismo comportamiento general para un gas de Base-Einstein tridimensional de partículas independientes, aunque en este caso no es posible obtener una expresión para a en forma exacta. En el límite de las temperaturas muy altas, las partículas del sistema se distribuyen sobre un rango muy amplio de energía, y el número de partículas en cada rango de energía disponible será mucho más pequeño que el número de estados cuánticos de dicho rango, de donde, para todos los estados g¡ :>N¡. En esta situación, se puede escribir, aproximadamente, (N; + g¡ - 1)! ~ N; (g¡-1)! =g¡, (5.6-7) de donde, (5.6-2) se convierte en (5.6-8) 178 Mecánica estadística. Generalidades Cabe notar que esto, aparte de un factor constante N! , es igual a Q(N 1 , N 2 , • • • Nn) como está dado por (5.3-8) para un sistema Maxwell-Holtzmann. Entonces, desde un punto de vista puramente físico se debe esperar que las distribuciones Hose-Einstein y Maxwell-Holtzmann coincidan en el límite de altas temperaturas. La selección del valor dado por (5.6-4) para (j está entonces justificado, ya que esta selección, como se vio antes, lleva directamente a la correspondencia entre la estadística Hose-Einstein y Maxwell-Boltzmann indicada por (5.6-6). En el caso de los gases bidimensional y tridimensional de partículas independientes de Hose-Einstein, conforme la temperatura se acerca a cero, el valor de a tiende a cero y el resultado es que todas las partículas del sistema tienden a condensarse en el estado energético más bajo del sistema al cero absoluto. Este fenómeno, denominado condensación de Hose, es característico de los sistemas que obedecen la estadística de Bose-Einstein. En algunas aplicaciones, conviene obtener la función de distribución BaseEinstein, sin establecer la restricción de que el número de partículas del sistema sea constante. De acuerdo con (5.3-15) y (5.3-16), se puede ver que este resultado se puede obtener de (5.6-5), si se supone que a es idéntica a cero. En este caso, (5.6-5) se reduce a f(e) = 1 e/kT e · - 1 (5.6-9) EJERCICIOS l. Demuestre que el frente de onda asociado con la onda plana 'Ir= ei(k•r-wt) avanza en la dirección k. 2. Demuestre, para la partícula libre en tres dimensiones cuya función de onda está dada por (5.2-7), que el valor esperado de la cantidad de movimiento vectorial p es igual a hlc, y que p (y, por ende, k) es una constante del movimiento. 3. Calcule la densidad del factor de estados g(e)de para un sistema bidimensional de partículas libres, en el que no hay otras interacciones que colisiones instantáneas y que está contenido en un recipiente rígido de superficie A y de dimensiones x 0 y y 0 . Comience con la ecuación de SchrOdinger. 4. Suponga que se lanzan simultáneamente cuatro monedas, ¿cuáles son las probabilidades asociadas con las distribuciones (0 águila, 4 sol), (1 águila, 3 sol) ... (4 águila, O sol)? 5. Encuentre las dimensiones y la superficie del rectángulo de área máxima con lados paralelos a los ejes de las coordenadas, que se puede inscribir dentro de una elipse cuyo eje mayor es 2a y cuyo eje menor es 2b. Los ejes de la elipse pueden considerarse paralelos con los ejes de las coordenadas. Emplee el método de los multiplicadores de Lagrange. 6. Encuentre la velocidad de raíz cuadrada media y la velocidad más probable de una partícula en un gas ideal de Boltzmann. 7. Demuestre que el flujo de partículas en un gas ideal de Boltzmann, cuyas componentes x de velocidad son positivas, por unidad de área sobrt> un plano normal al eje x es -!Nc7V. Nota: el flujo o densidad de corriente se define como el número de partículas por unidad de volumen por su componente de velocidad a lo largo de la normal al plano sobre el que se observa el flujo. 8. Demuestre que la energía de Fermi de un gas de Fermi bidimensional de partículas libres cuya función de densidad de estados está dada por el resultado del ejercicio 3, es ej{T) = kTin(eEj{O)fkT- 1), en donde et{O) =Nh2f(4rrmA) 9. Calcule la energía de Fermi, en electrón-volts, para los electrones libres en el cobre al cero absoluto, suponiendo que hay un electrón libre por átomo de cobre. Indique la temperatura a la que kT será igual a ef.O). 10. Demuestre que la energía interna por unidad de volumen de un gas de Fermi de partículas libres al cero absoluto es ~!!.. ej(O). 5 V 11. Demuestre por el método de los multiplicadores lagrangeanos, que si Q(N ¡, N 2 , • • • Nn) está dada por la ecuación (5 .6-2), la función de distribución correspondiente a los valores más probables dé N •· N2, • • • Nn, está dada por (5.6-3). La distribución de Rose-Einstein 179 12. Use la función de densidad de estados calculada en el ejercicio 3 para demostrar que d parámetro a de un gas de Bose-Einstein bidimensional de partículas libres está dado por IX= )n(l _ e-h2N/(2nAmkT)). Analice las propiedades de la función de distribución resultante para T--'>- oo y para T-+ O. LECTURAS RECOMENDADAS W. Band, An Introduction to Quantum Statistics, D. Van Nostrand, Princeton, N. J. (1955). R. W. Gurney, Introduction to Statistical Mechanics, McGraw-Hill Book Co., lnc., Nueva York (1949). D. ter Haar, Elements of Statistical Mechanics, Holt, Rinehart and Winston, lnc., Nueva York (1954). R. B. Lindsay, Introduction to Physical Statistics, John Wiley and Sons, Nueva York (1941). J. E. Mayer y Maria Gi:ippert-Mayer, Statistical Mechanics, John Wiley and Sons, Nueva York (1940). R. C. Tolman, The Principies of Statistical Mechanics. Oxford University Press, Londres (1938). CAPITULO 6 Vibraciones reticulares y propiedades térmicas de los cristales 6.1 CALCULOS CLASICOS DEL CALOR ESPECIFICO RETICULAR En la sección 4.4 se delinearon algunos de los problemas que se presentan cuando se calcula el calor especifico de un cristal, suponiendo que los átomos de dicho cristal se comportan como osciladores armónicos clásicos independientes. Ahora se examinarán estos problemas detalladamente y se estudiará la forma en que se pueden resolver, usando los resultados obtenidos en los capítulos 3-5, relacionando la dinámica reticular, la mecánica cuántica y la mecánica estadística. En todas estas investigaciones se tratará de un cristal compuesto de N átomos, que se mantienen unidos en un arreglo periódico. Se supone que estos átomos sólo pueden vibrar alrededor de sus posiciones de equilibrio ya que están sometidos a fuerzas restrictivas que, en una primera aproximación, obedecen a la ley de Hooke. También se supone que no hay electrones libres, como se encontrarían en un metal, y que toda la capacidad calorífica del cristal se debe a las vibraciones de la red producidas por excitación térmica. Cuando hay electrones libres, también, se puede lograr que se muevan excitándolos por medio de una fuente calorífica externa y, entonces, su movimiento ocasiona un aumento en el calor específico observado; esto se estudiará en un capítulo posterior. El cálculo clásico supone que cada átomo es un oscilador armónico clásico tridimensional que vibra independientemente de todos los demás átomos del cristal. En estas circunstancias, se puede calcular la energía térmica interna total del cristal determinando la energía promedio de un solo oscilador y multiplicando el resultado por N. Para un solo oscilador armónico isotiópico tridimensional, la energía total es p2 e=-+ V(r) (6.1-1) 2m siendo (6.1-2) en donde m es la masa y w 0 la frecuencia natural del oscilador. Si se supone que la distribución de los osciladores por energía obedece a la ley de distribución MaxwellBoltzmann, la función de distribución que expresa la probabilidad de que un oscilador tenga una energía dada E es pl mwo2r2 f(c.) = Ae-•lkT = Ae- 2mkT e- 2fT= f(p,q) 181 (6.1-3) 182 Vibraciones reticulares y propiedades térmicas de los cristales en donde A es una constante. De acuerdo con (5.2-4), la energía promedio está dada por (6.1-4) En este caso se prefirió usar coordenadas esféricas (r, e, cf>) para el espacio de las coordenadas y (p, eP, cf>p) para el espacio de la cantidad de movimiento, para fines de integración la cual, por supuesto, debe hacerse sobre todo el espacio de fase. Puesto que el integrando no tiene dependencia en relación de e, p, ep, o 'cf>p la integración sobre estas variables se puede desarrollar de un modo muy sencillo, dando un factor de 41T tanto al numerador como al denominador, y dejando _1_ foo p4e- 2~~T dp (e) = 2m o foo pZ p2e2mkT dp m;~ foo r4e- m~~~z dr + foo o mm >rZ o 0 - (~ ) + (~ ) - "k "p • (6 1 5) • - r2e 2kT dr o En el primer término de (6.1-5), cada doble integral de (6.1-4) se ha expresado como un producto de una integral p y otra integral r; las integrales r del numerador y el denominador son iguales y se anulan, dando el primer término de la expresión antes presentada. El segundo término se maneja en la misma forma; pero en este caso las integrales de p del numerador y el denominador son las que se cancelan. Es evidente que el primer término de la expresión anterior representa la energía cinética promedio y el segundo la energía potencial promedio. Al evaluar las integrales con la ayuda de la tabla 5.1, se encuentra que (6.1-6) Para un conjunto de N oscilaciones independientes, la energía interna total U es, sencillamente, U= N(e) = 3NkT, (6.1-7) y la capacidad térmica Cv es, por definición, Cv = (8Uf8T)v = 3Nk. (6.1-8) El calor específico es la capacidad calorífica por gramo (o por unidad de volumen). La capacidad calorífica es una constante independiente de la temperatura. Para un mol de cualquier substancia, N es igual al número de Avogrado Na y la capacidad calorífica molar Cvm está dada por (6.1-9) Este resultado se conoce como la ley de Dulong y Petit, y los alumnos que han estudiado química elemental están familiarizados con ella ya que es la base de una forma rudimentaria de estimar el peso atómico de un elemento desconocido. La Teoría de Einstein sobre el calor específico 183 Cvm ~i"!'O:....__~I0'-0---2-'0-0---30-'--0---4.L.OO--- T ("K) Figura 6.1. Capacidad térmica de una substancia sólida típica graficada como una función de la temperatura. ley de Dulong y Petit concuerda totalmente con los resultados experimentales obtenidos con la mayoría de las substancias a la temperatura ambiente y por encima de ella; pero conduce a errores notables a temperaturas bajas. En el rango de temperaturas bajas, el calor específico de todas las substancias tiende a cero siendo proporcional a P conforme T se acerca a cero, como se ilustra en la figura 6.1. 6.2 TEORIA DE EINSTEIN SOBRE EL CALOR ESPECIFICO Einstein investigó las discrepancias en la teoría clásica del calor específico y, en 1911, logró explicar cualitativamente el calor específico (por lo menos en su forma observada y desde un punto de vista experimental) como una función de la temperatura. En la teoría de Einstein, los átomos se consideraban nuevamente como osciladores armónicos independientes e idénticos con una sola frecuencia de vibración natural w 0 , pero se toman como osciladores cuánticos armónicos que pueden tener sólo valores discretos de energía 1 tales que (n = 0,1,2, · · · ), (6.2-1) como está dado por ( 4.12-27). Se puede considerar que los osciladores tienen una distribución de energía del tipo Maxwell-Boltzmann, ya que forman un conjunto de sistemas que son distinguibles o identificables en virtud de su ubicación en puntos separados y distintos de la red, y puesto que cualquier número de osciladores puede estar en cualquier estado cuántico del sistema. Por tanto, aunque los átomos son osciladores cuantizados, la distribución clásica de Maxwell-Boltzmann sigue siendo la más apropiada para describir su comportamiento estadístico. Por otro lado, los verdaderos cuantos de energía vibratoria que absorben o emiten los osciladores, no son entidades distinguibles y, por tanto, la estadística de Bese-Einstein se debe utilizar 1 Por supuesto, Einstein utilizó el resultado de Planck En = nl'k.u más bien que el resultado de la mecánica ondulatoria que se da en (6.2-l) para los niveles de energía de un oscilador armónico. Si se usa el resultado original de Planck, la expresión final de la energía interna y el calor específico que se obtienen difieren de los resultados aquí derivados, ~ólo en la <lll~encia de una contribución energética de punto cero independiente de la tl'mpcratura a la energía interna 184 Vibraciones reticulares y propiedades térmicas de los cristales para describir su comportamiento estadístico. Como se verá más tarde, se pueden obtener los mismos resultados analizando las propiedades del sistema de osciladores de acuerdo con la estadística Maxwell-Boltzmann, o bien manejando la dinámica de los cuantos de energía vibratoria por medio de la estadística de Bose-Einstein. Para mayor simplicidad, se supondrá que el cristal contiene 3N osciladores armónicos unidimensionales cuyos niveles de energía están dados por (6.2-l), en lugar de N osciladores isotrópicos tridimensionales. Esta suposición se justifica, ya que existen tres grados de libertad de vibración independiente relacionados con cada átomo del cristal y que, de acuerdo con el principio de equipartición, la energía vibratoria disponible se distribuye de un modo equitativo, en promedio, entre estos tres grados de libertad. Si la energía se distribuye entre los osciladores de acuerdo con la ley de Boltzmann, el número de osciladores a la energía e es proporcional a e- efKT y la energía promedio es ¿ e<n+t)x (6.2-2) n en donde x = -liw0 /kT. (6.2-3) Sin embargo, la ecuación 6.2-2 se puede escribir como (6.2-4) La energía interna se obtiene multiplicando la energía promedio por oscilador, por el número de osciladores, como antes, de donde, 3Niiw 0 3Niiw 0 U= 3N(e) = --2- + eftwa/kT- 1 (6.2-5) e = (-aaTu_) = 3N k (-liw_o) ---;:--e~=Wo,...lk_T--:: kT 1)2. (6.2-6) y 2 V (eftwo/kT- V Este resultado se puede expresar en una forma algo más s~ncilla definiendo una "temperatura de Einstein" 8¡.; tal que liw 0 = k0E. (6.2-7) Al substituir k8E en lugar de hw 0 en (6.2-6), se tiene que (6.2-8) Teoría de Einstein sobre el calor específico 185 Para temperaturas lo suficientemente altas para que T~ eE, e0 EIT:::: 1; utilizando la expansión de series de potencias para la exponencial y reteniendo sólo los términos de primer orden, se puede ver fácilmente que en este límite, Cv se acerca al resultado clásico 3Nk. Para temperaturas bajas (T <1!; SE), e0 EIT ~ 1 y (6.2-8) se puede aproximar mediante (6.2-9) .:¡ue se acerca a cero conforme T tiende a cero, aunque no concuerda con el comportamiento T3 observado a temperaturas bajas. El primer término de (6.2-5) representa la parte de energía interna del sistema que corresponde a la energía de punto ~ero de los osciladores. Puesto que es independiente de la temperatura, no hace \·ariar el valor del calor e~pecífico. Físicamente, la razón de que el calor específico se haga tan pequeño a temperaturas bajas se puede entender suponiendo que el cristal se coloca de tal modo que hace contacto con un baño térmico externo compuesto de un gas monoatómico ideal a una temperatura dada y se deja que absorba energía de los átomos del gas ideal. La energía promedio de los átomos del gas es 3/2kT y si la temperatura del sistema es lo suficientemente alta, de tal modo que kT sea por lo menos del orden de la energía líw 0 requerida para excitar uno de los átomos vibrantes del cristal a un estado energético más alto, tales excitaciones ocurrirán frecuentemente, al chocar ~on el cristal los átomos del gas del baño térmico. Entonces, estas colisiones serán inelásticas en el sentido mecánico y la energía que inicialmente pertenecía a los átomos del gas se transferirá con facilidad a la red cristalina como energía de \"ibración. Por otro lado, a temperaturas lo suficientemente bajas, kT será mucho más pequeña que la energía de excitación líw 0 , y sólo un átomo ocasional de gas que tenga una energía mucho mayor que la promedio podrá producir una excitación de esta índole y, por tanto, transferir calor a la red cristalina. Luego, el cristal tiene relativamente poca capacidad para absorber calor de su ambiente y un cambio unitario de temperatura en el ambiente sólo ocasiona la transferencia al cristal de una cantidad de calor muy pequeña, en comparación con la que se puede transferir en conniciones similares a temperaturas más altas. Conforme la temperatura se acerca al cero absoluto, la fracción de átomos del baño térmico que poseen la mínima energía de excitación hw 0 tiende a cero, y en consecuencia, también lo hace el calor específico. La temperatura de Einstein SE = líw 0 /k se puede calcular fácilmente si se conoce w 0 . Esta frecuencia natural de vibración se puede calcular a partir de la masa atómica y las constantes elásticas observadas del cristai.2 Para muchos elementos metálicos, el valor calculado de esta manera es del orden de 100-200°K y, por ende, la transición del comportamiento a bajas temperaturas al de altas temperaturas debe ocurrir en este rango de temperaturas. Experimentalmente, se ha encontrado que la teoría de Einstein satisface las observaciones en todas las temperaturas, excepto las bajas, en donde el comportamiento de T3 observado no se puede obtener. Por lo general, los valores calculados de SE y los que se obtienen aplicando la expresión teórica (6.2-8) a datos observados, también concuerdan con bastante exactitud. Evidentemente, la teoría de Einstein proporcionó una explicación mucho mejor de los datos experimentales que la teoría clásica, a pesar de que la coincidencia con la experiencia no es perfecta. La teoría de Debye, de 1912, permitió eliminar la discrepancia entre la teoría y Jos resultados experimentales a baja temperatura y mejoró la aceptación general de Jos datos experimentales. En la teoría de Debye, se toman en 2 Véase el capítulo 3, ejercicio 6. 186 Vibraciones reticulares y propiedades térmicas de los cristales cuenta las interacciones entre los átomos que dan como resultado que exista un rango de valores posibles de frecuencia vibratoria en lugar de un solo valor Wo, como se describió en el capítulo 3. 6.3 TEORIA DE DEBYE SOBRE EL CALOR ESPECIFICO La teoría de Debye sobre el calor específico, primeramente propuesta en 1912, 3 consideraba a los átomos de los cristales como osciladores que están acoplados y que pueden propagar ondas elásticas cuya frecuencia varíe sobre un amplio rango de valores, como lo predicen los cálculos del capítulo 3. Aunque todavía se obtienen algunos resultados que son aproximaciones, se encontró que eran superior al modelo de Einstein en lo que respecta a las predicciones sobre el calor específico de substancias en la región de temperaturas bajas. Además, proporcionó una base para varias investigaciones subsecuentes más detalladas. Puesto que de acuerdo con lo anterior, los átomos del cristal no vibran independientemente unos de otros, es más conveniente trabajar con los modos normales de vibración del sistema, que con el movimiento vibratorio de un solo átomo. Ya se vio (en la sección 3.3 y el ejercicio 7, capítulo 3), que para una cadena lineal unidimensional de N átomos, existen esencialmente N modos normales de vibración. En el caso de un cristal tridimensional de N átomos, cada átomo puede vibrar independientemente a lo largo de las tres direcciones de las coordenadas, de manera que, para este sistema, se tienen 3N modos normales posibles. Puesto que cualquier movimiento vibratorio del sistema se puede considerar como una superposición de vibraciones independientes de modo normal, los modos normales se pueden tomar como oscilaciones armónicas independientes cuyos niveles de energía permisibles están dados por (6.2-1) y cuya energía promedio está dada por (6.2-4), a condición de que el número de modos normales excitados estén distribuidos en cuanto a energía de acuerdo con la ley de distribución de Maxwell-Boltzmann. Supóngase ahora que en un rango de frecuencia dw alrededor de la frecuencia w, existen g( w) dw modos normales de vibración del cristal. En consecuencia, la cantidad g(w) debe representar el número de modos normales por unidad de frecuencia a la frecuencia w. El aumento de la energía vibratoria interna del cristal, producido por estos modos de vibración, está dada por dU = (e(w))g(w) dw (6.3-1) en donde (e(w)) es la energía promedio de un modo de vibración de frecuencia w, según lo establece la fórmula (6.2-4). Es más conveniente calcular el número de modos normales g(k) dk en un intervalo dk alrededor del número de onda k, y, puesto que dk = (dk/dw)dw (6.3-1) se puede escribir como dk dU = (e(w(k)))g(k) dk = (e(w))g(k)- dw. dw (6.3-2) Para calcular g(k), sea un cristal rectangular cuyas dimensiones son (Lx, Ly, Lz) y supóngase que el origen se encuentra en un vértice del cristal, y que los bordes del cristal coinciden con los ejes + x, +y y + z. Las ecuaciones de movimiento de ~ P lkhyc, Ann. Physik 39, 789 (1912). Teoría de Debye sobre el calor específico 187 la amplitud mecánica vibratoria u(x, y, z, t), conduce entonces a soluciones vibratorias de la forma (6.3-3) Si a la expresión (6.3-3) se aplican las condiciones periódicas de frontera de la forma u(L",y,z,t) = u(O,y,z,t) u(x,L,,z,t) = u(x,O,z,t) (6.3-4) u(x,y,L.,t) = u(x,y,O,t) k" = 21tnxf L" k,= 21tn,JL, (6.3-5) en donde nx, ny, nz son enteros positivos o negativos. Los valores permisibles (kx, ky, kz), a los cuales corresponde un solo modo normal de vibración que satisfacen las condiciones periódicas de frontera, se pueden graficar como puntos en un espacio k ortogonal, como el que se ilustra en la figura 6.2. Los modos normales permisibles forman una red ortorrómbica simple en este espacio, siendo las dimensiones de la célula unitaria (2rr/Lx, 2rr/Ly, 2rr/Lz). Figura 6.2. Superficies esféricas corre~pondientes a valores constantes de la constante de propagación k Y k +dk, graficadas en un sistema de coordenadas (kx, k y, kz)· Si las dimensiones del cristal Lx, Ly, Lz son lo suficientemente grandes, la célula unitaria se hará pequeña y los puntos que representan los modos normales permisibles se amontonarán en un modo muy semejante al diagrama que aparece en 188 Vibraciones reticulares y propiedades térmicas de los cristales la figura 6.2. En este caso, se puede calcular g(k) dk, evaluando el volumen del espacio k entre la superficie esférica de radio k (6.3-6) que es el lugar geométrico de todos los puntos correspondientes al número de onda k, y otra superficie esférica de radio k + dk, que es el lugar geométrico de todos los puntos cuyo número de onda es k+ dk. El volumen requerido es, sencillamente, el comprendido entre las dos esferas de la figura 6.2 o 47Tk 2 dk. El número de modos normales permisibles se obtiene dividiendo esta cantidad entre el volumen de la célula unitaria correspondiente a un solo modo normal del sistema. Este volumen es 87T 3 f(LxLyLz) = 87T 3 /V, en donde V es el volumen del cristal. Este procedimiento da como resultado el valor k2V g(k) dk = - 2 dk. 2n Sin embargo, existen en realidad tres modos normales independientes para cada punto permisible en el espacio k, uno correspondiente a una vibración longitudinal (que ya se vio antes) y los otros dos que corresponden a dos vibraciones transversales mutuamente ortogonales que, hasta ahora, no se han considerado en este análisis. Para tomar en cuenta esas posibilidades, el lado derecho de la ecuación anterior debe multiplicarse por un factor de 3, lo cual da finalmente 3k 2 V 2n g(k) dk = - - 2 dk. (6.3-7) En este punto, se desearía utilizar alguna relación como la (3.3-7) que expresa la variación de k como una función de w para una red monoatómica, encontrando dk/dw y substituyendo los resultados junto con (6.3-7) y (6.2-4) en (6.3-2), e integrando finalmente sobre w. Born y von Karman, 4 fueron los primeros en delinear este procedimiento. Desafortunadamente, la forma matemática de la ecuación es tal que la expresión resultante es demasiado compleja y no se puede integrar en forma cerrada o manejarse numéricamente de un modo conveniente. Para contrarrestar esta dificultad, Debye aproximó la función sinusoidal (3.3-7) escribiéndola como una función lineal: w(k) = v0 k (6.3-8) en donde v0 es una velocidad de fase (constante) la cual, en principio, es igual a la velocidad del sonido de onda larga en el cristal. En realidad esto es, lo que indica (3.3-7) con respecto a longitudes de onda lo suficientemente grandes para satisfacer la condición ka~ 1T, pero Debye utilizó la función para describir el comportamiento de todas las vibraciones que se pueden propagar dentro del cristal. La integración sobre w indicada en (6.3-2) se realiza entre los límites cero y una frecuencia máxima Wm que se escoge de tal forma que el número total de modos normales de frecuencia menores que Wm deben ser justamente 3N, ya que se sabe que éste es el número real de modos normales que existen para un cristal de N átomos. 5 Existe un número de onda km correspondiente a Wm y todos los modos 4 M. Born T. von KJrman, Physikalische /eitschrift U, 297 (1912). 5 Si hubiera sido posible usar una exprc~ión exacta para relacionar w y k, la integración se habría desarrollado dentro de los límites de la primera zoua de Brillouin. Esto habría garanti!.ado que se hubiera satisfecho automáticamente la condición de que el número total de modos fu <'SC igual a 3N Teoría de Debye sobre el color específico 189 nonnales para los que k< km tienen frecuencias w < Wm, de acuerdo con (3.3-7) o (6.3-8). Por tanto, debe haber solamente 3N modos nonnales de oscilación dentro de una esfera de radio km en el espacio k. Puesto que el volumen del espacio k ocupado por un solo modo normal es 81r 3 /3 V, se puede escribir 8n 3 4 -nk 3 = 3N · 3 "' 3V o bien (6.3-9) por lo cual, utilizando la aproximación de Debye (6.3-8), W 111 = Vokm = v0 (6Nn 2 /V) 113 • (6.3-10) La variación de w en función de k, de acuerdo con la aproximación de Debye, se ilustra y se compara con el valor dado por (3.3-7) en la figura 6.3. En (6.3-10) "' Figura 6.3. La verdadera relación de dispersión (curva continua) y la relación de dispersión (curva punteada) de acuerdo con la aproximación de Debye. se supone que la velocidad v0 es la misma para ondas elásticas longitudinales y transversales. Por lo general, esto no es cierto; pero la diferencia no es siempre lo suficientemente grande para que afecte el resultado final de un modo significativo. Si ahora se substituye (6.2-4) y (6.3-7) en (6.3-2), utilizando (6.3-8) siempre que sea necesario expresar k en función de w, e integrando desde cero hasta Wm, se obtiene (6.3-11) La integral del primer término anterior se evalúa fácilmente y origina en el punto cero un aumento de la energía interna el cual, por otra parte, es independiente de la temperatura y no modifica en nada el calor específico. La integral del segundo ténnino no se puede evaluar en fonna exacta; pero se solucionará numéricamente. 190 Vibraciones reticulares y propiedades térmicas de los cristales Por lo general, se acostumbra expresar estos resultados en una forma algo diferente. Si se hace que (6.3-12) x = hwfkT, x liv (6Nn ) = liwm /kT = ~ kT -V2 m 113 (6.3-13) y (6.3-14) entonces, (6.3-12) se puede escribir en la forma 9 (T) fa¡T e-1 x dx U=-Nk0+9NkT 0 8 " 3 3 -x-· (6.3-15) 0 Como se puede ver, el parámetro e tiene las dimensiones de la temperatura y desempeña el papel de una temperatura característica en ( 6.3-15) más o menos en la misma forma que lo hace la temperatura de Einstein en (6.2-8). e se conoce generalmente como la temperatura de Debye. Por supuesto, es independiente de la temperatura, excepción hecha de la ligera variación de temperatura introducida por el cambio de V y de v0 al cambiar la temperatura. Al derivar (6.3-11), con respecto a la temperatura, se puede determinar la capacidad térmica y se demuestra fácilmente que el resultado es (T)3 fa¡T x4ex dx o (ex- 1)2. 31i2V f"'m w4e~"'/kT dw Cv- 2n2v~kT2 o (e~"'/kT- 1)2- 9Nk 0 (6.3-16) La integral de (6.3-16), que es una función exclusiva de e¡T, se puede evaluar de un modo númerico dando una función cuya gráfica se ilustra en la figura 6.4. A altas temperaturas T~ e y el término exponencial de la expresión central de (6.3-16) se pueden ampliar al igual que se hizo en relación con (6.2-8), obteniéndose una expresión que se puede integrar fácilmente; a continuación, usando (6.3-10) se puede demostrar que se obtiene el resultado clásico eV = 3Nk. A bajas temperaturas, 3Nit v ~------------------ ~~0~-----0~5--------~----~15-------2~0 ~8 Figura 6.4. La capacidad térmica de un sólido monoatómico aislador, de acuerdo con la teoría de Debye, graficada en función de la variable de temperatura reducida T/e. Teoría de Debye sobre el color específico 191 en la expreswn del lado derecho de ( 6.3-15), el límite de la integral se acerca a infinito y, por los métodos de integración de contorno, se puede demostrar que la integral definida resultan te es igual a rr4 115, dando =e = 12n Nk(!.) (au) oT s e 4 V 3 (T ~E>). (6.3-17) V Esto se conoce como la "Ley 'J'3 de Debye" y sus predicciones sobre los calores específicos en la región de temperaturas bajas concuerdan aceptablemente con los datos experimentales obtenidos con muchas substancias. El valor de la temperatura de Debye se puede calcular a partir de (6.3-14), u obtenerse experimentalmente seleccionando el valor de e con el que se obtenga la mayor concordancia entre los datos experimentales y la expresión teórica (6.3-16). Los valores calculados y los determinados de un modo experimental están casi siempre de acuerdo en el caso de substancias que obedecen las suposiciones hechas de acuerdo con la teoría de Debye. Para los elementos metálicos más comunes, la temperatura de Debye se registra generalmente en el rango de 150-450° K. Seitz 6 presenta una tabla de temperaturas de Debye y un análisis detallado de la concordancia entre los valores de la temperatura de Debye, calculados y determinados de un modo experimental. En un cristal, en el que los átomos no son todos idénticos, por ejemplo, el NaCl, se pueden excitar vibraciones elásticas pertenecientes a modos ópticos o acústicos, y los resultados calculados mediante este procedimiento ya no se pueden aplicar directamente en los cristales de este tipo. Sin embargo, los modos acústicos y los ópticos se pueden utilizar por separado. Los modos acústicos se pueden manejar mediante el procedimiento anterior, mientras que la variación de w con k para los modos ópticos es, como lo ilustra por ejemplo la figura 3.11, tan pequeña, que generalmente se obtiene una aproximación bastante buena al considerar los modos ópticos como vibracione3 de una sola frecuencia dada por (3.4-10). Los modos ópticos se pueden tratar mediante el método de Einstein, desarrollado en la sección anterior y los valores aportados por los modos óptico y acústico se combinan para dar la capacidad calorífica total del cristal. Blanckman, 7 • 8 estudió con cierto detalle éstas y otras modificaciones de la teoría primitiva de Debye, y llegó a la conclusión de que en ciertos casos específicos, el procedimiento de Debye puede llevar a errores notables y que en tales circunstancias, es mejor usar el procedimiento más exacto de Born-von Karman. Se suele pensar que una substancia metálica posee un gran número de electrones libres que pueden servir para producir en el metal un flujo de corriente al aplicarle un campo eléctrico, lo cual explica la gran conductividad eléctrica de los metales. Tomando esto como base, se podría esperar que los electrones libres adquirirían una energía cinética adicional cuando el cristal está cerca de una fuente térmica externa y que debido a ello habría un aumento notable en el calor específico. En realidad, y contrario a lo esperado, este aumento es tan pequeño que se puede pasar por alto a temperaturas mayores de aproximadamente 5° K. Por debajo de esta temperatura, en los cristales metálicos se puede distinguir una variación lineal del calor específico con respecto a la temperatura, que se debe efectivamente a los electrones libres. La explicación de este comportamiento peculiar del calor específico electrónico se dará en el análisis detallado que hace en el capítulo siguiente. 6 F. Seitz, Modern Theory o{ Solids, McGraw-Hill Book Co., Inc., Nueva York (1940), páginas 110-111. 7 M. B1ackman, Z. Physik 86, 421 (1933). 8 M. Blackman, Proc. Roy. Soc. 148, 384 (1935); 159, 416 (1937). 192 Vibraciones reticulares y propiedades térmicas de los cristales 6.4 EL FONON Hasta ahora el calor específico de materiales sólidos se ha estudiado en relacwn con osciladores armónicos cuánticos y la energía interna se ha calculado determinando el número de osciladores que hay en promedio en cada estado energético permisible. Si las vibraciones de la red se pueden tratar de este modo, entonces deben existir cuantos de energía vibratoria emitidos o absorbidos cuando ocurran transiciones entre un estado cuántico y otro. Uno de los resultados de la mecánica cuántica del oscilador armónico es que, a una aproximación de primer orden, las transiciones ocurren sólo entre estados adyacentes del sistema;9 en otras palabras, en tales transiciones, el número cuántico del oscilador puede cambiar sólo por ± l. De acuerdo con esto, el cambio de energía ~E del oscilador correspondiente a la energía del cuanto que se absorbe o emite, debe ser ~e = ~n · ñw = ± ñw (6.4-1) en donde w es la frecuencia del oscilador. El signo más de ( 6.4-1) se relaciona con la absorción y el signo menos con la emisión. Un cuanto de energía acústica de esta índole se denomina comúnmente fonón, para guardar cierta analogía con el término fotón usado para un cuanto de energía electromagnética. Un fonón se parece al fotón en que se debe considerar como algo que tiene características tanto de onda como de partícula; de hecho, es muy posible tratar la interacción entre dos fonones o entre un fonón y un electrón, como una "colisión" de dispersión entre dos partículas. En efecto, el resultado de Debye para el calor específico se puede obtener considerando las vibraciones reticulares del cristal como un gas de fonones. Puesto que los fonones son partículas no distinguibles, se debe utilizar la función de distribución Bose-Einstein para describir la distribución de partículas entre los estados energéticos del sistema y, dado que el número de fonones del sistema no es constante con respecto a la temperatura, la forma que toma la función de distribución es (5.6-9), en donde a= O. El número de fonones en el rango de frecuencias dw, alrededor de w (correspondiente a un rango de energía dE alrededor de E= hw) es, entonces, N(w) dw = g(w) dw ehw/kT _ 1 (6.4-2) en donde g( w) dw es el núm~:ro de vibraciones normales posibles del sistema dentro del rango dw alrededor de w. No obstante, en (6.3-2) y (6.3-7), ya se sabe que dk 3k 2 V dk w 2n g(w) dw = g(k) -d dw = -.2 -d dw. w (6.4-3) Utilizando la aproximación de De by e ( 6.3-8) para expresar k y dk/dw en función de w (6.4-2) se convierte en 3V N(w) dw = -----z-3 2n v0 e w 2 dw hwfkT - 1 • (6.4-4) 9 Para una derivación de esta regla de selección véase R. B. Leighton, Principies of Modem Physics, McGraw-Hill Book Co., Inc., Nueva York (1959), páginas 211-222. Expansión térmica de los sólidos 193 El aumento de la energía interna correspondiente al rango de frecuencias dw alrededor de w es, simplemente, la energía cuántica hw multiplicada por el número de cuantos que haya en ese rango de frecuencias. Por tanto, dU = e(w)N(w) dw = hwN(w) dw 3/iV w 3 dw = 21t2V~ eAw/kT _ 1 · (6.4-5) Al integrar sobre todas las frecuencias permisibles desde cero hasta la frecuencia máxima de Debye Wm, se obtiene directamente el resultado (6.3-11). Por supuesto, el término de energía de punto cero no se obtiene cuando la energía interna se calcula en esta forma, ya que la energía de punto cero no está relacionada de ningún modo con la distribución de los fonones. Sin embargo, este término no modifica el calor específico y los dos métodos conducen al mismo valor (6.3-16) del calor específico; dicho resultado es de interés físico y accesible a la medición. En consecuencia, el sistema se puede tratar como un conjunto de osciladores armónicos distinguibles que obedecen a la estadística de Maxwell-Boltzmann o bien, como un gas de fonones o cuantos de energía vibratoria, que no son distinguibles, y que obedecen a la estadística de Base-Einstein. 6.5 EXPANSI ON TERMICA DE LOS SOLIDOS La representación de un sólido como sistema de átomos que tienen la libertad para vibrar alrededor de un arreglo periódico de posiciones de equilibrio, desarrollado en las secciones anteriores, basta para explicar el comportamiento observado del calor específico y, también, es suficiente para entender la expansión térmica de los sólidos. No obstante, en este caso se encuentra que si los átomos del cristal son simples osciladores armónicos ideales, no puede haber una expansión térmica en absoluto, de acuerdo con el pensamiento de la mecánica clásica ni la cuántica, y que el efecto total de la expansión térmica de un cristal real depende de la inarmonía de las vibraciones de la red. Este resultado se puede comprender cualitativamente considerando la energía potencial de interacción entre átomos cercanos, que debe tener la forma de una función de la distancia interatómica, como se ilustra en la figura 6.5. El mínimo en la curva de energía potencial, en B, es la posición clásica de equilibrio del átomo en cuestión cuando está en reposo. Si las fuerzas interatómicas fueran tales que el átomo al activarlo por excitación térmica vibrará alrededor de su posición de equilibrio, como un oscilador armónico clásico ideal, entonces la curva potencial sería una parábola perfecta cuyo vértice se ubicaría en B. En un ''pozo'' de potencial de esta naturaleza, el átomo ejecutaría vibraciones armónicas alrededor del punto de equilibrio B, las excursiones máximas a partir de dicho punto de equilibrio en ambas direcciones serían iguales, y la distancia interatómica promedio (x} sería igual a la .::onstante de red a temperatura cero, a. Así pues, no habría ninguna expansión térmica en absoluto. Sin embargo, en realidad, el cristal se desintegra al aplicarle una cantidad finita de energía y, por tanto, el pozo potencial en el que vibran los átomos debe tener .1proximadamente la apariencia que se ilustra en la figura 6.5. En este caso, aunque es casi parabólico alrededor del punto mínimo B, el verdadero pozo se desvía cada 194 Vibraciones reticulares y propiedades térmicas de los cristales t• 1-- Pozo P.arabólico que corresponde ¡ al OSCilador ideal armónico ~O~l¡---:~----t-----=:==~~~==~--- X Energfa potencial del átomo Niveles cuanticos permitidos del oscilador inarmónico Figura 6.5. Representación de la energía potencial de un solo atomo del cristal en tunción del espaciamiento interatómico, ilustrando el papel de la componente inarmónica en la expansión térmica. vez más de la forma parabólica conforme aumenta 1a distancia que lo separa del punto mínimo. Si el átomo tiene una energía e0 , como debe ser, de acuerdo con el cuadro clásico, deberá vibrar entre los límites de amplitud extrema A y C, siendo las vibraciones de naturaleza más bien inarmónica. No obstante, la distancia DC entre la posición de equilibrio y la posición de máxima extensión es ahora mayor que la distancia AD entre la postción de equilibrio y la posición de máxima compresión. La distancia interatómica promedio <x> es, por tanto, mayor que la constante de red a temperatura cero y se observa una expansión térmica. Se puede demostrar que esta observación clásica del efecto lleva a la conclusión de que la expansión térmica <x>- a es directamente proporcional a la temperatura o que el coeficiente de expansión térmica d(<x>- a)/dT es independiente de la temperatura. Esto concuerda bastante bien con lo observado en la mayoría de las substancias, en el rango de temperatura ambiente o un poco por encima de ella. No obstante, a temperaturas bajas, el coeficiente de expansión térmica observado en la mayoría de los materiales se hace mucho más pequeño que el valor clásico y, en efecto, tiende a cero conforme la temperatura absoluta se acerca a cero. También aquí la representación clásica se hace inaplicable y los átomos del cristal deben considerarse como osciladores cuánticos y no como clásicos. Para calcular la expansión térmica, primero se debe resolver la ecuación de Schrodinger utilizando un potencial inarmónico (por lo general basta con modificar el potencial armónico (4.12-6) mediante la adición de un término cúbico en x) para obtener los niveles energéticos En y las funciones de onda correspondientes a este potencial modificado y, a continuación, se debe encontrar el valor esperado <x>n para cada estado energético permisible según (4.8-11). Entonces, la distancia interatómica, promediada sobre una distribución de Maxwell-Boltzmann, debe escribirse (en analogía con (6.2-1)) como L (x).e-•nlkT (x) = • Le tn/kT • (6.5-1) Conductividad térmica reticular de los sólidos 195 en donde la suma se toma sobre todos los niveles de un oscilador inarmónico. Los detalles de este procedimiento son muy complejos y no se presentarán aquí. El coeficiente de expansión térmica calculado mediante este método se acerca a cero y concuerda aceptablemente con los experimentos sobre un amplio rango de temperaturas. 6.6 CONDUCTIVIDAD TERMICA RETICULAR DE LOS SOLIDOS La conducción de calor en los sólidos es un proceso en el que las vibraciones de red desempeñan también un papel importante. En los cristales metálicos en los que se tienen grandes concentraciones de electrones libres, éstos hacen aumentar notablemente la conductividad térmica y, en efecto, constituyen el mecanismo principal para el transporte de energía térmica a través del cristal. El estudio de la conductividad térmica electrónica en los metales se facilita realizándolo a la luz de la teoría del electrón libre de los metales y, por tanto, se pospondrá hasta un capítulo posterior. Sin embargo, en substancias no metálicas, el transporte de calor a través del cristal se debe exclusivamente a las vibraciones de la red. La conductividad térmica se define generalmente como una situación de flujo térmico unidimensional, en la que hay una diferencia de temperatura t:1l' sobre una distancia &, originando un flujo de calor /Y), en una superficie A dentro de un tiempo !:J.t. La conductividad térmica es el coeficiente de proporcionalidad entre el flujo de calor por unidad de área y el gradiente de temperatura. De acuerdo con esta definición, se puede escribir J qx 1 AQ AT =--=-KA At Ax' (6.6-1) en donde K es el coeficiente de conductividad térmica y Jqx el flujo de calor por unidad de área o la densidad de corriente térmica. El signo menos es obligatorio, ya que K se considera como una cantidad positiva; pues, con un gradiente de temperatura positivo se obtendría una corriente térmica negativa. Si se conserva la energía térmica, la corriente térmica debe obedecer siempre a la ecuación de continuidad de la forma oTq" aQ V·J = - = - - . q ax ot (6.6-2) Si se combinan (6.6-2) y (6.6-l), se puede ver fácilmente que la temperatura (y, por ende, la energía térmica por átomo) debe obedecer a una ecuación diferencial de la forma K o2 T oT ~ ox 2 =a¡· (6.6-3) . Esta ecuación diferencial parcial es esencialmente la misma que la ecuación que de~cnbe el tra~sporte por difusión de partículas móviles en un medio en el que ex1~te .un gradiente de concentración. Difiere de la ecuación para la propagación radiactiva (3.1-12) en que el lado derecho es la primera derivada con respecto al tiempo Y no la segunda derivada. Sus soluciones características tienen un comporta- 196 Vibraciones reticulares y propiedades térmicos de los cristales miento exponencial en lugar de armónico con respecto al tiempo, como se verá más adelante en un capítulo posterior. En un sistema compuesto de osciladores armónicos ideales, los diversos modos normales de oscilación del sistema son completamente independientes los unos de otros, no existiendo en absoluto ningún acoplamiento entre los diferentes modos normales de vibración. Si se excita un modo normal dado de dicho sistema, éste vibrará en forma estable en ese mismo modo normal durante un periodo indefinido. En un sistema de este tipo, la energía de vibración se propaga directamente por radiación acústica en lugar de hacerlo por un proceso mucho más lento que se asocia con la conducción térmica. Así pues, la energía fluye a través del sistema con la velocidad del sonido, y no existe un mecanismo mediante el cual se pueda hacer aleatoria esta energía y mediante el cual se crea una resistencia térmica, de modo que la conductividad térmica del espécimen es esencialmente infinita. Estas observaciones son aplicables a los osciladores cuánticos al igual que a los osciladores clásicos. Este estado de cosas se puede describir en función de los fonones mediante la proposición de que los fonones correspondientes a diferentes vibraciones armónicas de modo normal no interactúan entre sí en absoluto -o que su sección transversal de interacciones mutuas es cero. Si se introduce una pequeña inarmonía en dicho sistema, se produce un acoplamiento entre los diversos modos normales. En este caso, si en un principio se excita un solo modo normal, la energía que inicialmente pertenece a este modo se transferirá gradualmente a otros modos normales que pueda tener el sistema y, así. quedará aleatorizada. En el lenguaje de los fonones, se puede decir que los fonones que representan las diferentes vibraciones de modo normal del sistema, interactúan (o chocan) unos con otros. En otras palabras, un grupo de fonones correspondientes a un solo modo normal del sistema armónico interactúan (o dispersarán unos a otros) de tal forma que, después de cierto tiempo, las cantidades de movimiento de cada fonón y sus direcciones de propagación cambiarán de una manera esencialmente aleatoria. La distribución de los fonones se convierte así, en una distribución que representa una selección más o menos aleatoria de los modos normales del sistema. dentro de las restricciones impuestas por la conservación de energía y la cantidad de movimiento en las interacciones individuales. De acuerdo con esto, es evidente que la conductividad térmica sería infinita. de no ser por la inarmonía de las vibraciones de red. La fuerza de la componente de inarmonía del potencial interatómico es, por tanto, un factor primordial en la determinación de la conductividad térmica. Puesto que la magnitud de la inarmonía aumenta de acuerdo con la amplitud de vibración, es de esperarse que la conductividad térmica disminuya conforme se incrementa esta amplitud, llegando a una reducción de la conductividad térmica de la red al aumentar la temperatura. Este efecto se observa de un modo muy general en los experimentos efectuados a temperaturas lo suficientemente elevadas. Una medición inversa de la fuerza de la interacción inarmónica entre los átomos de cristal, está dada por la distancia promedio que un fonón puede recorrer entre las colisiones aleatorizadoras o fenómenos de dispersión en que intervienen otros fonones. Esta distancia se conoce como la trayectoria libre media para las interacciones fonón-fonón y la conductividad térmica de los sólidos se puede entender con mayor facilidad sobre una base cualitativa en términos de la trayectoria libre media. En secciones posteriores se tendrá la ocasión de analizar la trayectoria libre media de un modo más preciso y en una forma cuantitativa. La conductividad térmica de los sólidos se comprenderá con mayor claridad considerando al cristal como un recipiente que encierra un "gas" de fonones. Primero se desarrollará una fórmula para la conductividad térmica de un gas monoatómico ideal y luego se examinará cómo se puede aplicar a la red de un sólido cristalino En primer lugar, se debe definir el número de partículas de un gas ideal Conductividad térmica reticular de los sólidos 197 que tienen una velocidad en el rango de dv alrededor de v, que cruzan un elemento de área dS por unidad de tiempo, desde una dirección que queda dentro del rango angular d(J alrededor del ángulo polar fJ. Esta cantidad es la mitad del número dentro del rango de velocidad en el interior de una columna cuya sección transversal es dS cos (J (que es la proyección del área dS sobre un plano normal a la dirección fJ) que queda a una distancia de v centímetros del elemento de área propiamente dicho. Esta situación se ilustra en la figura 6.6. El factor un medio se incluye porque, en promedio, sólo la mitad de las partículas dentro de la columna que va a lo largo de la dirección (J, están encaminadas hacia el elemento de área, y el resto va en dirección opuesta. Si n(v) dv es el número de partículas por unidad de volumen que tienen la velocidad dentro del rango v alrededor de v, entonces, el número que cruza el elemento de área es dn = fv · n(v) dv · 4n sen 9 d(J • dS cos 9 = fvn(v) sen(} cos (} dv d(J dS. 41t (6.6-4) El factor asociado con sen (J anterior representa la relación del ángulo sólido subtendido por d(J alrededor de O y e1 ángulo sólido 41T subtendido por todo el espacio; es evidente que ese factor debe aparecer también en la expresión. Si se integra sobre v utilizando la distribución Maxwell-Boltzmann (5.4-14) (y recordando que la distribución de velocidad es independiente de fJ), se obtiene n(9) d(J = fnc sen 9 cos (} d(J dS (6.6-5) con e dada por (5.4-20), como el resultado deseado. En este punto conviene hacer notar que el problema de la conducción térmica siempre implica un flujo de energía y un gradiente de temperatura, es decir que el sistema en cuestión nunca se encuentra en un estado de equilibrio térmico. Por esta razón, no es estrictamente correcto utilizar las funciones de distribución estadística que se aplican a sistemas en equilibrio. Sin embargo, si el gradiente de temperatura del sistema es tan pequeño que la variación fracciona! de la temperatura absoluta sobre una trayectoria libre media es reducida, se justifica el uso de la distribución en equilibrio como una aproximación. En todo caso, el problema se limitará aquí al estudio de sistemas de esta naturaleza. La cuestión del uso de distribuciones estadísticas en sistemas que no están en equilibrio, se examina en el siguiente capítulo. FJgUra 6.6. Geometría de partículas que fluyen a través de un plano, usadas en el cálculo de la sección 6.6. 198 Vibraciones reticulores y propiedades térmicas de los cristales Por lo pronto, considérese la situación Ilustrada en la figura 6. 7. Se supone que existe un gradiente de temperatura a lo largo del eje x, de tal manera que las partículas en el origen tienen una energía promedio e y las que se encuentran a una corta distancia hacia la izquierda tienen la energía promedio e+ &. Supóngase que una partícula principia a una distancia 1 del origen y cede su energía a la distribu· ción en el origen, en una colisión que se produce en ese lugar. De acuerdo con la expansión de Taylor, la energía de esta partícula es (6.6-6) Por supuesto, para esta partícula se tendrá otra que va en dirección opuesta y que transporta e energía desde el origen hasta el punto inicial de la primera partícula. El transporte neto de energía es & = (1 cose) (3ef3x ), y, puesto que el valor promedio de 1 es simplemente la trayectoria libre media entre las colisiones aleatorias, que se denominará X, el transporte neto de energía por partícula, promediada sobre la distribución de las longitudes de trayectoria 1, es oe e = (A. cos 8) ox. (6.6-7) Para partículas con un ángulo polar e, de acuerdo con ( 6.6-5) y ( 6.6-7), se produce un flujo neto de energía !lF por unidad de área, en donde !l.F = !l.e · n(O) dO 1 oe = - ncA.- cos 2 Osen O dO dS 2 ox . (6.6-8) Al integrar sobre el ángulo polar e entre los límites de O y 1r se puede ver fácilmente que el flujo total de energía debe ser -tncX (3e/3x). No obstante, de acuerdo con la definición de la conductividad térmica, K (6.6-l), esto debe ser igual también a K (3Tj3x). De acuerdo con esto, oT 1 oe 1 oe oT K - =-nCA.- =-nCA.- - , ax 3 ax 3 ar ax • +Ó• Figura 6.7. (6.6-9) • Trayectoria de una partícula en un sistema que contiene un gradiente de temperatura en la dirección x. Conductividad térmica reticular de los sólidos 199 por lo cual, 1 ae 1 K = - ncA. - = - e A.c 3 ar 3 u • (6.6-10) de donde, por definición, el calor específico cv es n(oe/31). Este resultado, que se acaba de derivar para un gas ideal de Maxwell-Boltzmann, es aplicable también a una distribución de fonones, a condición de que se sobreentienda que la velocidad e se refiere a una velocidad promedio de fonón, esto es, a una velocidad promedio de sonido dentro del cristal. [Se recordará que la distribución de Boltzmann se utilizó sólo para velocidades promedio al obtener (6.6-5).] Entonces, de acuerdo con (6.6-10), el problema de determinar la conductividad térmica de red se puede reducir esencialmente a la determinación de la trayectoria libre media de los fonones en el cristal, ya que la velocidad del sonido y el calor específico se pueden medir o calcular con facilidad. Desgraciadamente este problema no es tan sencillo. Reproducir el trabajo comprendido en su cálculo queda más allá del alcance de este libro. Peierls,l 0 fue el primero en resolver este problema, y encontró que X es proporcional a 1/T a temperaturas elevadas y a eE>/lT a temperaturas bajas. De acuerdo con esto, la conductividad térmica se deberá hacer infmitamente grande conforme la temperatura se acerca al cero absoluto, ya que el producto de Cv y X divergirá al infmito en este límite. Sin embargo, en realidad, a temperaturas muy bajas la trayectoria libre del fonón deja de estar limitada por las interacciones fonón-fonón y se ve limitada, por el contrario, por la dispersión de fonones mediante impurezas e imperfecciones en el cristal o bien, en cristales muy puros, por las superficies de la misma muestra de cristal. ¡En este último caso, se ha encontrado que la conductividad térmica del cristal es una función del tamaño de la muestra! En cualquier caso, la trayectoria libre media tiende a un límite finito conforme T se acerca a cero, y la conductividad se acerca a cero conforme T tiende a cero, debido al hecho de que Cv se desvanece en el límite de la temperatura cero. Entonces, al incrementarse la temperatura la conductividad térmica aumenta de cero a cierto valor máximo y luego disminuye conforme la temperatura se incrementa más todavía. Este comportamiento cualitativo se ha observado, efectivamente, de un modo experimental en la mayoría de los casos y las magnitudes de los valores calculados ( 6.6-1 O) a partir de los valores calculados de X, concuerdan con los datos experimentales en el orden de magnitud. Casimir 11 fue el primero en estudiar el efecto de la dispersación a través de las fronteras del cristal, y Klemens 12 fue quien trató detalladamente el efecto de ciertos tipos de imperfecciones. EJERCICIOS l. Demuestre de un modo explícito, utilizando la estadística de Maxweli-Boltzmann, que la energía promedio de un oscilador armónico clásico tridimensional es sencillamente tres veces la de un oscilador armónico clási.::o unidimensional a la misma temperatura y que, por tanto, no unporta si el cristal de N átomos se considera como un conjunto de N osciladores tridimensionales o bien, como 3N osciladores unidimensionales. 2. Calcule, por el método de Debye, la capacidad calorífica de una red cristalina periódica bidimensional que contiene N átomos idénticos, y demuestre que a temperaturas bajas, la capacidad calorífica varía con la temperatura como 'J'2. ¿Cuál es el límite en alta temperatura para la capacidad térmica? lO R. Peierls, Ann. Physik 3, 1055 (1929). 11 H. B. G. Casimir, Physica 5, 495 (1938). 12 P. G. Klemens, Proc. Roy. Soc. A208, 108 (1951). 200 Vibraciones reticulares y propiedades térmicas de los cristales 3. Calcule la temperatura de Debye 8 para (a) diamante, (b) germanio, (e) cobre y (d) plomo, y compare sus resultados con Jos valores publicados derivados de los datos experimentales de la capacidad térmica. 4. Utilice la relación de Planck para expresar la energía de un fonón en relación con su frecuencia y la relación de De Broglie para expresar la cantidad de movimiento en función del número de onda; encuentre una expresión para la "masa" equivalente de un fonón de energía térmica promedio a 300° K, y compare este valor con la masa electrónica. Puede suponer que k es tan pequeña que se puede hacer caso omiso de Jos efectos de dispersión. S. Demuestre que el valor promedio <x>n de la amplitud de un oscilador armónico cuántico, en el nésimo estado de energía, es cero. 6. Utilice las leyes de la termodinámica para demostrar que la difer~::ncia entre el calor específico de una substancia a presión constante y a volumen constante está dada por 9oc 2 VT Cp-Cu = - - - K~oo en donde a es el coeficiente lineal de expansión y Kiso es la compresibilidad isotérmica - V-1 (iW/aP>r· Nota: Observe que, de acuerdo con las relaciones de Maxwell (os/aP)r=-(av¡aT)p. 7. Sea un conjunto de N sistemas idénticos que tienen sólo dos niveles de energía, a las energías cero y € 0 . Suponiendo que los sistemas son distinguibles, encuentre (a) la energía interna del conjunto, (b) la capacidad térmica, (e) las expresiones aproximadas para la capacidad térmica en los límites de temperatura alta y baja. Grafique la capacidad térmica en función de la temperatura. 8. Para el conjunto de sistemas que se vio en relación con el ejercicio 7, demuestre que la capacidad térmica alcanza un valor máximo a una tt.>mperatura T 0 para la que xtanhx=l en donde x =e0 /2kT. Demuestre también que la capacidad térmica a esta temperatura está dada por c. (max) = Nk (x~ - 1) en donde X o = e0 /2kT0 • Las contribuciones a la capacidad térmica de sistemas de esta naturaleza, se encuentran con frecuencia a temperaturas bajas en substancias paramagnéticas y se conocen también con el nombre de anomalías de Schottky. 9. De acuerdo con la expresión de la mecánicd cuántica e=<1 +nx +ny +nz)hvo (en donde nx, nY. y nz pueden ser cero o enteros positivos) para los niveles de energía de un oscilador armónico tridimensional, demuestre, en el límite de las energías grandes en donde e>% y de:lil>%, que el número de estados cuánticos dentro de un rango de alrededor de la energía e, está dado por g(e) de= e2de/2(flwo) 3 • 10. Utilice el resultado del problema 9 para demostrar que la expresión (e)= 3kT para la energía promedio de un oscilador armónico clásico tridimensional de un sistema cuyos miembros están distribuidos en energía de acuerdo con la ley de Boltzmann, se puede obtener sencillamente evaluando la expresión fef(e)g(e) de (e) = Jt(e)g(e) de Compare críticamente los aspectos físicos de este método y el que se utilizó para obtener el mismo resultado en la sección 6.1. REFERENCIAS GENERALES P. G. Klemt'ns, Thermal Conductivity and Lattice Vibrational Modes, en Salid State Physics, Advances in Research and Applications, Vol. 7, Academic Press, Nueva York (1959), pp. l-98. Conductividad térmica reticular de los sólidos 201 1. de Lannay, The Theory of Specific Heats and Lattice Vibrations, en Salid State Physics, Advances in Research and Applications, Vol. 2, Academic Press, Nueva York (1956), pp. 219-303. LB. Leighton, Principies of Modern Physics, McGraw-Hill Book Co., Inc., Nueva York (1959), capítulo 6. 1l. B. Peierls, Quantum Theory o[ Solids, Clarendon Press, Oxford (1955), capítulo 11. f Seitz, Modern Theory of Solids, McGraw-Hill Book Co., Inc., Nueva York (1940), capítulo Ill. CAPITULO 7 Teoría del electrón libre de los metales 7.1 INTRODUCCION En 1900, Drude 1 fue el primero en formular la hipótesis de que la gran conductividad eléctrica y térmica de las substancias metálicas podría explicarse debido a la presencia de grandes concentraciones de electrones libres móviles en estos materiales. Más tarde, Lorentz 2 investigó exhaustivamente las implicaciones de esta idea. Drude y Lorentz supusieron que los electrones libres de un metal podían considerarse como un gas ideal de partículas libres, el cual obedece a la estadística de Maxwell-Boltzmann, cuando se encuentra en equilibrio térmico. Para examinar lo que puede suceder cuando se permite el flujo de corrientes eléctricas o térmicas, estableciéndose así un estado de desequilibrio, fue necesario investigar cómo se modificaría la distribución de equilibrio mediante una (pequeña) corriente eléctrica o térmica. También fue necesario estudiar el comportamiento cinético de los electrones como el de partículas libres sujetas a colisiones instantáneas que sirven para volver la distribución a una condición de equilibrio, y para expresar el resultado final de la conductividad eléctrica y térmica en términos de una trayectoria libre media o tiempo libre medio entre estos choques aleatorios. La teoría Drude-Lorentz explicó satisfactoriamente la ley experimental bien conocida de Wiedemann y Franz, 3 según la cual la relación existente de la conductividad eléctrica a la térmica es casi la misma para la mayoría de los metales. Además, para calcular las magnitudes de la conductividad eléctrica y térmica se podrían utilizar los valores más elevados para la trayectoria libre media. Sin embargo, la teoría del electrón libre en su forma más sencilla llevó a una predicción de la componente electrónica del calor específico que (suponiendo que la teoría de Debye para el componente reticular esté en lo correcto) estaba en gran desacuerdo con los resultados experimentales. Sommerfeld4 resolvió esta dificultad Uunto con algunas otras) utilizando la estadística de Fermi-Dirac en lugar de emplear la estadística clásica de Boltzmann. La representación del electrón libre empleando la estadística de Fermi-Dirac constituye una forma teórica muy directa y sencilla de analizar y entrever los efectos de transporte en los metales. Puesto que principia con una idea preconcebida del aspecto de un metal, no tiene ningún valor para explicar 1 P. Drude, Ann. Physik 1, 566 (1900). 2 H. A. Lorentz, The Theory of Electrons, Teubner Verlag, Leipzig 3 Wiedemann y Franz, Ann. Physik 89, 497 (1853). 4 A. SommerfeJd, Z. Physik, 47, 1 (1928). 203 (1909). 204 Teoría del electrón libre de los metales por qué algunas substancias son metales y tienen electrones libres en abundancia y otros son aisladores con sólo unos cuantos electrones libres, si es que los tienen. Para encontrar una explicación a estas cuestiones fundamentales, es necesario comenzar examinando el comportamiento mecánico cuántico de los electrones en los campos periódicos de potencial, examinando el mismo tema en un nivel mucho más fundamental. El último planteamiento se pospondrá hasta el siguiente capítulo, en el que se demostrará que las propiedades de los metales y los aisladores se pueden comprender de acuerdo con la teoría cuántica, y que las bases en las que descansa la teoría del electrón libre son, en su mayor parte, compatibles con los requisitos de la mecánica cuántica. 7.2 LA ECUACION DE BOLTZMANN Y LA TRAYECTORIA LIBRE MEDIA En cualquier problema de mecánica estadística, lo más importante es conocer la forma de la función de distribución. Por supuesto, en un sistema de equilibrio térmico, la función de distribución será una de las que ya se estudiaron en el capítulo 5, pero si el estado del sistema no es de equilibrio (por ejemplo, si fluye una corriente o hay un gradiente de temperatura), la función de distribución será algo distinta. Naturalmente, en el límite en que desaparece la perturbación de la condición de equilibrio, la función de distribución de desequilibrio debe aproximarse a la distribución de equilibrio apropiada. Entonces, para cualquier estudio estadístico de procesos en desequilibrio debe darse un paso preliminar que consiste en la determinación de una forma para evaluar la función de distribución cuando el sistema se encuentra en un estado de desequilibrio. Esto se logra mediante la ecuación de Boltzmann. Para deducir esta ecuación, debe considerarse una región de espacio de fase alrededor del punto (x,y,z,px,Py.Pz). El número de partículas que entra en esta región en el tiempo dt, es igual al número de las que estaban en la región del espacio de fase en (x- Vxdt, y - Vydt, z - Vzdt, Px - Fxdt, Py - Fydt, Pz - Fzdt) en un tiempo anterior dt. En este caso, F representa la fuerza que actúa sobre las partículas de la distribución en el punto (x, y, z) y el tiempo t, y se sigue de la ley de Newton, F = dpfdt. Si f(x, y, z, Px• Pv• Pz) es la función de distribución que expresa el número de partículas por estado cuántico en la región, entonces, habrá un cambio df que ocurre durante el tiempo dt, debido al movimiento de las partículas en el espacio de las coordenadas y debido a que los campos de fuerza que actúan sobre las partículas tienden a moverlas de una región a otra en el espacio de la cantidad de movimiento; este cambio df es df = f(x- v"dt, y- v,dt, z - v.dt, Px- F"dt, p1 - F,dt, Pz- F.dt) - f(x,y,z,p",p,,p.). (7.2-1) Utilizando la expansión de Taylor y manteniendo sólo los términos de primer orden dentro del límite dt ~O, esta expresión se puede escribir como sigue La ecuación de Boltzmann y la trayectoria libre media 205 o bien, df = -v · dt - vrF ·V f J (7.2-2) p ' en donde el símbolo VP se refiere al operador del gradiente en el espacio de cantidad de movimiento (px, Py. Pz). Hasta ahora sólo se ha explicado el cambio en la función de distribución debido al movimiento de las partículas en el espacio de las coordenadas y debido a los cambios en la cantidad de movimiento originados por los campos de fuerza que actúan sobre las partículas. Las partículas también se pueden ~ransferir hacia dentro o hacia afuera de una región dada del espacio de fase, por medio de colisiones o interacciones de dispersión que abarcan otras partículas de la distribución o centros de dispersión externos al conjunto de partículas que se están estudiando. Si la velocidad de cambio de la función de distribución debida a las colisiones o a la dispersión se representa mediante (a¡;at) col• entonces, la velocidad total de cambio de f se puede obtener sumando esta cantidad al lado derecho de (7.2-2), lo cual da # = -v•Vf-F·VPJ+ dt (~) at (7.2-3) col Esta es la ecuacton de Boltzmann. Si se conoce el campo de fuerza F y la velocidad de cambio (a¡;at) col• de la ecuación diferencial (7.2-3), en principio, se puede despejar la función de distribución. Por supuesto, a fin de hacer esto se debe adoptar para la interacción de dispersión algún modelo que pueda proporcionar la velocidad a la que las partículas a consecuencia de colisiones pueden entrar en cualquier región dentro del espacio de fase a salir de ella. Por ejemplo, se pueden suponer condiciones de estado estacionario que indican que df/dt =O, y, además, especificar que no existen campos de fuerza que actúen sobre las partícula~ y que las partículas de la distribución son esferas duras, perfectamente elásticas y de un radio dado, que sufren colisiones que pueden tratarse mecánicamente de acuerdo con las leyes clásicas del movimiento, para obtener un valor promedio para (a¡;at) col· Este cálculo mecánico proporciona fundamentalmente una sección transversal de la dispersión de una partícula de la distribución. En este caso, se puede demostrar que la ecuación de Boltzmann lleva directamente a la distribución Maxwell-Boltzmann del capítulo 5. La ecuación de Boltzmann se usa más comúnmente para analizar las propie· dades de un sistema que se encuentra desplazado del estado de equilibrio debido a una fuerza perturbadora pequeña -por ejemplo, un campo eléctrico o un gradiente de temperatura- cuando se conoce la función de distribución / 0 , que es la función de distribución en equilibrio, cuando no hay perturbación. En estos casos, con frecuencia se supone que el término de la colisión tiene la forma (-a¡) -_-f-- -Jo at col (7.2-4) T en donde T es un parámetro denominado tiempo de relajación o tiempo libre medio. L~ ecuación (7.2-4) representa la velocidad a la que la función de distribución se acerca a la condición de equilibrio (habiéndose eliminado repentinamente la fuerza de perturbación), siendo proporcional en cualquier tiempo a la desviación, desde el equilibrio. 206 Teoría del electrón libre de los metales Por ejemplo, suponga que un campo eléctrico E0 ongma una corriente en un circuito que se compone de una substancia metálica uniforme, de tal modo que f es la misma en todos los puntos y, por ende, Vf = O. Mientras el campo se aplica, la fuerza F de (7.2-3) debe representarse como -eE0 ; pero si el campo se suprime de un modo repentino, por ejemplo, cuando t =O, entonces, para valores positivos de t, F = O, y la ecuación de Boltzmann, utilizando la aproximación del tiempo de relajación (7.2-4), se convierte en f-fo =--- (t >O) (7.2-5) que se puede resolver fácilmente y se obtiene f- fo = (const.)e-'1' (t > 0). (7.2-6) Así es como la función de distribución se aproxima exponencialmente junto con la constante de tiempo 7, a la función de distribución en equilibrio y se descubrirá que la corriente del circuito disminuye de su valor inicial esencialmente en la misma forma, tendiendo a cero exponencialmente con la constante de tiempo 7. A primera vista, este resultado parece contradecir la evidencia experimental; pero en realidad no se opone a ella, ya que la constante de decaimiento 7 en circunstancias ordinarias, es muy corta, casi siempre del orden de 1o- 13 segundos. Un estudio más cuidadoso puede ayudar a verificar la factibilidad de (7.2-6), ya que la acción del campo eléctrico es darle a los electrones del circuito una velocidad de arrastre en dirección opuesta a la corriente que, de acuerdo con la ley de la inercia, debe persistir durante un corto tiempo después de la supresión de la fuerza, hasta que los electrones del conductor pasen los procesos que aleatorizan su velocidad reduciendo la velocidad promedio de arrastre a cero. Es evidente que las colisiones ejercen influencia en una distribución que es perturbada de un modo u otro, pero tiende a restaurarse al estadd de equilibrio y, si dicha perturbación se suprime, esta restauración se logra en un tiempo del orden del tiempo de relajación 7. Los detalles del proceso de dispersión determinan el tiempo de relajación que, en general, es una función de la energía, debido a que la sección transversal de la dispe1sión puede depender de la energía. Este efecto de restricción de las colisiones es esencial para determinar la ley que relaciona la densidad de corriente con el campo eléctrico en un conductor ordinario. Si un sistema que contiene electrones perfectamente libres recibe la influencia de un campo eléctrico constante, sin que hayan colisiones, los electrones sometidos a una fuerza constante adquieren una aceleración constante y, por tanto, una velocidad linealmente creciente. Por consiguiente con un campo dado, la densidad de corriente en un conductor largo sería mayor que en uno corto, ya que la velocidad promedio de los electrones principiando en repo'so en un extremo y fluyendo hacia el otro, sería mayor en la trayectoria más prolongada que en la más corta. Por supuesto, esto no es lo que sucede en absoluto. En realidad, un electrón que principia en reposo es acelerado por un campo y adquiere una velocidad de arrastre que aumenta linealmente durante un corto tiempo; pero a continuación sufre una colisión que (en promedio) reduce su velocidad de arrastre a cero y el proceso se repite. Durante un periodo dado, al electrón puede asignársele una velocidad de a"astre constante promedio, proporcional al campo e inversamente proporcional al tiempo de relajación. Esto lleva a la ley de Ohm, según la cual la densidad de corriente es proporcional a la fuerza del campo eléctrico. Se puede hacer una estimación aproximada de la conductividad basándose en esos datos. La fuerza ejercida La ecuación de Boltzmann y la trayectoria libre media 207 sobre un electrón es -eE0 , en donde E 0 es el campo aplicado, por lo que la aceleración es -eE0 /m, siendo m la masa del electrón. Si la fuerza actúa durante el tiempo t, produce una velocidad de arrastre -eE0 t/m y si el tiempo promedio que hay entre las colisiones aleatorias es 7, la velocidad de arrastre promedio está dada por _ eE0 r: V=---, 2m (7.2-7) suponiendo, por supuesto, que la velocidad de arrastre se ha reducido a cero en promedio de bido a una colisión. Si la densidad de electrones libres es n 0 , la densidad de corriente I será, por definición, (7.2-8) en donde la conductividad se expresa mediante (7.2-9) La ecuación (7.2-8) es, sencillamente, la ley de Ohm; este simple planteamiento en el que se hace caso omiso de los promedios, da un valor de 7 demasiado pequeño al multiplicarlo por 2, como se verá en breve. El hecho de considerar el tiempo de relajación 7 como el tiempo libre medio entre las colisiones aleatorias, se puede explicar si se analiza un grupo compuesto inicialmente de n 0 partículas, en el tiempo t = O, cada una de las cuales puede sufrir una colisión que aleatoriza por completo su velocidad con una probabilidad dt/7 en cualquier intervalo de tiempo dt. Suponga que en el tiempo t, quedan n(t) partículas que todavía no han tenido un choque. El número de partículas que chocan en un tiempo dt, con respecto a t es, en promedio, n(t'ylt/7, de modo que, dn(t) n(t) -dt- = - 1:- (7.2-10) al integrarse (haciendo que n = n 0 a t = 0), da (7.2-11) El número de partículas existentes en el grupo original decae exponencialmente, volviendo a la distribución de equilibrio de acuerdo con (7.2-11). Este es exactamente el comportamiento que predice la ecuación de Boltzmann en la aproximación del tiempo de relajación (7.2-6). Es más, la distribución de los tiempos libres, de acuerdo con (7.2-11), también es exponencial, en tal forma que el número de tiempos libres dn(t) en un intervalo dt con respecto a t es no 1 dn(t) =-e-' • dt. 1: (7.2-12) 208 Teoría del electrón libre de los metales El tiempo libre promedio se puede calcular del modo acostumbrado y esto da t'" f: t dn(t) Ia''" dn(t) = J: te-''' dt (7.2-13) e-r!< dt = T. Entonces, se puede llegar a la conclusión de que la supostcwn de una probabilidad de colisión que es constante con el tiempo para una partícula dada, conduce al mismo resultado que la aproximación del tiempo de relajación en la ecuación de Boltzmann, y que el tiempo de relajación de esta ecuación es idéntico al tiempo libre medio que hay entre colisiones. En el desarrollo anterior se supuso que basta una sola colisión para hacer que la partícula vuelva a la distribución de equilibrio. Si no es así (por ejemplo, si se requieren varias colisiones para aleatorizar por completo la velocidad de una partícula), el tiempo de relajación se debe interpretar como algo que se refiere al tiempo requerido, en promedio, para que una partícula adquiera una velocidad totalmente aleatoria, a pesar de que ésta pueda ser muchas veces mayor que el tiempo medio real entre colisiones. En el estudio anterior se supuso que en el grupo inicial, todas las partículas tenían la misma energía. Si la sección transversal de las colisiones varía con la energía de la partícula incidente, como sucede a menudo, el tiempo de relajación será diferente para cada valor de energía de partícula, y T será una función de la energía. También es posible que el tiempo de relajación sea no isotrópico, variando con la dirección del vector de la cantidad de movimiento de la partícula. Sin embargo, este estudio se limitará solamente al caso isotrópico en el que T puede ser una función de la energía; pero no de la dirección. La trayectoria libre media existente entre colisiones se puede definir en la misma forma que el tiempo de relajación. Si la probabilidad para que una sola partícula sufra una colisión al atravesar una distancia dx es el valor constante dx(A, y si se tienen n(x) partículas de un grupo inicial en el que quedan n 0 después de haber recorrido una distancia x, el número de partículas que choca en un intervalo de trayectoria dx con respecto a x será n(x)dxj'll., por lo cual, dn(x) dx n(x) A. --= --dx (7.2-14) • Al igual que antes, esto lleva a (7.2-15) Nuevamente, la distribución de longitudes de trayectoria dn(x) dentro de un intervalo dx alrededor de x es, pues, dn(x) =no e-x/A dx (7.2-16) ). y la trayectoria libre media está dada por _ L"'xdn(x) X = ·--- t"' ---- = dn(x) f ,.,xe-x1Adx 0 . --- A L'" e-x/A dx - . (7.2-17) Conductividad eléctrica de un gas de electrones libres 209 La cantidad A que, como se vio antes, es la recíproca de la probabilidad de .-:olisión por unidad de distancia, se denomina trayectoria libre media. La trayectoria libre media se define también en relación con un grupo de partículas que tienen, todas ellas, la misma energía inicial y que en general debe .-:onsiderarse como una función de la energía. En el caso de las interacciones elásticas mutuas que hay entre esferas duras o colisiones elásticas entre partículas esféricas rígidas y centros de dispersión fijos en forma de esferas duras, se puede ver fácilmente que la trayectoria libre media es una propiedad geométrica del sistema y, por ende, independiente de la energía. Se verá que la dispersión de electrones mediante fonones de modo acústico en metales y semiconductores, se puede aproximar a través de este modelo y, en consecuencia, se puede describir de acuerdo con una :rayectoria libre media independiente de la velocidad. Por supuesto, cualquier trayec:oria libre individual l y el tiempo libre correspondiente t están relacionados, por l = vt, (7.2-18) ii.n embargo, la relación existente entre la trayectoria libre media A y el tiempo libre "'"edio T se deben obtener sacando el promedio de la distribución de velocidades y iependerá en detalle de la forma en que la trayectoria libre media y el tiempo de ~elajación dependan de la energía. 73 CONDUCTIVIDAD ELECTRICA DE UN GAS DE ELECTRONES LIBRES Ahora se utilizará la ecuación de Boltzmann para predecir la conductividad liéctrica y térmica de un gas de electrones libres. En primer lugar se verá una substancia isotrópica uniforme a temperatura constante en una condición de estado estacionario bajo la influencia de un campo eléctrico constante aplicado E 0 • Puesto que el sistema se encuentra en un estado estacionario, df/dt =O y, dado que el material es uniforme y está a temperatura constante, la función de distribución debe ser la misma en todas las partes de la muestra, de donde, V/= O. En estas condiciones, la fuerza ejercida sobre un electrón es -eE0 y la ecuación de Boltzmann en la aproximación del tiempo de relajación se puede escribir como sigue, utilizando (7.2-3) y (7.2-4) f-fo eE0 • V,f= - - . 't (7.3-1) Si se escoge un sistema de coordenadas de tal modo que el eje z esté en la dirección E 0 , entonces, E0 sólo tiene una componente z y la ecuación anterior se puede expresar como sigue eE0 -r a¡ --=f-fo· m av, (7.3-2) En esta ecuación, se supone que la diferencia existente entre f y fo es muy pequeña, de modo que offozz se puede aproximar por medio de ofo/OVz. Si además se supone que la función de distribución fo, que describe el estado de equilibrio del sistema, es una distribución Maxwell-Boltzmann de la forma (5.4-15), entonces, a¡o = - mv, fo· av, kT (7.3-3) 210 Teoría del electrón libre de los metales En estas condiciones, la ecuación de Boltzmann se convierte en eEo·r:vz) ( f = fo ( 1 - ---¡:;¡- =Jo 1 - 0 -r eE ) k T v cos (} , (7.3-4) dado que Vz = v cos {), en donde 8 es el ángulo que hay entre el eje polar z y la dirección v. Por definición, la densidad de la corriente eléctrica lz es (7.3-5) y vz se puede expresar como _f f vzf(v)g(v)d 3 v Vz = (7.3-6) f(v)g(v)d 3 v ' en donde g(v) es la densidad de estados por unidad de volumen del espacio de velocidad y d 3 v es el elemento de volumen apropiado en el espacio de la velocidad. La notación que se adoptará en esta obra y se utilizará sistemáticamente a partir de ahora, es que una cantidad con una barra encima, a:, se refiere a un promedio sobre la distribución real de desequilibrio, en tanto que una cantidad encerrada entre paréntesis, (a:), se relaciona con un promedio de dicha cantidad tomado sobre la función de distribución de equilibrio. La única excepción es la velocidad térmica que, para seguir esta convención, debería escribirse realmente como (v), pero que, de acuerdo con la convención tradicional, se conservará la notación C. Como se verá, es más conveniente integrar sobre coordenadas esféricas (v, 8, cp) en el espacio de velocidad y, por tanto, se debe utilizar el elemento de volumen d 3 v = v2 sen 8 dvd8dcp. Utilizando este elemento de volumen en combinación con la densidad de estados en el espacio de velocidad, según está dado por ( 5.4-1 7) y la función de distribución (7.3-4), y observando que Vz = v cos 8, (7.3-6) se puede expresar como (7.3-7) En (7.3-7), ya se realizó la integración sobre cp de O a 2rr. Puesto que los integrandos son independientes de e/>, los factores 2rr obtenidos en el numerador y el denominador se anulan. Así también, puesto que <vz> es cero (para la situación de equilibrio), la integral que incluye sólo / 0 en el numerador de (7.3-7) debe ser cero; es más, en el término dependiente del campo del denominador aparece una integral angular de cos 8 sen 8 =+sen 28 sobre el rango O< 8 < 7T y, por tanto, este término también se integra a cero. En consecuencia, la ecuación (7.3-7) se puede reducir a (7.3-8) Conductividad eléctrica de un gas de electrones libres 211 Las integrales angulares se pueden evaluar con facilidad, dando f f'"' '"'v 2 t(v) · v2j 0 (v) dv E eEo o e o 2 Vz = - 3kT = - 3kT (v t), _ (7.3-9) v%(v) dv o las integrales restantes representan sólo el promedio (v 2 r (v)> sobre la función de distribución de equilibrio. No obstante, en un gas de partículas libres de Boltzmann, la energía cinética promedio por partícula es 3kT/2, de tal manera que de donde, (7.3-10) Al substituir esto en (7.3-9), se puede escribir, finalmente, (7.3-11) en donde, (7.3-12) El resultado de este método más exacto concuerda con (7.2-7) que se obtuvo de un modo muy aproximado, excepto por un factor de 2 y por el hecho de que la cantidad 7, según la da (7.3-12) y (7.3-9) no es precisamente igual a r, excepto cuando r, es independiente de v. En este aspecto, es muy común defmir la movilidad de una partícula como la magnitud de la velocidad promedio de arrastre por unidad de campo. De acuerdo con (7.3-11), la movilidad ¡.¡. debe estar dada por -1 1- p.Vz- - ei. E0 m (7.3-13) La unidad de movilidad es la velocidad por unidad de campo que, en el sistema cgs-gaussiano es cm 2 volt- 1 seg- 1 • La densidad de corriente /z es, de acuerdo con (7.3-5) y (7.3-11), (7.3-14) por lo cual, 212 Teoría del electrón libre de los metales Se debe observar que estos resultados también se pueden establecer de acuerdo con la movilidad, como sigue, (7.3-16) de donde, (7.3-17) u= nep. Para evaluar a explícitamente en términos del tiempo de relajación r, es necesario especificar la dependencia de r con respecto a v. Entonces, si r es independiente de v, de acuerdo con (7.3-9) y (7.3-12), 7 = r. Para el caso en el que la trayectoria libre media es independiente de la velocidad, r = 'A/v y (7.3-12). (7.3-10) y (5.4-20) llevan a _ A.(v) (v2) A.c 3kT/m 8 A. 'r=--=---=-- 31t e' (7.3-18) En la expoSicton anterior se supuso, al igual que Drude y Lorentz, que el gas electrónico se podía describir adecuadamente mediante la distribución de energía de Maxwell-Boltzmann. Por supuesto, los electrones obedecen en realidad al principio de exclusión de Pauli y, debido a ello, se tuvo que utilizar la función de distribución de Fermi-Dirac para que los resultados fueran perfectamente correctos. Si la distribución de equilibrio es la de Fermi-Dirac (5.5-20), se debe escribir, en lugar de (7.3-3), (7.3-19) Al substituir este resultado en (7.3-2) suponiendo nuevamente que offovz se puede substituir mediante ofofovz, se tiene que eE0 -r f = fo - kT fo(l - fo)v cos O. (7.3-20) Al utilizar esta expresión como la función de distribución en (7.3-6) y observando que la integral incluida en el primer término de (7.3-20) en el numerador, y la integral relacionada con el segundo término de (7.3-20) en el denominador, de la expresión resultante se anulan igual que antes y, después de integrar sobre las coordenadas angulares, se llega a (7.3-21) En el caso general es imposible evaluar analíticamente estas integrales sobre la función de distribución de Fermi-Dirac; en cambio, es muy fácil obtener un resultado aproximado que es casi correcto para T 4.. TF, lo cual por supuesto, es lo que sucede casi siempre para la mayoría de los conductores metálicos en las condiciones que se encuentran en la práctica. Conductividad eléctrica de un gas de electrones libres 213 Para lograr esto, es muy conveniente expresar las integrales de (7 .3-21) como integrales sobre la energía, y no la velocidad, por lo cual se obtiene (7.3-22) Se debe observar que para T~TF (es decir, kT~e1), la función de Fermi f 0 (e) es muy pequeña para e, significativamente en exceso de e¡ y la función com- plementaria 1 - fo es muy pequeña para valores de e que son mucho menores que e1. Por tanto, la función producto [ 0 (1 - [ 0 ) es muy pequeña excepto en la cercanía de e = e1 , como se ilustra en la figura 7.l. Partiendo de (7 .3-19), es fácil demostrar analíticamente que [ 0 (1 - [ 0 ) es un máximo en e= e¡, en cuyo punto [ 0 (1 - [ 0 ) = y que la región sobre la que [ 0 (1 - [ 0 ) no es pequeña en comparación con su valor máximo, tiene una anchura del orden de kT. Por tanto, la integral del numerador de (7.3-22) no aumentará de manera significativa, excepto en donde e tiene valores no mayores de unas cuantas unidades kT de e1. Si e3 12 T(e) es una función que no cambia mucho en este rango de energías, se puede considerar que [ 0 (1 - [ 0 ) es esencialmente una función o de Dirac de e - e1 , y se puede escribir, 5 t fo(e)(l - fo(e)) ~ A!5(e- e1 ) (7.3-23) en donde A es un factor de normalización que se debe escoger de tal modo que cuando (7.3-23) se integra sobre la energía, se obtiene el valor correcto de la integral del lado izquierdo. ., Figura 7.1. Las funciones /o(€), 1 -!o y lo (1 - / 0 ) para un sistema de Fermi, graficadas en función de la energía. El factor de escala vertical de la curva fo (1 -/o) no es el mismo que el de las otras curvas. Puesto que, mediante la integración directa (empleando la substitución u= (e- e¡)/kT) se puede demostrar que Joo o j 0 (1 -Jo) de = k T Joo e"du kT ( + ") 2 = 1 + •¡tkT ~ kT -•1 tkT 1 e e (7.3-24) s Véase el apéndice A, donde hay una definición y una explicación de la función Dirac. o- de 214 Teoría del electrón libre de los metales y, puesto que la integral de la función 6 es la unidad, es evidente que se debe tomar A = kT en (7 .3-23), de donde, j 0 (e)(l - j 0 (e)) g;; kTb(e- e1) (kT ~ e1 ). (7.3-25) Esto se substituye en (7.3-22) y se evalúa la integral del denominador de la ecuación, observando que fo(E) es la unidad para O< E< E¡ y cero para E> E¡, que es una buena aproximación de kT ~ E¡, obteniéndose f e -r(e)b(e - e de 00 _ Vz = 2eE0 3' 2 1) 0 (7.3-26) - _3_m_ !:.....:....._f'"":-~-el_/_2d_e_ __ La densidad de corriente lz =-nevz y la conductividad a se pueden evaluar, como antes, en relación con (7 .3-15), lo cual da con e-r(e1 ) J.L=--. m (7.3-27) Parece que estos resultados son los mismos que se encontraron para el caso Maxwell-Boltzmann (7.3-11), etc., excepto que el tiempo libre medio promedio r se representa mediante el valor r(v) en la "velocidad de Fermi" v1 , en donde tmv} = e1 . (7.3-28) En este caso, las estadísticas sólo establecen una diferencia en los detalles de los promedios y no afectan la conductividad por órdenes de magnitud. Esto se comprende desde el punto de vista físico, ya que, en cualquiera de los casos, el campo sólo tiene el efecto de superponer una velocidad de arrastre del orden de eE0 r/m en todos los electrones de la distribución, como se ilustra en la figura 7.2, sin tener en cuenta los detalles de su distribución de energía. En todo caso, la introducción de la estadística Fermi-Dirac, aunque modifica algunos de los detalles, conserva las características esenciales de la representación del electrón libre de Drude-Lorentz-Boltzmann de la conducción eléctrica, que es básicamente correcta. Sin embargo, como se verá a su debido tiempo, las capacidades térmicas predichas por las estadísticas de Maxwell y Fermi-Dirac para electrones libres en metales, son Figura 7.2. Las distribuciones Maxwell-Boltzmann (MB) y Fermi-Dirac (FD) de la componente de velocidad z en presencia de un campo eléctrico. Conductividad térmica y efectos termoeléctricos 215 realmente muy diferentes y, en este caso, el uso de la estadística Fermi-Dirac es esencial para explicar los resultados experimentales. 7.4 CONDUCTIVIDAD TERMICA Y EFECTOS TERMOELECTRICOS EN SISTEMAS DE ELECTRONES LIBRES Al estudiar la conductividad térmica de los electrones libres, es necesario considerar una muestra en la que no haya corriente eléctrica alguna, pero sí un gradiente de temperatura. Entonces la función de distribución en cualquier punto se caracteriza, por la temperatura local y se debe considerar como una función de la posición y de la energía. Al igual que antes, se supondrá que se trata de una muestra isotrópica homogénea y, para simplificar, se supondrá que la temperatura varía únicamente a lo largo de la dirección z. Desde un principio se trabajará con las estadística de Fermi-Dirac; el caso de la estadística Maxwell-Boltzmann se puede obtener para una situación especial del resultado Fermi-Dirac, cuando se permite que la energía de Fermi aumente y sea negativa. En estas condiciones, la ecuación de Boltzmann para el estado estacionario, utilizando la aproximación del tiempo de relajación acostumbrada, con r = r(v) se puede expresar como sigue (7.4-1) En esta ecuación, las derivadas de la función de distribución real con respecto a z y Vz, se han aproximado mediante los valores de la correspondiente función de distribución de equilibrio análogamente al razonamiento que se empleó para la ecuación (7.3-2). Se supone que el campo E0 sólo tiene una componente z. La ecuación anterior se puede volver a escribir como sigue f = fo + -r(eEo aJo m avz Vz afo). az (7.4-2) Si se utiliza la expresión (5.5-20) para representar fo y si se recuerda que e1 es una función de la temperatura, con la ayuda de (7 .3-19) se puede escribir la cantidad of0 /oz como sigue =fo0-fo)[e-e1 + ae,]aT =[r!...(~) ~]f0 (1-f0 )aT kT T aT az aT T + T kT az . (7.4-3) A continuación, la ecuación de Boltzmann se puede escribir en la forma (7.4-4) 216 Teoría del electrón libre de los metales Al igual que antes, la densidad de la corriente eléctrica lz es f vzf(v,z)g(v) d 3 v 1 =-env =-en~---------z z f(v,z)g(v) d 3 v ' f (7.4-5) mientras que a la densidad de la corriente térmica Qz la representará la energía portada por una partícula multiplicada por la compónente z de su velocidad, y por la densidad de partículas, de donde, _ J Qz=n(ev,)=n evzf(v,z)g(v) dv - J (7.4-6) f(v,z)g(v) dv Al substituir la función de distribución (7.4-4) en (7.4-5) y (7.4-6), se obtienen expresiones análogas a (7 .3-7). Debido exactamente a las mismas razones que se indicaron en relación con dicha ecuación, la integral del primer término del numerador de estas expresiones (incluyendo [ 0 ), deben anularse y también debe desaparecer la integral del segundo término del denominador (incluyendo [ 0 (1 - [ 0 )). Por tanto, se tiene en f e) v!r [ ( iJ(e1 fT) iJT] 3 kT/0 (1 - / 0) eE0 + T ---aT + T iJz d v f 1 =~~--------~~~--------~--~-% f 0 (v) d3 v (7.4-7) y -n f v!r [ ( iJ(e1 /T) e2 ) iJT] 3 kT/0 (1- / 0 ) eE 0 e + eT aT + T i)z d v Q = ____;:;_,__ _ _ ..;:,_;;--___;_---__;._____;;~ Jf (7.4-8) 0 (v) d 3 v z Sin entrar en los detalles de la evaluación de estas integrales y gracias a los resultados obtenidos en la sección anterior, es evidente, que estas ecuaciones se pueden expresar como en [ ( eE0 + 1 ,iJ(e1 iJT - ] 1 /T) iJT) _ - - t +-- (et) 1, =-- m iJT iJz T iJz (7.4-9) y -n [( iJ(e1 /T) iJT)- 1 iJT2 ] Q, =--;;¡- eE0 + T ---a;¡- iJz (er) + T 0 z (e t) (7.4-10) en donde las cantidades sobre las que se ha escrito una barra son los promedios definidos por (7.4-11) Conductividad térmica y efectos termoeléctricos 217 Si se observa que mv; = mv 2 cos2 e, y se supone que a es independiente de las variables angulares, entonces se puede integrar (7.4-11) sobre los ángulos para obtener _ (X m = -3kT f v2 tX(v)J0 (1 -Jo)· V 2 dv f •o . JI v2 dv f = - '-----=-----f 2 e312 tX(e)J0 (l -Jo) de 3kT e ¡,0 de (7.4-12) 112 En las expresiones (7 .4-12) y (7 .3-1 0), se ve que cuando la distribución de Fermi se reduce a una distribución de Maxwell (según la cual 1 -lo ~ 1 Y fo = Ae-efkT), la Ci promedio se reduce a (7.4-13) análogamente a (7 .3-12) y los promedios se toman sobre la distribución de MaxwellBoltzmann. De igual manera, si la distribución es de tipo Fermi, para la que kT <t. E¡, se puede emplear (7 .3-25) para representar f 0 (1 - fo ), en donde, aplicando los mismos métodos usados para llegar a (7.3-26), fácilmente se puede demostrar que ii = 1X(e1). (7.4-14) Si no fluye una corriente eléctrica, lz = O, por lo cual, de acuerdo con (7 .4-9), se debe tener o(e1 /T) ar 1 ar (er) eE 0 + T - - - --= - - - oT oz T oz i ' (7.4-15) de donde, Eo = _! [_!_ (et) + T o(e1 jT)] oT oT e T i oz (7.4-16) o bien, Eo = T !..__ [(et)- e1 oT eiT i] oT oz . (7.4-17) De acuerdo con esto, parece que aun en ausencia de una corriente, debe existir un campo eléctrico cuando se tiene un gradiente de temperatura. De hecho, lo hay y la ecuación anterior es la descripción fundamental del efecto termoeléctrico. Fenomenológicamente se puede definir el coeficiente de Thomson como el coeficiente de proporcionalidad que relaciona el campo eléctrico con el gradiente de temperatura que lo origina, como sigue, q¡-ar Eo = - ::/ oz (7.4-18) 218 Teoría del electrón libre de los metales según lo cual, el coeficiente de Thomson fí debe estar dado por 'f]. fí = _ T !..._ [(st)- e1 iJT e'CT (7.4-19) De acuerdo con (7.4-9) y (7.4-10), también es evidente que si existe un campo eléctrico aplicado que hace que fluya una corriente eléctrica, incluso cuando oTjoz =O, la corriente térmica Qz no desaparece. Por el contrario, existe una corriente térmica que es proporcional al campo eléctrico E 0 y, por tanto, a la corriente eléctrica. Este efecto se denomina calentamiento Thomson y es muy diferente del calentamiento ordinario irreversible de Joule que se relaciona con el paso de una corriente por un medio resistivo. El voltaje que desarrolla un termopar por diferencia unitaria de temperatura se defme como la diferencia de las potencias termoeléctricas relacionadas con los dos constituyentes del par. Mediante un argumento termodinámico sencillo,6 se puede demostrar que la potencia termoeléctrica absoluta {!J de una substancia está relacionada con el coeficiente de Thomson mediante (7.4-20) por lo cual, de acuerdo con (7.4-19), se debe tener 'f- (s-r). f!jJ = e1 e'CT Si lz =O, utilizando (7.4-15), el término relacionado con el campo eléctrico más una contribución que incluye al gradiente de temperatura y la derivada de la temperatura de la energía de Fermi, se puede eliminar de (7.4-10) para dar -- __ 2 Qz = _u, iJT = - n ['f(e 2 t) - (st)] iJz mT t (7.4-21) por lo cual, la conductividad térmica at es, sencillamente, -2 __2 u = ~ ['f(s t)- (et)] ' mT 'f · (7.4-22) De acuerdo con esto, es evidente que la teoría del electrón libre de Fermi y la representación del electrón libre de Boltzmann difieren sólo en algunos detalles de los promedios y que ambos métodos llevan a una conductividad térmica del mismo orden de magnitud, al igual que ambos predicen más o menos la misma conductividad eléctrica. De acuerdo con las investigaciones experimentales de Wiedemann y Franz, la relación atf(Tae), en donde ae es la conductividad eléctrica, es aproximadamente la misma para casi todos los conductores metálicos, independientemente de la temperatura. Puesto que a, = ne 2 r/m, la relación Wiedemann-Franz, se puede expresar como -- _ _2 L = ..!!.!_ = _1_ 'f(s 2 t) - (et) Tue e2T2 t2 6 M. W. (7.4-23) Zemansky, Heat and Thermodinamics, McGraw-Hill Book Co., Inc., Nueva York (1951) página 301. Procesos de dispersión 219 Esto parece indicar que si r(e) es la misma función de energía para todas las substancias metálicas, la relación Wiedemann-Franz será la misma para todos los materiales. Puesto que cada factor de e contribuye kT a los promedios, la relación Wiedemann-Franz será independiente de la temperatura. En realidad, si r(e) varía lentamente con respecto a e, la relación Wiedemann-Franz será casi la misma incluso si r(e) no es la misma función de energía para todas las substancias. En particular, si la trayectoria libre media X e~ independiente de la energía, entonces, de acuerdo con (7 .3-18), utilizando la representación clásica del electrón libre de Boltzmann, de Drude y Lorentz, la conductividad térmica está dada por (7.4-24) en tanto que la relación Wiedemann-Franz se convierte en (7.4-25) independiente de la trayectoria libre media o la temperatura. La magnitud de L + según está dada por (7 .4-25) y concuerda de manera aceptable con los valores determinados en forma experimental para casi todos los metales puros. Si se trata de evaluar la conductividad térmica y la relación Wiedemann-Franz, por medio de la estadística de Fermi y los valores promedio, como se calcularon de acuerdo con (7 .4-14), entonces se obtiene el resultado at = L = O! Esta situación sorprendente se origina debido a la representación de / 0 (1 - [ 0 ) como una función de l> y el método sólo aproximado de la integral de Fermi en el denominador (como en (7.3-26)) de las expresiones para los promedios que conducen a (7.4-14), no es lo suficientemente exacta para estos cálculos. Si e¡ se expresa como kTF en (7.4-23), es evidente que, en realidad, esto sólo se refiere a una pequefia diferencia entre dos cantidades muy grandes del orden de (k 2 /e 2 ) (TpfT)l, y las dos cantidades propiamente dichas se deben expresar con gran exactitud a fin de que su diferencia sea más o menos correcta. Un método más preciso, como el presentado por Smith, 7 da el resultado (7.4-26) y (7.4-27) 7 .S PROCESOS DE DISPERSION En todas las expostcwnes anteriores, la idea central era que los electrones libres sufren colisiones instantáneas que tienden a hacerles volver a la distribución de equilibrio; sin embargo, hasta ahora se ha evitado conscientemente el responder a la 7 R. A. Smith, Wave Mechanics of Crystalline Solids, Chapman and Hall, Londres (1961) página 328. 220 Teoría del electrón libre de los metales pregunta "¿colisiones con qué? " La fmalidad de esta sección es analizar cualitativamente la respuesta a tal pregunta. Como se verá en detalle en el siguiente capítulo, los electrones libres que se mueven en forma independiente dentro del potencial de una red cristalina perfectamente periódica no están sujetos en absoluto a interacciones de dispersión con todos los átomos de la red. Es más, en las colisiones elásticas que suceden entre los electrones se conservan la energía y cada componente de la cantidad de movimiento; debido a ello, no se origina ningún cambio neto en la corriente eléctrica ni en la térmica. Por tanto, los mecanismos de colisión que producen la aleatorización de la distribución electrónica deben estar asociados con impurezas, imperfecciones o faltas de periodicidad de un tipo u otro en el cristal. Sea un cristal que no contiene átomos de impurezas o imperfecciones estructurales en absoluto. Si no existiera el movimiento térmico de los átomos alrededor de sus posiciones de equilibrio, el potencial eléctrico experimentado por un electrón dentro del cristal sería perfectamente periódico y no habría mecanismos en absoluto para hacer que los electrones volvieran al estado de equilibrio térmico por acción de fuerzas eléctricas o magnéticas externas. Sin embargo, debido a las vibraciones térmicas de los átomos, en cualquier momento dado hay una leve aperiodicidad del potencial dentro del cristal; ésta sirve para dispersar los electrones de conducción. disipando cualquier velocidad de arrastre que puedan haber adquirido de los campos aplicados externamente y devolviéndolos al estado de equilibrio térmico. Es evidente que mientras más alta es la temperatura, tanto más fuertes son las vibraciones de red y más alta la probabilidad de dispersión por unidad de tiempo. Por tanto, este mecanismo de dispersión conduce a un tiempo libre medio [y, en consecuencia, de acuerdo con (7.3-15), a una conductividad] que decrece al aumentar la temperatura. Esto concuerda con las observaciones experimentales de metales puros. Puesto que las vibraciones de red se pueden considerar como cuantos semejantes a partículas de energía vibratoria (fonones), la interacción de dispersión entre los electrones y los fonones se puede describir como un proceso de colisión casi mecánico que incluye a los electrones libres y a los fonones, donde estos últimos se comportan como partículas neutras cuya masa es mucho mayor que la del electrón. 8 Debido al hecho de que los fonones son neutros, la corriente no se conserva en estas colisiones. Puesto que la "masa" del fonón es mucho mayor que la masa electrónica, la fracción de energía que pierde el electrón en la interacción electrónfonón es pequeña, aunque por supuesto, el cambio de cantidad de movimiento del electrón puede ser muy grande. Los electrones pueden interactuar con fonones de modo acústico u óptico, aunque, dado que se requiere una energía térmica mucho mayor para excitar a los fonones de modo óptico, la principal interacción a temperaturas moderadas es con fonones acústicos. Las dos interacciones son similares en sus aspectos cualitativos, aunque conducen a ciertas diferencias cuantitativas en los coeficientes de transporte, sobre todo la dependencia del tiempo de relajación en función de la temperatura (de ahí que la movilidad dependa de la temperatura). A cualquier temperatura dada, el número de fonones disponibles es constante. Puesto que los fonones se comportan como partículas masivas casi estacionarias, la probabilidad de dispersión por unidad de distancia a lo largo de la trayectoria de un electrón es una cantidad determinada de un modo puramente geométrico, la cual sólo depende de la sección transversal geométrica efectiva relacionada con el fonón e independiente de la velocidad del electrón. Por tanto, la trayectoria libre media es independiente de la velocidad de partícula en estas circunstancias, como se hizo notar en la sección 7 .2. El tiempo libre medio está dado por A. -r(v) =V 8 Véase, por ejemplo, el problema 4 que aparece al final del capítulo 6. (7.5-1) Procesos de dispersión 221 en donde A es independiente de v, llegando a la relación (7.3-18) entre 7 y A. Por supuesto, el número de fonones disponibles es una función de la temperatura y, por tanto, A será una función de la temperatura a pesar de que es independiente de la velocidad. Este mecanismo de dispersión de red o dispersión de fonón, es el proceso dominante de dispersión en cristales relativamente puros y estructuralmente perfectos, sobre todo en los rangos de temperaturas elevadas. Generalmente, si hay un átomo de impureza en un cristal, esto altera el potencial electrostático en las cercanías y crea una aperiodicidad en el campo de potencial dentro del cristal, que puede actuar para dispersar electrones de conducción. Obviamente, los detalles del proceso de dispersión dependen de la naturaleza del átomo de impureza, su tamaño iónico, su valencia y la forma en que está enlazado dentro de la red cristalina. En lo que respecta a otras cosas, la presencia de átomos de impurezas en un cristal puro aumenta el tiempo libre medio que haya entre los eventos de dispersión y lleva a una reducción de la conductividad eléctrica que será proporcional al contenido de impurezas. A decir verdad, este efecto se observa experimentalmente en gran número de substancias. 9 El mecanismo de dispersión de impurezas casi siempre es dominante en cristales que son relativamente impuros o incluso en muestras muy puras a temperaturas muy bajas, cuando el mecanismo de fonones es débil. Las imperfecciones estructurales en la red cristalina, tales corno vacíos de red, átomos intersticiales, dislocaciones y fronteras de grano, también conducen a aperiodicidades en el potencial del cristal y, por tanto, a centros de dispersión con los que los electrones de conducción pueden interactuar. Entonces las propiedades de transporte del cristal reciben la influencia en mayor o menor grado, de la perfección estructural de la red. En algunas circunstancias, la dispersión de electrones por las superficies de la muestra también puede ser importante. Ya se vio (en la sección 6.6) la forma en que la dispersión de superficie de los fonones es a veces un factor importante en la componente reticular de la conductividad térmica a temperaturas bajas. Si dos mecanismos independientes de dispersión (por ejemplo, la dispersión de red y la de impurezas) operan simultáneamente para termalizar la función de distribución de energía electrónica, se tendrán dos tiempos de relajación T 1 y T 2 , asociados con los mecanismos respectivos. En el ejemplo anterior, T 1 puede representar el tiempo de trayectoria libre que transcurre entre los sucesos de dispersión de red y r 2 el tiempo libre medio que pasa entre las dispersiones de impurezas. En estas condiciones, el término de colisión de la ecuación de Boltzrnann se puede escribir corno sigue f- fo f- fo f- fo =------=--- (7.5-2) en donde 1 1 1 T T¡ T2 -=-+-. (7.5-3) Esto hace ver que el efecto combinado de dos mecanismos de dispersión se puede representar mediante un solo tiempo de relajación T relacionado con T 1 y T 2 mediante la fórmula de suma recíproca (7.5-3). De igual manera, si se tienen más de 9 Por ejemplo, esta es la razón por la que se requiere cobre de muy alto grado de pureza para conductores eléctricos en sistemas comerciales de transmisión de potencia. 222 Teoría del electrón libre de los metales dos mecanismos, su efecto se puede representar por medio de un solo tiempo de relajación r dado por 1 1 -=¿-. • 1 't¡ (7.5-4) Puesto que, de acuerdo con (7.3-13), las movilidades son directamente proporcionales a los tiempos de relajación, las movilidades producidas por mecanismos independientes de dispersión por separado pueden sumarse recíprocamente en la misma forma para dar una movilidad combinada de la forma 1 1 -=¿-. J1. i Jl.¡ (7.5-5) Las trayectorias libres medias originadas por procesos de dispersión separados también se pueden sumar recíprocamente para llegar a una trayectoria libre media general No obstante, debe observarse que las fórmulas de suma (7.54) y (7.5-5) han de aplicarse antes y no después de promediar sobre la velocidad. 7.6 EL EFECTO DE HALL Y OTROS EFECTOS GALVANOMAGNETICOS Hasta ahora se han estudiado sólo casos en los que un campo eléctrico actúa sobre las partículas de un sistema de electrones libres. Si además se tiene un campo magnético, la fuerza ejercida sobre una partícula de carga q está dada por la fuerza de Lorentz 1 e F = q(E + - v X B) (7.6-1) y la ecuación de Boltzmann en el estado estacionario, utilizando la aproximación del tiempo de relajación, se convierte en (7.6-2) La solución de esta ecuación incluye varios efectos galvanomagnéticos que se originan en la interacción de campos eléctricos y magnéticos, y gradientes térmicos, con las partículas de la distribución. Por ahora no se verán los detalles de la solución de la ecuación de Boltzmann, sino que la explicación se restringirá a la descripción fenomenológica de estos efectos. En un capítulo posterior se hará un análisis más riguroso de los fenómenos galvanomagnéticos y la forma en que se aplican a semiconductores, en donde será más fácil llegar a soluciones analíticas exactas. El más importante de los efectos galvanomagnéticos es el efecto de Hall, en el que se produce un campo eléctrico en la dirección y como resultado de una corriente que fluye en la dirección x y un campo magnético a lo largo de la dirección z, según se ilustra en la figura 7.3. En esta figura, un electrón que se mueve con velocidad vx está sometido a un empuje descendente debido a la fuerza de Lorentz. En el estado estacionario no puede haber una fuerza neta ejercida sobre el electrón El efecto de Hall y otros efectos galvanomagnéticos Io- Figura 7.3. 223 vH (Medido con un potenciómetro en condiciones de circuito abierto) Geometría del experimento del efecto de Hall. ~- por tanto, lo que sucede es que se desarrolla un exceso de concentración de electrones en el borde inferior de la muestra, hasta que se genera un campo electrostático Ey que equilibra exactamente a la fuerza de Lorentz. Por tanto, q evxBo e F1 = - (v X B0 ) 1 - eE1 = - - - eE = O (7.6-3) E = vxBo (7.6-4) c 1 ' por lo cual, ' e Sin embargo, la densidad de corriente 10 es 10 = -nevx. (7.6-5) Si se expresa Vx de (7.6-4) en función de 10 por medio de (7.6-5), el campo .ie Hall Ey se puede expresar como -loBo E , = - - = Rl 0 B0 nec (7.6-6) m donde el coeficiente de Hall R está dado por 1 R=--. nec (7.6-7) El campo de Hall es directamente proporcional tanto a 10 , como a B 0 • El .:oeficiente de Hall R es, sencillamente, la constante de proporcionalidad entre el :.ampo de Hall y el producto 10 B 0 • El campo de Hall se puede determinar midiendo ei voltaje de Hall VH de la figura 7.3 de una manera potenciométrica. Por tanto, el .:ampo de Hall y el voltaje de Hall están relacionados por medio de (7.6-8) en donde y 0 es la anchura de la muestra. El coeficiente de Hall R se puede medir si te conocen VH, 10 y Bo. El coeficiente de Hall es inversamente proporcional a la densidad n de portadores de carga de la muestra, y una medición de R constituye un modo sencillo de 224 Teoría del electrón libre de los metales determinar n. Combinando las mediciones del coeficiente de Hall y la conductividad, se puede obtener la movilidad /J., ya que, de acuerdo con (7 .6-7) y (7 .3-17), 1 JJ. Ru= --(nep)= - nee e o bien, 1 p = - - Ru. e (7.6-9) El análisis anterior del efecto de Hall se ha simplificado en exceso en el sentido de que todos los portadores de carga no tienen la misma componente de velocidad Vx y, por tanto, se debe promediar sobre la distribución de Vx. Por lo general, el efecto de esto es cambiar el valor (7.6-7) por R mediante un pequeño factor numérico. De acuerdo con (7 .6-7) si los portadores de carga son electrones, R siempre debe ser negativo. Se ha encontrado experimentalmente que R es positivo para muchas substancias metálicas y semiconductoras. La aparición de un coeficiente de Hall positivo se puede explicar, suponiendo que los portadores de carga son positivos, en lugar de negativos; pero la teoría del electrón libre de los metales no proporcionan un modo racional para explicar la presencia de portadores de carga positivos. Los coeficientes de Hall positivos y la existencia de portadores de carga positivos se pueden explicar mediante la teoría cuántica, como se verá en el siguiente capítulo. En el arreglo experimental de la figura 7.3, se establece un gradiente de temperatura a lo largo de la dirección y junto con el campo de Hall Ey. Esto se debe a que, de acuerdo con la ley de Lorentz de la fuerza, toda fuerza ejercida verticalmente hacia abajo sobre los electrones es proporcional a Vx y, por tanto, sobre los electrones más energéticos y rápidos, la fuerza ejercida v x 8 0 es mayor; en consecuencia, estos electrones tienden a acumularse en la parte inferior de la muestra, elevando su temperatura con respecto a la parte superior, donde permanecen los electrones "más fríos". El gradiente de temperatura resultante crea un campo termoeléctrico en la dirección y, el cual está dado por (7.4-17) y origina un voltaje adicional diferente del voltaje de Hall, en las terminales y de la muestra. Este fenómeno se conoce como efecto de Ettingshausen, y en algunos casos, puede interferir mucho en las mediciones de voltaje de Hall. Tal efecto en las mediciones de Hall se puede eliminar si se utiliza una corriente alterna de muestra, cuyo periodo sea corto en comparación con la constante térmica de tiempo de la muestra, en combinación con un detector de corriente alterna. Cuando la corriente eléctrica / 0 en el experimento del efecto de Hall, se substituye por una corriente térmica, se puede medir todavía un campo eléctrico a lo largo de la dirección y. En este caso, existe en promedio un transporte neto de electrones más rápidos, dentro de la dirección x, desde el extremo vivo o caliente, hasta el extremo frío de la muestra, y la fuerza v x B0 actúa sobre ellos, para producir un campo eléctrico, más o menos en la misma forma en que se produce el campo de Hall, cuando fluye una corriente eléctrica. Este fenómeno se denomina efecto de Nernts. El campo de Nernst va acompañado por un gradiente de temperatura a lo largo dat la dirección y al igual que lo que sucede con el campo de Hall; esto origina un voltaje termoeléctrico adicional análogo al de Ettingshausen. El efecto termoeléctrico originado por el efecto de Nernst se denomina efecto de RighiLeduc. En un campo magnético, los electrones se desplazan siguiendo trayectorias curvas y no rectas; gracias a este hecho se ha descubierto que, por lo general, la conductividad depende del campo magnético. Este fenómeno se llama magneto"esistencia y se estudiará más detalladamente en un capítulo posterior. Capacidad térmica de sistemas de electrones libres 7.7 225 CAPACIDAD TERMICA DE SISTEMAS DE ELECTRONES LIBRES La teoría clásica del electrón libre de Drude-Lorentz, en la que se supone que los electrones libres obedecen a la estadística de Maxwell-Boltzmann, lleva a la conclusión de que (suponiendo un electrón libre por átomo) la capacidad térmica de los electrones libres debe ser -fnk, como lo da la figura (5.4-11). Entonces la capacidad térmica total sería igual a la suma de la contribución reticular dada por la teoría de Debye, y la contribución electrónica -fnk, y a temperaturas altas, en comparación con la Debye, el valor límite de la capacidad térmica, sería -!nk. Sin embargo, esta conclusión está en discordancia con los experimentos, ya que las observaciones indican que el valor asintótico de la capacidad térmica a altas temperaturas difiere muy poco del valor 3nk predicho por la teoría de Debye para la contribución reticular sola. Aparentemente, esto indica que la capacida-d térmica de los electrones libres es mucho más pequeña que el valor predicho a bc;se del modelo Drude-Lorentz-Boltzmann. Esta fue una de las principales fallas del modelo original DrudeLorentz, que se propuso primero. Como se verá más tarde, resulta que cuando se utilizan las estadísticas de Fermi-Dirac, para describir la distribución de energía drl electrón libre, la capacidad térmica electrónica calculada es mucho más pequeña q~tl' el valor 3/2nk dado por la estadística de Boltzmann y, en efecto, es despreciable en comparación con la con tribución reticular a temperaturas moderadas y altas. En consecuencia, el modelo del electrón libre de Fermi está mucho más de acuerdo con las observaciones experimentales que la teoría original de Drude-Lorentz. La explicación de calor específico electrónico de substancias metálicas fue uno de los triunfos originales de la estadística cuántica. La capacidad térmica del sistema del electrón libre de Fermi-Dirac es mucho más pequeña porque ~AJo los electrones dentro de unos cuantos kT de la superficie de la esfera de Fermi pueden recibir energía de una fuent~, térmica externa. Por lo común, una partícula de un baño térmico externo a la temperatura T sólo dispone de una energía de unos cuantos kT, para transmitirla a un electrón del sistema de electrones libres de Fermi. Los electrones que se encuentran en un lugar profundo, dentro de la esfera de Fermi no pueden interactuar con este tipo de cuerpos externos excitantes, ya que no existen estados desocupados dentro de unos cuantos kT de energía, hacia los que puedan excitarse. Sólo los electrones que están cerca de la superficie de Fermi, en donde existen estados desocupados disponibles, pueden participar en las interacciones con una fuente térmica externa. Para hacer un cálculo exacto de la capacidad térmica, es necesario tener en cuenta la variación de primer orden de la energía de Fermi con la temperatura. Para lograr esto, será necesario evaluar la integral 1= f oo 0 acb(e) f 0 (e) & (7.7-1) de. en donde / 0 es la función de Fermi y q¡{e) es una función de e que tiene la propiedad de que l/J(O) =O. (7.7-2) Si (7.7-1) se integra por partes, puede verse con facilidad que 1 se puede expresar en la forma l = a¡; = - feo l/J(c) ~ a¡; de, [f (e)c/J(e) ]eo - feo l/J(e) ~de 0 o o oe o iJ¡; (7.7-3) 226 Teoría del electrón libre de los metales ya que el producto f 0 (e)r/>(e) se anula en ambos límites. En la expansión de cf>(e) como una serie de Taylor en torno al punto e= e1, puede escribirse como 2 2 1 f/>(e) = f/>(e¡) +(e- e¡) (of/>) oe t¡ + 2(ee¡) (oiJe2f/>) t¡ + ... ' (7.7-4) por lo cual, (7.7-3) se puede expresar como - 2 1 = a0 fj>(e1 ) + a 1 (of/>) + a2 (a24>) + ... , oe t¡ oe •J (7.7-5) 1 J<Xl(e- e¡)"~ a¡; de. an = - n! o oe (7.7-6) en donde Ahora bien, si kT <{ e1, de acuerdo con (7 .3-19), a¡0 jae es despreciable para valores negativos de e y los límites de la integral (7.7-6) se pueden extender a oo y - oo. Si esto se hace, se encontrará que a0 = - J J <Xl -a;¡ a1 = - ofo [ J<Xl = 1 - de = fo oe -oc (7.7-7) ofo (e- e1 ) - de= O oe (7.7-8) <Xl -a;¡ (7.7-9) La integral de (7.7-8) se anula porque at0 /ae es una función par de e- e¡ y el integrando es, por tanto, una función impar de dicho argumento que, cuando se integra desde - oo a + oo, debe dar cero. La integral de (7.7-9) se pone en la forma antes indicada, mediante la substitución de x =(e- e¡)/kT; esta forma aparece en casi todas las tablas estándar de integrales definidas. Al substituir estos valores en (7.7-5), el resultado es 1= f <X> p of/> 1t2 (a2 4>) + ... f 0 (e)de= fj>(e1 ) +- (kT) 2 - 2 oe 6 oe (7.7-10) •¡ Esta fórmula es conveniente para sacar valores aproximados de las integrales de Fermi, donde la aproximación de la función 8 para a¡0 jae no es suficientemente buena. Está restringida por la condición (7 .7 -2) y por la condición de que kT <{ e1. Este método se puede usar para evaluar la relación Wiedemann-Franz para un gas de Fermi; los detalles quedan como ejercicio para el lector. Ahora suponga que se escoge f/>(e) = f~g(e) de (7.7-11) en donde a¡p¡ae = g(e) (7.7-12) Capacidad térmica de sistemas de electrones libres 227 siendo que g(e), como lo establece (5.2-22), se refiere a un sistema de electrones libres. Por tanto, de acuerdo con (7.7-10), n= f oo/ 0 (e)g(e) de = o i''<TJ g(e) de + -nz (kT) (a.!!...) . 2 6 o oe ., (7.7-13) Sin embargo, de acuerdo con (5.5-24), 1''(0) n =Jo g(e) de. (7.7-14) Al restar (7.7-14) de (7.7-13), se tiene, o= f. •,<TJg(e) de+ n2 6 (kT) 2(aag ) ~ g(e¡) [e¡(T)- e¡(O) J+ 6n2 (kT) 2 (aag ) . e ., s¡(OJ e ., (7.7-15) En la ecuación anterior se supuso que g(e) no varía mucho en el intervalo de e¡(O) a e¡(1), que, para kT ~e¡ será sólo una pequeña fracción de e¡(O). Puesto que g(e) es de la forma ce 1 12 con e igual a una constante. (7.7-15) se puede escribir como sigue n2 (kT)z e1(T) = e1 (0)- - - - . 12 e¡(T) (7.7-16) Para kT <{ e1 , el segundo término será una pequeña corrección que debe restarse de la cantidad relativamente grande e¡(O) y la diferencia y e¡(1) y e¡(O) será pequeña, en comparación con e¡(O). En estas circunstancias no se producirá un error grande si e¡(1) en el término de corrección de (7.7-16) se substituye con e¡(O), lo cual da, finalmente, nz(kT\z] e¡(T) = e¡(O) [ 1 - 12 e¡(O)/ . (7.7-17) Para evaluar el calor específico electrónico, se escoge cjJ(e) = f~ e g(e) de (7.7-18) en donde ocjJfoe = e g(e) (7.7-19) y Entonces, al substituir en (7.7-10), se tiene que oo ocjJ ioo i f 0 (e)- de = e g(e)f0 (e) de = U o oe o (7.7-20) 228 Teoría del electrón libre de los metales y U = l •,<T> n2 [ 0 o 6 oe e g(e) de +- (kT) 2 -(e g(e)) J. ., También en este caso, si se usa el hecho de que g( e)= ce 1 12 , esto se puede escribir como, l <¡(O) U = fe¡(T) ¡¡;2 3 e¡(O) 6 2 e g(e) de +- (kT) 2 ·- g(e1 ) e g(e) de+ O (7.7-21) Aquí, U0 es el valor de cero absoluto de la energía interna, según se representa mediante la integral de e g(e) desde O hasta efO), y la integral de esta cantidad en el rango pequeño e,(O) a efT) se ha aproximado, siguiendo el mismo procedimiento que se utilizó en relación con (7.7-15). En el último término de (7.7-21), g(e) se evalúa a efO) más que en ef1), lo cual introduce sólo un pequeño error. Al substituir el valor de ef1)-ef0) dado por (7.7-17) en (7.7-12), se puede escribir (7.7-22) De acuerdo con (5.2-22) y (5.5-25), g(ej(O)) se puede expresar como sJ2n g(e¡(O)) = ---¡;J m3f2[e¡(O)]If2 = (3n) 4nm -¡;r- -; l/J , que, puesto que según lo indica (5.5-25), la relación mjh 2 es igual a (3n/rr)21 3 j (8et(O)), se puede escribir 3n 3n g(e¡(O)) = 2e1 (0) = 2kTF. (7. 7-23) Substituyendo este valor en (7. 7-22), se tiene, por último, (7. 7-24) La capacidad térmica se obtiene en la forma acostumbrada y el resultado es e = au = n2 " ar 2 nk(I..). TF (7. 7-25) Esta expresión difiere del resultado clásico i:nk multiplicado por un factor (rr 2 /3)(T/Tp), que resulta 0.03 para T=300°K y Tp=30,000°K [un valor típico para metales simples, calculado a partir de (5.5-25)]. Por tanto, la componente Capacidad térmica de sistemas de electrones libres 229 electrónica del calor específico, según se calcula mediante la estadística de Fermi, resulta de sólo una pequeña fracción del valor de Drude-Lorentz fnk, y -es pequeñaexcepto a temperaturas muy bajas en comparación con la contribución reticular. A temperaturas pequeñas, en comparación con la de Debye, la contribución reticular se hace muy pequeña, aproximándose a cero, al igual que t 3 conforme T-+ O. En este rango, la contribución electrónica frecuentemente es un factor importante y, en ciertas gamas de temperaturas, puede ser incluso el efecto dominante. Se puede reconocer fácilmente en los datos experimentales, debido a su dependencia lineal de la temperatura, como lo indica (7. 7-25). EJERCICIOS l. Demuestre que si 'T es independiente de v, la función de distribución es una solución apro-m(v-vo) 2 2kT f(v) = Ae (donde Vu = ;;;- Eo) ximada de la ecuación de Boltzmann en el caso en que la distribución de Maxwell-Boltzmann represente la función de distnbución de equilibrio y en donde v0 <{,(kT/m) 112 . 2. Suponiendo la estadística de Maxwell-Boltzrnann, evalúe fa partir de (7.3-12), suponga que la dependencia de 'T sobre la energía está dada por 1 (E) =A e-s, en donde A y s son constantes. 3. En un metal como el cobre (resistividad 1.7 X I0-6 ohms-cm), ¿Cuál es, aproximadamente, el máximo campo eléctrico para el que podría aplicarse el método del electrón libre de Drude o Fermi estudiado en la sección 7 .3? ¿Cuál es la densidad de corriente para este valor del campo? 4. A partir de (7.7-10) y (7.7-17), deduzca las fórmulas (7.4-26) y (7.4-27) para la conductividad térmica y la relación de Wiedemann-Franz de un ga• de Fermi de electrones libres, usando la aproximación kT 4;.efi0). 5. Si se adopta la representación del electrón libre de Fermi de una superficie metálica, como se ilustra en el diagrama incluido, demuestre que existe una corriente de emisión termoiónica que puede fluir desde la barrera de potencial superficial, y que la densidad de la corriente termoiónica está dada por 1 - 4TTem(kT)2 - h' e -<PotkT. Jx. Suponga que r/>0 , la función de trabajo es ~k T. 6. Demuestre que si la trayectoria libre media es independiente de la velocidad, la conductividad eléctrica de un gas de electrones libres de Maxwell-Boltzmann, puede expresarse como a= 4ne 2Afy2TTmkT. 7. Describa físicamente el origen del efecto termoeléctrico. (Nota: considere una barra larga, la mitad de la cual se mantiene a la temperatura T 1 y la otra a la temperatura T2 (>T 1 ) Y calcule los flujos electrónicos en ambas direcciones en la interfaz entre las dos regiones. Use la estadística de Maxwell-Boltzmann.) t r- </>(x) T <Po ~~~~~~~~~~~~~•=O Superficie 230 Teoría del electrón libre de los metales LECTURAS RECOMENDADAS F. J. Blatt, Theory o[ Mobility o[ Electrons in Solids, Salid State Physics, Advances in Research and Applications, Vol. 4, Academic Press, Inc., Nueva York (1957), pp. 199-366. J. R. Drabble y H. J. Goldsmid, Thermal Conduction in Semiconductors, Pergamon Press, Oxford (1961). J.-P. Jan, Galvanomagnetic and Thermomagnetic E[[ects in Metals, Salid State Physics, Advances in Research and Applications, Vol. 5, Academic Press, Inc., Nueva York (1957), pp. 1-96. E. H. Putley, The Hall E[[ect and Related Phenomena, Butterworth & Co., Ltd., Londres (1960). F. Seitz, Modern Theory o[ Solids, McGraw-Hill Book Co., Inc., Nueva York (1940), capítulo 4. R. A. Smith, Wave Mechanics o[ Crystalline Solids, Chapman & Hall, Ltd., Londres (1961), capítulo 1O. J. Tauc, Photo-and Thermoelectric E[[ects in Semiconductors, Pergmon Press, Oxford (1962). CAPITULO 8 Teoría cuántica de los electrones en recles periódicas 8.1 INTRODUCCION La teoría del electrón libre de los metales, desarrollada en el capítulo anterior, se basa en la idea de que los electrones de conducción dentro de una substancia metálica actúan como las partículas libres clásicas de un gas, sometidas sólo a las limitaciones de la estadística de Fermi-Dirac. Desde el punto de vista de la mecánica cuántica, no es evidente por qué debe suceder esto. Tampoco es evidente por qué algunas substancias tienen gran cantidad de electrones libres y, por tanto son muy buenas conductoras, mientras que otras apenas tienen algunos y se comportan como aisladores. El punto de vista más sencillo de la mecánica cuántica r<"specto a un electrón . contenido en un cristal, es el de un solo electrón que se encuentra en un potencial perfectamente periódico que tiene la periodicidad de la red. En este modelo de un solo electrón de un sólido, el potencial periódico se puede considerar como resultado de la distribución periódica de carga asociada con los núcleos iónicos situados en los puntos reticulares, más el potencial "extendido" promedio (constante) aportado por todos los demás electrones libres que pertenecen al cristal, de tal manera que se tiene en cuenta la interacción promedio de un solo electrón con todos los demás. En consecuencia, la solución de la ecuación de Schroedinger para un solo electrón dentro de este potencial, proporciona un conjunto de estados de "un solo electrón" que pueden estar ocupados exclusivamente por un electrón y, de hecho, que pueden estar ocupados (de acuerdo con las limitaciones del principio de Pauli) por todos los electrones del cristal, ya que el electrón único que se consideró inicialmente se puede clasificar como típico de todos los electrones del sistema. La figura 8.1 muestra una representación unidimensional del potencial de un cristal periódico, como el que podría obtenerse siguiendo una trayectoria a lo largo de una de las direcciones ;} 00> de un cristal cúbico con una constante de red a. En lo que respecta a la representación cuántica de un electrón, normalmente se supondrá que la periodicidad del cristal se extiende al infinito en todas las direcciones; pero, por supuesto, en la ruperficie de cualquier cristal real la periodicidad se interrumpe siendo entonces la función del potencial algo semejante a lo que se ilustra en el extremo izquierdo de la figura 8.1. El espaciamiento reticular no será muy uniforme cerca de una superficie de esta naturaleza; pero, como cuestión práctica, generalmente se encontrará que la periodicidad de red es casi perfecta después de unos cuantos espaciamientos Jtómicos dentro del cristal. 231 232 Teoría cuántica de los electrones en redes periódicas Se descubrirá que las funciones de onda de un ele~trón (denominadas funciones de Bloch) calculadas con el método anterior, siempre tienen ciertas propiedades íntimamente relacionadas con la periodicidad reticular y que las energías electrónicas permisibles ocurren en bandas de estados permitidos que están separados por regiones de energía prohibidas. Dentro de las bandas de energía permitidas se notará que el comportamiento dinámico de los electrones es muy similar al de las partículas libres. La cuestión de si un cristal es un conductor o un aislador, dependerá de si los estados electrónicos dentro de una banda o conjunto de bandas permisibles dadas están llenos por completo o parcialmente vacíos. Además, se verá que el comportamiento colectivo de los electrones dentro de una banda de estados permisibles casi llena, es muy semejante al de unos cuantos portadores de carga positiva en una Superficie Figura 8.1. -x Representación esquemática del potencial dentro de una red cristalina perfectamente periódica. La barrera de potencial de la superficie se muestra a la izquierda. banda casi vacía. Por tanto, la representación de un solo electrón libre sirve para justificar el modelo del electrón libre desde un punto de vista fundamental y también para contestar a ciertas preguntas difíciles que la teoría del electrón libre por sí sola, ni siquiera podría tratar de explicar. No obstante, debe recordarse que el método del electrón único es una aproximación en la que se omiten completamente los detalles de las interacciones electrón-electrón. 8.2 EL TEOREMA DE BLOCH El teorema de Bloch 1 es una proposición matemática relacionada con la forma de las funciones de onda de un electrón para un potencial perfectamente periódico. Sea una ecuación diferencial de la forma d21/1 2 + f(x)ljl(x) =O dx (8.2-1) 1 F. Bloch, Z. Physik 52, 555(1928); los matemáticos han estado familiarizados con el mismo resultado con el nombre de Teorema de Floquet. Por ejemplo, véase E. l. Whittaker y (;.N. Watson, Modern Analysis. Cambrid~~e University Press (1948), página 412. El teorémo de Bloch 233 en donde f(x) es una función dada que es periódica con un periodo a, de tal manera que f(x +a)= f(x). (8.2-2) Si es periódica la función de potencial V(x) para la ecuación unidimensional de Schrodinger de la forma ( 4.8-5), entonces la ecuación de Schródinger será un caso especial de la ecuación (8.2-1). Puesto que (8.2-1) es una ecuación diferencial lineal de segundo orden, (para cualquier valor dado de energía e en 4.8-5) existen dos soluciones independientes g(x) y h(x) tales que t/J(x) = Ag(x) + Bh(x) (8.2-3) representa la solución más general de (8.2-1). Puesto que f(x+a)=f(x), no sólo g(x) y h(x), sino que también g(x+a) y h(x+a) satisfacen (8.2-1). Sin embargo, .ualquier solución de (8.2-1) se puede expresar como una combinación lineal de g(x) y h(x) de la forma (8.2-3). Entonces, en particular, g(x + a)= o: 1 g(x) + o: 2 h(x) (8.2-4) h(x + a) = P1 g(x) + P2 h(x) en donde a 1 , a 2 , {3 1 y {3 2 son constantes. Por tanto, tf¡(x +a)= Ag(x +a)+ Bh(x +a) (8.2-5) Ahora, ¡J;(x +a) siempre se puede expresar en la forma tf¡(x +a)= A.tf¡(x), (8.2-6) en donde A es una constante, a condición de que se escoja el valor adecuado para A. Al comparar (8.2-5) y (8.2-3), se observa que si (8.2-6) debe satisfacerse, entonces, . (8.2-7) Este sistema de ecuaciones homogéneas en A y B tienen soluciones diferentes a A = B =O, sólo si (8.2-8) La solución de esta ecuación cuadrática en A sirve para determinar los dos valores posibles de A para los que (8.2-6) es cierta. Si se les desigana como A¡ y ;\.2 , tf¡(x +a)= A. 1 t/l(x) tf¡(x + a) = A. 2 t/J(x). (8.2-9) 234 Teoría cuántica de los electrones en redes periódicas Si ahora se definen k 1 'y k 2 de tal modo que (8.2-10) y se define uk 1(x) y uk 2(x) como uk,(x) = e-ik,xif¡(x) (8.2-11) si se utiliza (8.2·11), (8.2·9) y (8.2-10), es evidente que (8.2-12) La función uk entonces es periódica con un periodo a; de un modo similar esto mismo es aplicable ~ uk 2 (x ). Por tanto, de acuerdo con (8.2-11 ), 1/l(x) puede escribirse siempre en la forma (8.2-13) en donde uk(x) es una función periódica con un periodo a, y en donde k representa ya sea a k 1 o a k 2 tal y como se determinaron antes. Este es el teorema de Bloch y todas las funciones de onda de un electrón para potenciales periódicos se pueden escribir de este modo. En tres dimensiones, el teorema de Bloch se convierte en (8.2-14) Las funciones de onda (8.2-13) y (8.2-14) tienen claramente la forma de ondas planas con un vector de propagación k modulado por una función cuya periodicidad es la de la red cristalina. La función de Bloch (8.2-13) se puede considerar como la manera más general de escribir una solución de la ecuación de Schrodinger que conducr a la misma densidad de probabilidad 1/1* 1/1 en cada célula unitaria del cristal. De acuerdo con (8.2-13), es evidente que en la nésima célula unitaria, debido a la periodicidad de uk, (8.2-15) De igu?l manera, 1/J*(x + na)= e-iknal/l*(x) (8.2-16) 1/J*(x + na)if¡(x + na)= 1/J*(x)if¡(x). (8.2-17) y La función de onda tridimensional (9.3-14) tiene el mismo tipo de comportamiento. En el caso unidimensional, para un cristal infinito, se puede encontrar una solución formal a la ecuación de Schrodinger para cualquier valor de energía e El modelo de Kronig-Penney de un cristal infinito unidimensional 235 dentro de ciertos rangos, y se tienen dos valores de k correspondientes a cada uno de estos valores de e, por medio de (8.2-8) y (8.2-10). Los valores propios de energía permitidos para dicho sistema, dentro de esos rangos, son continuos. Por otra parte, si el cristal tiene una extensión finita, en cuyo caso, sobre la superficie se deben satisfacer las condiciones físicas apropiadas de frontera, entonces, las soluciones que satisfagan la ecuación de Schrodinger y, a la vez, las condiciones de frontera pueden encontrarse pero, sólo para ciertos valores propios de energía discreta. Puesto que por cada valor propio de energía se tienen sólo dos valores relacionados de k, los valores permisibles de k forman también un conjunto discreto. En este caso, la solución es muy similar a la que se encontró en relación con las vibraciones mecánicas de una red periódica y que se analizó en la sección 3.3. Por supuesto, cuando el número de átomos dentro del cristal se hace demasiado grande, los valores permitidos de e y k, aunque siguen siendo discretos, se amontonan mucho y en la mayoría de los casos se pueden considerar como bandas casi continuas de valores permisibles. Los cristales tridimensionales tienen el mismo comportamiento cualitativo, excepto que en este caso, se tienen más de dos valores permisibles de k para cada valor propio de energía. Por ejemplo, si se imponen condiciones periódicas de frontera a un cristal unidimensional de N átomos (o si se supone que la red tiene la forma de un anillo de N átomos), entonces, si la funcion de onda 1/1 debe tener un solo valor, es necesario (utilizando (8.2-15)) que t/l(x +Na)= eikNatf¡(x) = t/J(x) (8.2-18) .JOr lo cual, eikNa = 1 o bien, 2n:in eika = (l)lfN =e--¡¡- (n = 0,1,2, ·· · N - 1), (8.2-19) recordando la forma de las Nésimas raíces de unidad. Si se toma el logaritmo de ambos lados de esta ecuación y se resuelve para k, se encontrará que, en estas condiciones de frontera, los valores posibles de k son 2nn k=n Na (n = 0,1,2, ... N). (8.2-20) Si N es grande, habrá muchos valores permitidos de k dados por (8.2-20) y, en este caso, se puede considerar que forman un rango casi continuo de valores. Por supuesto, los N valores distintos de k permitidos por (8.2-20) no corresponden al mismo valor de energía. Por cada valor constante de e se tendrán sólo los dos valores permitidos de k dados por (8.2-10). 8.3 EL MODELO DE KRONIG-PENNEY DE UN CRISTAL INFINITO UNIDIMENSIONAL Para el caso del potencial periódico infinito de un pozo cuadrado unidimensional que se ilustra en la figura 8.2, se puede llegar a una solución exacta de la 236 Teoría cuántica de los electrones en redes periódicas ecuación de Schródinger. Kronig y Penney 2 fueron los primeros en investigar esta solución y, aunque se relaciona con un potencial periódico algo idealizado que cons· tituye sólo una aproximación burda del que se encuentra en un cristal real, es de gran utilidad porque sirve para ilustrar de un modo más explícito muchas de las características físicas importantes del comportamiento cuántico de los electrones en redes periódicas. Las funciones de onda asociadas con este modelo se pueden calcu· lar con aproximación de un electrón, resolviendo la ecuación de Schrodinger d 2 1/1 dx 2 + 2m ¡r- (e- V(x)(l/l(x) =O (8.3-1) para un solo electrón dentro del potencial periódico V(x) según se ilustra en la fi. ¡V (x) -Vo o u-J 1 U2 Figura 8.2. --__..,X a+b~ (celda unitaria) u,(x) Potencial periódico ideal de pozo cuadrado usado por Kronig y Penney para ilustrar las características generales del comportamiento cuántico de los electrones en redes periódicas. gura 8.2. Puesto que, de acuerdo con la sección anterior, las funciones de onda deben tener la forma de Bloch, se puede esperar que (8.3-2) Al substituir (8.3-2) en (8.3-1), se encuentra que la función u(x) debe satisfacer d2u du ( 2m V(x)) dx2 + 2ik dx- k2 - cx2 + ¡¡2 u(x) =O (8.3-3) en donde (8.3-4) Para el potencial de la figura 8.2, se encontrará que (0 < x <a) 2. R. de L. Kroni~ y W. G. Penney, Proc. Roy. Soc. Al30, 499 (1931). {8.3-5) El modelo de Kronig-Penney de un cristal infinito unidimensional 237 y ( -b <X< 0), (8.3-6) en donde u 1 (x) representa el valor de u(x) dentro del intervalo (O<x<a) y u 2 (x) representa el valor de u(x) dentro de (- b < x < 0), y en donde (8.3-7) Las ecuaciones rliferenciales (8.3-5) y (8.3-6) se resuelven fácilmente mediante procedimientos normales y se obtiene (0 < x <a) (8.3-8) ( -b <X< 0}, '(8.3-9) en donde A, B, e y D son constantes arbitrarias. Se observará que la cantidad (3 es puramente imaginaria para O< e< V0 . El requisito de continuidad para la función de onda 1/J y su derivada en x = a y x =- b, requiere que la solución u(x) satisfaga estas mismas condiciones, ya que en (8.3-2) eikx es una función apropiada. Si se aplican estas condiciones de frontera (y se recuerda que, dado que u(x) tiene la periodicidad de la red, u 1 (a)= u 2 (- b )), se encuentra que i(a. - k)A - Aei<cx-k)a i(a. + k)B = i(p - k)e - i(P + k)D (8.3-10) + Be-i<cx+k)a = ee-i<IJ-klb + Dei<IJ+k)b i(a.- k)Aei(cx-k)a- i(a. + k)Be-i(cx+k)a = i(P- k)ee-i(/1-k)b- i(p + k)Dei(/l+k)b Por tanto, los coeficientes A, B, e y D se pueden determinar como la solución de un grupo de cuatro ecuaciones homogéneas simultáneas y lineales en dichas cantidades. Por supuesto, no existe ninguna otra solución aparte de A = B = e= D = O, a menos que desaparezca el determinante de los coeficientes. Esto requiere que 1 a.-k 1 1 1 -(a.+ k) P-k -(P +k) ei(cx-k)a e-i(cx+k)a e-i(/1-k)b ei<fJH)b (a._ k)ei(cx-k)a -(a.+ k)e-i(cx+k)a (p _ k)e-i<IJ-k)b -(P + k)ei(/l+k)b =O. (8.3-11) Al expander el determinante, se puede demostrar, después de muchas operaciones algebraicas tediosas, pero directas, que (8.3-11) se puede expresar como a.2 + p2 - ·--:¡;¡¡-sen a.a sen Pb + cos a.a cos Pb = cos k( a + b). (8.3-12) 238 Teoría cuántica de los electrones en redes periódicas Puesto que en el rango (O< e< V0 ), {3 es imaginaria según lo define (8.3-7), para estos valores de energía es más conveniente expresar (8.3-12) en una forma ligeramente distinta. Haciendo que f3 = iy (8.3-13) en esta región y observando que cos ix = cosh x ción (8.3-12) se puede escribir como sigue y sen ix = i senh x, la ecua- y2 - a2 - 2- - senh yb sen aa + cosh yb cos cxa = cos k( a + b), ay (8.3-14) en donde 'Y es una cantidad real positiva en el intervalo (O< e< V0 ), al igual que {3 lo es en el intervalo (V0 <e<""). En consecuencia, es más conveniente usar (8.3-12) cuando (V0 <e<oo) y (8.3-14) cuando (O<e< V0 ). Las funciones de onda (8.3-2), como todas las funciones de onda, deben tener un comportamiento adecuado conforme x tiende a ± oo. Puesto que u(x) es una función periódica cuyos valores son los mismos en cada célula unitaria, no se encuentran dificultades en este aspecto a condición de que el factor eikx de (8.3-2) se mantenga finito en estas condiciones. Sin embargo, eikx cumple con lo anterior tanto en + oo como en - oo sólo si k es real, por lo que eikx es oscilatoria. Si k fuere imaginaria, eikx divergiría al infintio ya sea en + oo o - oo, y la expresión resultante para ¡J¡(x) no se comportaría debidamente como función de onda. Por tanto, se deben aceptar sólo funciones de la forma (8.3-2) con, valores reales de red k. Las expresiones anteriores (8.3-12) y (8.3-13) tienen en el lado izquierdo una función de la forma K 1 senaa+K 2 cosaa que debe ser igual a cosk(a+b). Si para un valor dado de energía la función del lado izquierdo de estas ecuaciones cuenta con un valor dentro del rango comprendido entre + 1 y - 1 . el valor requerido para cos k(a+ b) se obtiene con un valor real para el argumento k(a+ b ), Por otro lado, si el valor de la función del lado izquierdo de (8.3-12) o (8.3-14) queda fuera de dicho rango, esto significaría que cos k(a + b) tendría que ser mayor que + 1 o menor que - 1, lo cual, a su vez, requiere que el argumento k( a + b) sea un número complejo con una parte imaginaria diferente a cero. En estas circunstancias, las soluciones (8.3-2) no se comportarían debidamente en infinito y no satisfarían el requisito físico para las funciones de onda del sistema. Las energías asociadas con estos valores de k estarían prohibidas para el electrón. Los lados izquierdos de (8.3-12) y (8.3-14) se pueden escribir en la forma K 3 sen(aa -6), en donde K 3 =(K~ +KD 1 12 y tan 6 = K¡fK2. En esta forma (8.3-12) y (8.3-14) se pueden escribir como sigue (8.3-15) en donde tan éJ = - a2 + {32 2af3 tan flb CVo <e< oo) y [1 + (a2 + /)2 ] 1/2 2 cos(aa - <5) = cos k(a + b), 4a 2 y2 senh yb rn clonde tan <5 = a2 + y2 2ay tanh yb (O< e< V0 ). (8.3-16) El modelo de Kronig-Penney de un cristal infinito unidimensional 239 De acuerdo con estas expresiones, es evidente que en ambos casos, el lado izquierdo tiene la forma de una función coseno por un factor de modulación cuya amplitud es invariablemente mayor que la unidad. El valor de este factor de modu· !ación en realidad, es un máximo para a= O (y, por tanto, para e= O), y se acerca a la unidad en el límite de las energías grandes, en donde a ~ (3. Cuando los lados izquierdos de (8.3·15) y (8.3-16) se grafican como una función de la energía, en cuyo caso se debe observar a partir de (8.3-4) y (8.3-7) que (8.3-17) los resultados son como se ilustra en la figura 8.3. En esta figura, el lado izquierdo de (8.3·15) o (8.3-16) aparece graficado en función de la energía. Cuando la orde· f(•) +,. k==- o+b Figura 8.3. Gráfica de las funciones del lado izquierdo de (8.3-15) y (8.3-16) en función de la energía. Las regiones sombreadas señalan las bandas de energía prohibidas en donde el valor de k es complejo, las regiones no sombreadas son las bandas de energía permisibles correspondientes a valores reales de k. nada de la curva está entre + 1 y - 1, existe un valor real para k correspondiendo a funciones de onda físicamente posibles. No obstante, fuera de estos límites, k debe ser compleja con una parte imaginaria diferente a cero. Estos valores de k nunca pueden producir funciones de onda con un significado físico; los rangos de energía correspondientes están prohibidos y se ilustran en la figura 8.3 como las regiones sombreadas. Por tanto, se tienen regiones alternas de valores propios permisibles y regiones prohibidas. Estas regiones se denominan casi siempre bandas de energía permisibles y prohibidas y el agrupamiento de los valores de energía permisibles en estas bandas es una de las características típicas más importantes del comporta· miento de los electrones en redes periódicas. Se puede demostrar que las bandas de energía que tienen los mismos aspectos cualitativos que los que se indican en la figura 8.3, se forman sea cual fuere la forma detallada del potencial, siempre y cuando sea periódico. 240 Teoría cuántica de los electrones en redes periódicas c(k) 1 1 1 1 1 1 1 /-Partícula libre 1 (e= ·Pk 212m l 1 A 'i l\ 1\ 1 1 1 1 1 1 1 1 1 1 1 1 -3,. o•b Figura 8.4. •o 1 1 \ 1 1 1 1- k(•ol lk(•ol -2,. o•b ~ o•b o _!!_ o•b k o+b _k o+b -* ..1!_ o+b La energía € graficada como una función de k de acuerdo con (8.3-15) y (8.3-16). Si se usan (8.3-1 5), (8.3-16), (8.3-4) y (8.3-7), se puede grafic:.~r una curva que presente a la energía e como una función de k. En la figura 8.4 se muestra el resultado de una manera esquemática. Las bandas de energía prohibidas y la relación de e en función de k dentro de las diferentes bandas permitidas, se han asignado de acuerdo con el patrón que aparece en la figura 8.3. Puesto que cos- 1 k(a + b) n0 es una función de un solo valor, esta asignación es necesariamente arbitraria. Para energías grandes, es aparente que la función e(k) se acerca a la relación del electrón libre e= h2 k 2 /2m (que se ilustra con la curva punteada de la figura 8.4) de un modo muy semejante dentro de las bandas permitidas. Así también, para energías grandes, se ha encontrado que las bandas permitidas se hacen muy anchas y las regiones prohibidas muy angostas. No obstante, la curva e(k) siempre tiene una pendiente cero en los bordes de las bandas permisibles, es decir, cuando k = ± mr/ (a+ b), siendo n un entero. Este resultado se puede corroborar mediante la derivación directa de (8.3-1 S) y ( 8.3-16); pero aquí no se verán los detalles de estos cálculos. Esta característica de la curva e(k) es muy general y se puede demostrar que se presenta incluso en el caso tridimensionaL independientemente de la forma matemática precisa de la función de potencial. 8.4 CANTIDAD DE MOVIMIENTO DEL CRISTAL Y MASA EFECTIVA forma Si la función uk(x) de (8.2-13) es una constante, la función de onda tiene la e±ikx correspondiente a un electrón perfectamente libre cuya cantidad de Cantidad de movimiento del cristal y moSil efectiva 241 movimiento es p = ± lik y cuya energía, de acuerdo con los resultados de la sección 4.9, sería (8.4-1) En la figura 8.4 se ilustra esta relación por medio de la curva punteada. Para valores grandes de e, la relación real e en función de k se acerca mucho a esta relación. De acuerdo con (8.2-13) y los resultados de la sección anterior, es evidente que k es una constante del movimiento, que lik tiene las dimensiones de una cantidad de movimiento y que al aumentar la energía del electrón (haciéndose, por ende. la partícula mucho más "libre"), los valores de k se aproximan en general a los de la cantidad de movimiento de la partícula libre dividido.; entre h. Se puede ver con facilidad que estas conclusiones se deben aplicar sea cual fu~re la forma partícular que adquiera el potencial periódico. Por tanto, se acostumbra referirse a lik corno la cantidad de movimiento del cristal y, corno se verá en breve, sucede en muchos casos que el comportamiento dinámico del electrón dentro de la red cristalina, con respecto a la cantidad de movimiento del cristal, es muy similar al de una partícula libre con respecto a la cantidad de movimiento real. Para que quede perfectamente clara la diferencia entre la cantidad de movimiento real y la cantidad de rnovi.Jnjento del cristal, se debe observar que debido a la presencia del potencial de red, la cantidad de movimiento real instantáneo de un electrón no es en absoluto una constante del movimiento y no se calcula directamente por métodos de la mecánica cuántica, excepto corno un valor promedio, en tanto que para un estado de energía dado, la cantidad de movimiento del cristal lik es un valor constante perfectamente bien definido al igual que lo es la cantidad de movimiento real de una partícula libre de cierta energía. Ahora se verá el movimiento de un electrón dentro de un cristal bajo la influencia de un campo eléctrico aplicado. Para comprender mejor el movimiento de un electrón en esta situación, se deberá localizar la función de onda superponiendo soluciones que tienen distintos valores de k, corno se hizo en la sección 4.9. Si se hace esto, la velocidad de grupo asociada con el "paquete de ondas" del electrón, es dw 1 de Vg = dk = h dk' (8.4-2) en donde, por supuesto, e y w tienen una conexión a través de la relación de Planck e= :liw. Supóngase que hay un campo eléctrico externo E que actúa sobre el electrón, que adquiere un incremento en velocidad dvg en una distancia dx, en un tiempo dt. Entonces, si se usa (8.4-2), se observa que de eE de de=-dk= -eEdx= -eEv dt= - - - d t dk g li dk ' (8.4-3) de donde, eE dk= --dt li ' (8.4-4) dk dp li - = - = -e E = F dt dt ' (8.4-5) o bien, 242 Teoría cuántica de los electrones en redes periódicas en donde ahora se tiene el símbolo p para denotar la cantidad de movimiento del cristal. La ecuación (8.4-5) indica que la capacidad de cambio respecto al tiempo de la cantidad de movimiento del cristal es igual a la fuerza - eE. Por tanto, es análoga a la ley de Newton, que demuestra que la cantidad de movimiento del cristal del electrón en una red periódica cambia bajo la influencia de un campo aplicado, en la misma forma que lo hace la cantidad de movimiento real de un electrón libre en el vacío. Si se deriva la expresión (8.4-2) con respecto al tiempo, el resultado es (8.4-6) que, usando (8.4-5), se puede escribir como sigue (8.4-7) en donde la masa efectiva m* está dada por (8.4-8) La expres10n (8.4-7) es fundamentalmente la ecuac10n de fuerza, de Newton. El factor de proporcionalidad que relaciona a la fuerza eE y a la aceleración dgg/dt se puede considerar como la masa efectiva del electrón. Sin embargo, la masa gravitacional real del electrón no se relaciona directamente con la masa efectiva; se trata de la cantidad d 2 e/dk 2 que es el factor importante. Si el electrón en realidad es libre, entonces e y k se relacionan por medio de (8.4-1) y (8.4-8) se reduce a m*= m. Si la energía es una función parabólica de k, que tiene la forma (8.4-9) entonces, la masa efectiva tiene un valor constante m*= h2 /2C y el comportamiento dinámico del electrón será el mismo que el de una partícula libre con esta masa efectiva. Si la energía no es una función parabólica de k, entonces dicha masa no será constante con la energía y el comportamiento dinámico será el de una partícula de masa variable complicándose con ello la situación. En cualquier caso, para una primera aproximación, todo el efecto del potencial del cristal periódico reside en substituir la masa del electrón libre por una masa efectiva. Afortunadamente, la relación que asocia a e con k es casi siempre parabólica o casi parabólica sobre el rango de energías accesible a un electrón dentro del cristal. De acuerdo con la figura 8.4, parece ser que la curva e en función de k tiene siempre una forma parabólica en la base y la parte superior de las bandas de energía permisibles. Sin embargo, incluso cuando los electrones del sistema están en otras regiones, lo importante es que la masa efectiva sea fundamentalmente constante sobre un intervalo de energía, del orden de la cantidad promedio de energía que una partícula puede adquirir o perder en un solo evento de dispersión, o entre varios eventos de dispersión en un tiempo del orden del tiempo de relajación. Esta cantidad de energía es del orden de kT No obstante, a 300°K, kT representa sólo 0.025 eV, y la anchura total de una banda de energía que puede desempeñar un papel importante en los procesos de transporte en substancias cristalinas típicas es Representación de zona reducida; electrones y huecos 243 mucho mayor que esto casi siempre del orden de 1 eV. En eventos de dispersión independientes o en intervalos entre eventos de dispersión sucesivos, un electrón estará confinado casi siempH~ dentro de un corto segmento de la curva E en función de k, que casi siempre se puede considerar como aproximadamente parabólico. Esto hace ver que la representación del electrón libre en un metal está justificada en su mayor parte, y la única corrección importante es que la masa del electrón libre debe substituirse en todos los casos por una masa efectiva apropiada relacionada con la forma de la curva E en función de k, por medio de (8.4-8). En consecuencia, se llega a la conclusión de que todos los resultados derivados en el capítulo 7 basándose en la teoría del electrón libre, son correctos a condición de que la masa del electrón se substituya con la masa efectiva apropiada. La masa efectiva se puede deducir por comparación de los datos del calor específico electrónico que se han obtenido a través de la experiencia, con el resultado del electrón libre dado por la ecuación (7. 7-25); también se puede L alcular desde el punto de vista de la mecánica cuántica principiando con las funcione~ de onda atómicas autoconsistentes para los átomos del cristal, que luego se combinan para dar un potencial de cristal apropiado para la substancia en cuestión. Los valores calculados de este modo concuerdan casi siempre con los que se determinan de un modo experimental. Para la mayoría de los metales, la masa efectiva varía entre la mitad y el doble de la masa del electrón libre, aunque para muchos metales de transición es mucho mayor y para ciertos compuestos del tipo III-V puede ser mucho menor. 8.5 REPRESENTACION DE ZONA REDUCIDA; ELECTRONES Y HUECOS En la figura 8.3 se ilustra la asignacwn de rangos de valores para k dentro de cada banda de energía permitida, lo cual produce la curva que aparece en la figura 8.4. Puesto que el único requisito que se debe llenar dentro de cada banda es que - 1 .:;;; cos k(a + b) .:;;; + 1, es evidente que esa asignación de valores para k a cada banda no es única. La ventaja de la asignación ilustrada en la figura 8.3 es que lleva a lo que se llama representación extendida de la figura 8.4, en la que es muy evidente la relación con la curva de la partícula libre E en función de k. Sin embargo, se podría trasladar cualquiera de los segmentos de la curva que aparece en la figura 8.4, a la derecha o a la izquierda, en forma paralela al eje k y a una distancia 2mr/(a + b), en donde n es un entero y se seguirán satisfaciendo las relaciones (8.3-15) y (8.3-16), ya que cualquier transformación de esta índole no varía el valor de cos k( a + b ). A veces es muy útil hacer una transformación particular de este tipo trasladando los diferentes segmentos de la curva E en función de k a la derecha o la izquierda, en forma paralela al eje k y a distancias que son múltiplos enteros de 2n/(a+b), de tal manera que todos queden dentro del intervalo -nf(a+b)<k<n/ (a + b). La representación resultante de la energía en función de la relaci0n de la constante de propagación se conoce con el nombre de representación de zona reducida. La representación de zona reducida de la curva de la figura 8.4 se ilustra en la figura 8.5. En cualquier caso, se observará que las funciones de onda de Bloch (8.2-13) satisfacen la condición de reflexión de Bragg (2.1-1) en los puntos k= nn/ (a + b ), como se vio en relación con las vibraciones mecánicas de la red de la sección 3.3. En estos puntos, la velocidad de grupo h- 1 dE/dK es cero, correspondiendo a una onda estacionaria que representa a un electrón en reposo. Se puede considerar que el electrón sufre una difracción interna por medio del potencial de 244 Teoría cuántica de los electrones en redes periódicas dk) _,._ O+b Figura 8.5. Representación esquemática de la gráfica de € en función de k, de la figura 8.4, transformada a la representación de zona reducida. red en estas circunstancias. En una sección posterior se ampliarán los conceptos relacionados con este tema. En el cristal infinitamente grande de la sección 8.3, las energías permitidas forman un continuo de valores dentro de las bandas permisibles. Sin embargo, si el cristal tiene una extensión finita y contiene un total de N átomos, ya se vio, de acuerdo con (8.2-20), que por el contrario, sólo se tendrán N estados propios permisibles específicos de la cantidad de movimiento del cristal k dentro de cada banda de energía permisible. De acuerdo con la figura 8.4, se puede ver que para una energía dada e0 , los dos valores de cantidad de movimiento de cristal permisibles son k(e 0 ) y - k(e 0 ). Desde el punto de vista físico, el primero representa un estado en el que un electrón se mueve hacia la derecha con la cantidad de movimiento positivo del cristal k(e 0 ), en tanto que el segundo representa un estado en el que un electrón se desplaza hacia la izquierda con una cantidad de movimiento del cristal igual y opuesta. Evidentemente, la energía es la misma en ambos casos. El efecto del espín de electrón, en este caso, al igual que en sistemas atómicos aislados, es duplicar el factor de degeneración asociado con todos los niveles de energía del sistema, ya que se debe considerar que cada estado cuántico se ha dividido en dos alojando uno de ellos a un electrón con "espín ascendente" y el otro, un electrón con ''espín descendente". Entonces, cuando se incluye el efecto del espín electrónico, se debe llegar a la conclusión de que dentro de cada banda de energía permisible del sistema se tienen exactamente 2N estados cuánticos. A una temperatura de cero absoluto, los electrones del sistema ocuparán estos estados, uno por cada estado, como lo requiere el principio de exclusión de Pauli, a partir del estado más bajo y en forma ascendente, hasta una energía dada que se determina mediante el número de estados disponibles, su distribución de energía y el número de electrones del cristal. Por supuesto, esta energía es la de Fermi del cristal a la temperatura cero. En un cristal unidimensional, algunas de las bandas permisibles estarán totalmente llenas, algunas completamente vacías y otras llenas sólo en Representación de zona reducida; electrones y huecos 245 parte. 3 Si se aplica un campo eléctrico, es evidente que las bandas vacías no podrán aportar ninguna corriente; sin embargo, también es cierto que no se puede obtener una corriente de las bandas llenas. Esto se puede comprender observando que la densidad de corriente que se produce en una banda dada será (8.5-1) en donde ¡:; es la velocidad promedio y n 0 el número de electrones por unidad de volumen pertenecientes a dicha banda. No obstante, v se puede expresar como sigue (8.5-2) en donde la suma se toma de todas las velocidades a,.ociadas con los electrones individuales dentro del volumen V del material. Por tanto, si se usa (8.5-2), la expresión (8.5-1) se puede escribir como (8.5-3) Sin embargo, esto debe dar cero cuando se suma sobre una banda completa, ya que debido a la simetría de las curvas de la figura 8.4 o la figura 8.5, alrededor del eje E( k) por cada estado de velocidad positiva h- 1 aEjak correspondiente a un punto de pendiente positiva, existe un estado correspondiente a una velocidad negativa de igual magnitud (con pendiente negativa) en k'=- k. Se debe llegar a la conclusión de que sólo las bandas que están parcialmente llenas pueden aportar un flujo de corriente. Esto se comprende desde un punto de vista físico observando que en la banda parcialmente llena existen siempre electroneo que se pueden excitar gradualmente a estados desocupados de mayor energía y cantidad de movimiento, mientras que en una banda llena, debido al principio de exclusión de Pauli, esta excitación gradual de campo no puede ocurrir jamás debido a que todos los estados están ya ocupados. Un solo electrón en reposo en una banda vacía. ocupará el estado de energía más bajo en la base de dicha banda, en ausencia de una excitación térmica, como se puede ver en la figura 8.6. Si ahora se aplica un campo eléctrico E 0 al cristal, el electrón experimentará una fuerza - eE0 y se excitará gradualmente a través de estados de energía siempre creciente y cantidad de movimiento (negativa), adquiriendo una cantidad de movimiento cada vez mayor en la dirección - x, de acuerdo con (8.4-5). De acuerdo con las predicciones de la teoría expuesta en las secciones 8.2-8.4, este proceso seguirá excitando al electrón a través de energías sucesivamente más altas, hasta que llegue a la parte superior de la banda en x = rrfa, en donde a es el espaciamiento reti~.ular. Puesto que los puntos x = rrfa y x = - rrfa son equivalentes, se puede considerar que el electrón "reaparece" en x = rrfa, disminuyendo su energía a lo largo de la porción derecha de la curva conforme k va de rr/a a cero, llegando al punto inicial en el que todo el proceso se repite. En estas circunstancias, el movimiento del electrón es oscilatorio (oscilación de Zener). Es importante observar que no existe un mecanismo inherente a la teoría de las secciones 8.2-8.4 que sirva para limitar este movimiento; más bien, éste continuará de un modo indefinido de acuerdo con la teoría aquí delineada. Si el potencial fuera 3 La situación en los sistemas bidimensionales y tridimensionales es más complc1a. Fn estos casos, la energía de diferentes bandas se puede superponer y más de una banda puede estar parcialmente llena. Estos sistemas se estudiarán Pn detalle más adelante. 246 Teoría cuántica de los electrones en redes periódicas r(k) ----•w+-----~~~----_,~-k o Figura 8.6. Un electrón que se encuentra cerca de la base de una banda permisible, sujeto a fuerzas que tienden a acelerarlo a lo largo de la dirección -x. perfectamente parabólico en lugar de tener la forma que se ilustra en la figura 8.6, el electrón adquiriría una velocidad y energía ilimitadas. Entonces, se debe llegar a la conclusión de que en cualquiera de los casos, el movimiento de un electrón libre dentro de un potencial perfectamente periódico se realiza sin que lo impida la red, en el sentido de que no se registran procesos de dispersión que detengan o aleatoricen la velocidad de un electrón, y que se relacionen con la misma Sin embargo, si existe una desviación de la periodicidad perfecta de la red, este resultado no se puede aplicar. En este caso existirá siempre la probabilidad de una transición aleatoria repentina a un estado relacionado con otro valor de k dentro de la banda. En promedio, estas transiciones aleatorias hacen que el electrón regrese a k = O y se puede decidir que existe un proceso de dispersión asociado con el hecho de que el potencial de red se aleja de la periodicidad perfecta. Esta desviación se puede deber al hecho de que la red puede encontrarse a una temperatura superior al cero absoluto, en cuyo caso las vibraciones térmicas que se establecen introducen una leve aperiodicidad y las posiciones instantáneas de los átomos ya no coinciden con precisión con la red periódica de sus posiciones de equilibrio. Esta situación se puede analizar de acuerdo con una representación en la que los electrones se ven dispersados por acción de los fonones. La desviaciones de la periodicidad pueden causarse también por la presencia de átomos de impureza así como por vacíos de red, átomos intersticiales dislocaciones y otros defectos estructurales de la red cristalina. Estos efectos dan como resultado los fenómenos de la dispersión de red, dispersión de impurezas y dispersión de defecto que se vieron en el capítulo anterior. El estudio de los aspectos cuantitativos de estos procesos se pospondrá hasta un capí· tulo subsecuente. Estos procesos de dispersión hacen que el comportamiento de oscilación de Zener no se presente jamás en la práctica. 4 Lo que en realidad sucede en todas las situaciones experimentalmente factibles, es que un electrón que principia en O de la figura 8.6, se acelera como lo describe la teoría de las secciones 8.2-8.4, hasta que llega a un punto A a una pequeña distancia a lo largo de la porción parabólica inferior de la curva. Su compartimiento en este rango es el de un electrón libre de masa m*, como lo establece (8.4-8). En el punto A se ve dispersado por uno de los mecanismos antes descritos, llegando en promedio nuevamente a O, en donde se 4 Se puede encontrar un estudio cuantitativo de la oscilación de Zener en E. Spenke, Electronic Scmiconductors, McGraw-Hill Book Co., Inc., Nueva York (1958), páginas 229, 257. Representación de zona reducida; electrones y huecos 247 repite el ciclo. Entonces, el comportamiento es el de una partícula libre sujeta a procesos de dispersión que se acaban de ver en el último capítulo, lo cual conduce a la ley de Ohm, la conductividad térmica, el efecto termoeléctrico y todos los demás resultados de la teoría del electrón libre de los metales, y la única diferencia es que la masa del electrón se substituye por la masa efectiva en todos los procesos. La distancia OA de la curva de e en función de k, de la figura 8.6, se ha exagerado para facilitar la comprensión; pero en la mayoría de los casos que se presentan en la práctica es mucho más pequeña. Para una banda que contiene un número relativamente pequeño de electrones, la corriente obtenida cuando se aplica un voltaje pequeño está dada por (85-3) sumada sobre todos los electrones de la banda. Sin embargo, si la banda está casi llena y se tienen sólo unos cuantos estados vacíos (que en el estado de equilibrio se concentran cerca de la parte superior de la banda), 5 la ecuación de la corriente (8.5-3) se expresa mejor escribiéndola en la forma (8.5-4) En este caso, la suma sobre i representa la adición sobre todos los estados de velocidad ocupados por los electrones, la suma sobre ¡ representa la adición sobre todos los estados de velocidad dentro de la banda y la suma sobre k representa la adición sobre todos los estados de velocidad desocupados. Como se vio antes en relación con (8.5-3), la suma sobre j, tomada sobre todos los estados de la banda, debe desaparecer. La suma restante sobre los estados desocupados corresponde a una corriente que podría producirse por un número correspondiente de portadores de carga posztivos. Se puede (y es conveniente, como se verá más tarde) expresar la corriente de una banda casi llena, como derivada del movimiento de un número comparativamente pequeño de estados electrónicos vacíos o huecos, que se comportan corno partículas positivas, más que mediante un gran número de electrones. La velocidad asociada con un hueco es la que tendría un electrón si ocupara un estado de energía vacío que normalmente se encuentra en la parte superior de la banda de energía. Sin embargo, puesto que la relación de e en función de k es cóncava hacia abajo, d 2 ejdk 2 es negativa y da una masa electrónica efectiva negativa a partir de (8.4-8). Una partícula con masa efectiva negativa experimenta una aceleración en una dirección opuesta a la de la fuerza aplicada. Una partícula negativa con una masa efectiva negativa entonces se acelerará en la misma dirección que el campo aplicado y presentará el mismo comportamiento dinámico que una partícula positiva de masa positiva. Por tanto, la situación de una banda casi llena se puede considerar como un caso en que se abarca un número relativamente pequeño de partículas positivas de masa positiva, que se designará como huecos, cuyas velocidades y cantidades de movimiento corresponden a los estados electrónicos desocupados dentro de la banda. En un capítulo posterior se verá que en ciertos materiales, la naturaleza física y el comportamiento dinámico de los huecos se comprenden con más facilidad relacionándolos con los defectos en los enlaces electrónicos de valencia que unen a los átomos más cercanos y proporcionan las fuerzas de cohesión que mantienen unido al cristal. S En una banda parcialmente vacía, los electrones ocupan los estados de energía más bajos disponibles en ausencia de una excitación térmica. Esto es aplicable también a la banda casi llena, en donde el resultado es que los estado vados se localizan en la parte superior de la banda. Por tanto, en una banda casi completamente llena, los estado~ vacíos '·gravitan" ascendentemente en un diagrama como el de la figura 8.5, en el que la ordenada representa la ener~ía de un electrón. 248 Teoría cuántica de los electrones en redes periódicas No se analizará detalladamente el comportamiento de los electrones y los huecos bajo la influencia de la fuerza magnética; pero se puede demostrar6 que se mueven como lo harían partículas negativas o positivas de masa efectiva m*, según lo que establece (8.4-8), bajo la influencia de la fuerza magnética normal q(v x B)/c. 8.6 LA APROXIMACION DEL ELECTRON LIBRE En las secciones anteriores se vio cómo un modelo particular de potencial periódico (que se ilustra en la figura 8.2) condujo a la formación de bandas de energía permisibles y a una relar;ión de e en función de k de la forma que aparece en la figura 8.4. La forma de esta relación fue tal que la cantidad hk se podí::. considerar ventajosamente como una "cantidad de movimiento del cristal" en cuyos términos se podía explicar de un modo sencillo la dinámica de los electrones en los campos de fuerza aplicados. La representación resultante del comportamiento electrónico fue muy similar al del electrón libre del capítulo 7, excepto que la masa del electrón libre se substituía por una masa efectiva y que los portadores de carga en una banda casi llena tenían que considerarse como huecos positivos. Se dio énfasis al hecho de que estas conclusiones cualitativas son independientes de la forma precisa de la función de potencial, siempre y cuando sea periódico; se adoptó la función de potencial de la figura 8.2 sólo con fines ilustrativos, ya que permitía una solución exacta de la ecuación de Schrodinger. En cristales reales, la función de potencial que se utiliza debe estar relacionada de .algún modo con el potencial real experimentado por un electrón, debido a los núcleos iónicos y a todos los demás electrones del cristal. Una solución exacta de este problema, incluso en la aproximación de un sólo electrón, sería imposible de lograr, por tanto, se acostumbra a plantear el problema desde el punto de vista de la aproximación del electrón libre o la aproximación de enlace firme, cualquiera que sea el más apropiado para la situación particular de que se trate. En la aproximación del electrón libre, se supone que la energía total del electrón es siempre grande en comparación con la energía potencial periódica. En estas condiciones, las bandas permisibles serán anchas y las regiones de energía prohibida muy angostas. Estas circunstancias nunca se realizan a la perfección en cristales reales, dado que el potencial va siempre a - oo en los núcleos iónicos; pero para los electrones más externos de muchos metales simples, incluyendo los alcalinos, los requisitos se satisfacen aceptablemente en casi todo el volumen del cristal. Si se adopta un modelo de potencial cristalino unidimensional para una mayor facilidad, y el potencial periódico V(x) se escribe en la forma (8.6-1) en donde f(x) tiene la periodicidad de la red, la ecuación de Schrodinger (8.3-1) se puede escribir como sigue d 2 ~ +(k~+ yf(x))rf¡(x) =O. (8.6-2) dx 6 R. A. Smith, Wave Mechanics o[ Crystalline Solids, John Wiley and Sons, Nueva York (1961, página 458) La aproximación del electrón libre 249 en donde k 0 está relacionada con la energía total e por medio de (8.6-3) Puesto que f(x) es periódica, se puede expresar como una serie de Fourier de la forma 00 ¿ c.e-2"i•xta f<x>= (8.6-4) n=- oo siendo c.= ~fa f(x)e2"inx/a dx, a o (8.6-5) en donde a es la constante de red del cristal. De acuerdo con (8.6-1), es evidente que los coeficientes Cn se relacionan con los coeficientes de expansión de Fourier del potencial periódico propiamente dicho a través de (8.6-6) en donde Vn se relaciona con los coeficientes de expansión de Fourier de V(x). Puesto que las funciones de onda deben tener la forma de Bloch eikxuk(x), y, dado que uk(x) debe ser una función periódica con un periodo a, expresable como una serie de Fourier, se puede escribir uk<x> = 00 ¿ b.e-2"i•x/a (8.6-7) n=- oo tf¡(x) = eikxuk(x) = eikx ¿ b.e-2ninx/a. • (8.6-8) Para electrones perfectamente libres, -y= O y las soluciones se convierten en funciones ondulatorias de partícula libre de la forma (8.6-9) En este límite uk(x) ~ b 0 y k~ k 0 , de tal modo que en el caso general, se debe esperar que todos los valores de bn, excepto b 0 , se acerquen a cero conforme -y tiende a cero. En consecuencia, se puede escribir una expresión aproximada para la función de onda de la forma (8.6-10) que puede esperarse sea válida para valores pequeños de -y (es decir, para las condiciones delineadas antes y de acuerdo con las cuales la aproximación del electrón libre es válida). Es fácil ver que esta función de onda tiene la forma de Bloch, en donde uk está dada por uk<x> = bo +Y¿ b.e-2"i•xla. ... o (8.6-11) 250 Teoría cuántica de los electrones en redes periódicas Al substituir (8.6-10) en la ecuación de Schrodinger (8.6-2), se obtiene L bo(k~ - k 2 )eik:J: + y [(k~ - k~)b,. + b0 c,.]eik"x .... o (8.6-12) en donde k =k_ 2nn n (8.6-13) a Puesto que el interés reside en la solución dentro del límite en donde 'Y-+ O, como primera aproximación se puede hacer caso omiso del término -y 2 de ( 8.6-12); entonces, multiplicando la ecuación completa por e-ikmx, integrando sobre la célula unitaria desde x = O hasta x = a, se tiene que b 0 (k~ - k 2 ) fa e2"imx/a dx + y L {[(k~ - k~)b,. + boc,.] o .... o X fa é"i(m-n)x/a Jo dx} =O. (8.6-14) Si m = O, la segunda integral desaparece para todos los valores de n en la suma, por lo cual or (8.6-15) mientras que si m =1= O, la primera integral se desvanece y la segunda da cero, excepto cuando n = m, en cuyo caso se obtiene o bien, (8.6-16) Entonces, a este orden de aproximación, de acuerdo con (8.6-15) y (8.6-3), la relación entre e y k es la misma que la de una partícula libre. La función de onda se obtiene substituyendo los valores (8.6-16) en lugar de bn en (8.6-10), de donde. (8.6-17) De acuerdo con (8.6-15) la corrección de primer orden para la energía de partícula libre que se origina desde el potencial periódico es cero. La corrección de energía de segundo orden se puede obtener reteniendo el término 'Y2 en (8.6-12). Al multiplicar (8.6-12) por e-ikx e integrando desde x =O a x =a, se obtiene (8.6-18) La aproximación del electrón libre 251 La primera integral anterior es cero para todos los valores permisibles de n, en tanto que la segunda integral es cero a menos que n =- n'. Por tanto, la ecuación se reduce a (8.6-19) Si f(x) está dada como una serie de Fourier por medio de (8.6-4), entonces, al substituir n por - n, f(x) = 00 :¿ c_"e2ttinxta, (8.6-20) n=- oo en tanto que, tomando el conjugado complejo de ambos lados de (8.6-4) y observando que puesto que f(x) es una función real, .f'(x) = f(x) se puede escribir también 00 f<x> = :¿ c:e2ninxta. (8.6-21) n=-oo Puesto que los coeficientes de Fourier asociados con la representación de una función dada son únicos, se debe tener (8.6-22) Usando la expresión de la primera aproximación (8.6-16) para los coeficientes bn y la relación (8.6-22), la expresión (8.6-19) se puede escribir en la forma (8.6-23) Si se usa (8.6-3) y (8.6-6) para expresar este resultado en función de e y Vn, se puede demostrar fácilmente que (8.6-24) Estas soluciones son satisfactorias sólo a condición de que k 2 no se acerque a uno de los valores k~. Si k 2 ~k~ para algún valor de n, una de las cantidades k 2 - k~ de los denominadores de los términos de suma de (8.6-17) tenderán a cero y dicho término seguirá siendo muy grande a pesar de que r sea muy pequeño. En este caso, la expresión supuesta (8.6-1 O) no es una buena aproximación para la función de onda y se debe emplear otra forma. Entonces, si k 2 ~k~, 2nn k = ± kn = ±k :¡: - . a (8.6-25) 252 Teoría cuántica de los electrones en redes periódicas Para el signo superior, esta ecuación da n =O, que se excluye de (8.6-17) en cualquier caso y, por ende, no tiene ningún interés particular. Para el signo inferior se obtiene k= mt (8.6-26) a que, puesto que n puede tomar valores positivos y negativos, se refiere a todos los puntos de borde de la banda. Será necesario utilizar un planteamiento por separado para valores de k en las cercanías de estos puntos. Supóngase ahora que k~ mrfa, de donde kn =k- (2rrnfa) ~- nrrfa. Por tanto, k~~ k 2 y bn será muy grande de tal modo que en (8.6-17) la cantidad rbn ya no será pequeña aunque r sea pequeña. En este caso se puede escribir la función de onda aproximadamente como (8.6-27) considerando que los otros términos de la suma de (8.6-17) son despreciables en comparación con el nésimo. Puesto que kn = - k en el borde de la banda, esta función de onda (8.6-27) es una superposición de una onda que se propaga a lo largo del eje positivo x y otra que se propaga en dirección opuesta; por tanto, tiene el carácter de una onda estacionaria. Esta situación física concuerda con el punto de vista de que la función de onda del electrón sufre una reflexión de Bragg en k = ± mrfa. Si la función de onda (8.6-27) se substituye en la ecuación de Schrodinger (8.6-2), utilizando (8.64), se obtiene Al multiplicar (8.6-28) por e-ikx y al integrar desde x =O hasta x =a, se puede ver fácilmente que los términos segundo y tercero no contribuyen con nada y que se obtiene una contribución del cuarto término sólo cuando n' = - n; el resultado final de esta operación es, entonces, · De igual manera, al multiplicar (8.6-28) por e-•k"x = e do como antes, se puede demostrar que "")x -i(k- 2 a e integran· Las dos ecuaciones anteriores se p01eden considerar como un conjunto de ecuaciones homogéneas que determinan a b 0 y bn. Como tales, las soluciones diferentes a bo = bn =O existen sólo si desaparece el determinante del sistema, es decir, sólo si 1 1 k o2 - k2 c. y 2 c.* 1- 2 2 2 2 2 * k2 _ k2 - (ko - k )(k 0 -k.)- y c. c.= O. O n (8.6-31) La aproximación del electrón libre 253 Esta ecuación es cuadrática en k~ y se puede resolver en la forma acostumbrada para dar (8.6-32) que, utilizando {8.6-3), (8.6-16) y {8.6-13), se puede expresar como sigue 2 2nn) ± s(k) = 4ñm [ k 2 + ( k - --¡;- 2 J( ( --¡;-2nn) k2 - k- 2 2 ) + (4miY.I) -¡;r ] . 2 (8.6-33) En el borde de la banda k = k 71 = mrfa, y, en estos puntos, (8.6-33) se reduce a (8.6-34) en donde Bn =~ (~) 2 2m a (8.6-35) representa la energía de partícula libre asociada con los puntos de borde de la banda. De acuerdo con los resultados de la sección 8.3, se sabe que en los puntos de borde de la banda k=± mrfa, se produce una reflexión interna de Bragg que va acompañada de una discontinuidad o "vacío de energía" en la curva de e en función de k. 7 De acuerdo con esto, debe interpretarse que la ecuación (8.6-34) implica un vacío de energía o banda prohibida con una anchura 21Vn l, en donde Vn es el nésimo coeficiente de Fourier en la expansión de serie de Fourier del potencial reticular periódico. Para valores de k de una magnitud mayor que mr/a se debe esperar que e(k) sea mayor que el valor dado por (8.6-34) y que se acerque al valor del electrón libre predicho por (8.6-15), en donde k 2 difiere de k~ en una cantidad que puede hacer que 'Yhn sea lo suficientemente pequeña de tal modo que el método que conduce a las ecuaciones (8.6-1'6) y (8.6-24) sea legítimo. De igual manera, para valores de k con una magnitud menor que mrfa, se puede esperar que e(k) sea menor que el valor dado por (8.6-34) y que nuevamente se acerque a soluciones antes obtenidas, cuando k 2 difería de k~ por una cantidad suficiente. Estas condiciones quedarán satisfechas si en (8.6-33) se escoge el signo más para k> mr/a y el signo menos para k< mrfa. La solución (8.6-15) o la segunda aproximación (8.6-24), que es mejor, en las regiones entre los bordes de banda, junto con la solución (8.6-33) para las regiones cercanas a los bordes de banda (los signos se seleccionan como se describió antes) conducen a una relación entre e y k como la que se ilustra en la figura 8.7. De acuerdo con esta figura, parece ser que las curvas de e en función de k son aproximadamente parabólicas cerca de los puntos de borde de la banda. La masa efectiva se puede establecer a partir de (8.4-8) mediante la derivación directa de (8.6-33). Estos cálculos son muy elaborados y es más fácil proceder haciendo que nn k=-+k', a (8.6-36) 7 El hecho de que la velocidad de grupo del electrón, en efecto es cero en estos puntos como es de esperarse para las ondas estacionarias que se asocian siempre con la reflexión de Bragg, se puede demostrar a partir de (8.6-33); los detalles de esta corroboración se les asignan como ejercicio al lector. 254 Teoría cuántica de los electrones en redes periódicas c(k) .,. -.,. o Figura 8.7. o Representación esquemática de la relación € en función de k para la aproximación del electrón libre, tal y como se obtiene a partir de (8.6-24) y (8.6-33) en donde k' es pequeña en comparación con rr/a, en (8.6-33). Thspués de efectuar algunas operaciones algebraicas, (8.6-36) se puede escribir en la forma 1i 2 e( k) = 2m [(mt) 2+ k'2 + hl mAe ~(n1t)2( 1i 2 )2] \) + 4k'\-;; mAe -;; 1 (8.6-37) en donde Ae = 21V.I (8.6-38) representa la anchura de la región de energía prohibida en k= nrr/a. Para puntos cercanos al fondo de la banda superior, k' es muy pequeña y el radical de (8.6-37) se puede expandir mediante el teorema del binomio que da, aproximadamente, 1 4e) li 2 k' 2 ( e(k) = e. +- Ae + - - 1 + A n ' 2 2m Lle, (8.6-39) en donde En está dada por (8.6-35). Después de derivar dos veces y usar (8.4-8), es evidente que li 2 li 2 m m* = d 2efdk 2 = d 2efdk' 2 = 1 + 4e. · (8.6-40) Ae Se puede demostrar de una manera similar que la masa efectiva para huecos crrcanos a la parte superior de la banda inferior, es la misma que el valor de los ele e trone~ dado por ( R.6-40). La aproxifTIIlción del enlace firme 8.7 255 LA APROXIMACION DEL ENLACE FIRME En la aproximación del electrón libre, la energía potencial del electrón se supuso pequeña en comparacwn con su energía total. Esto condujo a un planteamiento aproximado en el que se encontraron bandas de energía prohibidas y permitidas, y en donde la anchura de las bandas prohibidas era pequeña en comparación con la de las bandas permitidas en el límite en el que se satisfacía la suposición inicial. La aproximación del enlace firme parte de un punto de vista contrario, esto es, que la energía potencial del electrón representa casi toda la energía; en este caso, las bandas de energía permitidas son angostas en comparación con las bandas prohibidas. En el modelo del electrón libre se supone que los átomos del cristal están tan cerca unos de otros que las funciones de onda de los electrones de átomos circunvecinos se superponen en gran parte. Por tanto, existe una fuerte interacción entre los átomos cercanos, y los estados de energía permisibles del cristal resultante tienen muy poco parecido con las funciones de onda atómicas de los átomos individuales de los que se compone el cristal. Sin embargo, la aproximación de enlace firme se basa en la suposición de que los átomos del cristal están tan separados que la función de onda de los electrones asociados con átomos vecinos se superponen sólo en menor grado. La interacción entre átomos cercanos será relativamente débil en este caso, y las funciones de onda y los niveles de energía permisibles de todo el cristal estarán íntimamente relacionados con las funciones de onda y los niveles de energía de los átomos aislados. Por supuesto, la pregunta de cuál de las dos aproximaciones es correcta para una situación dada, depende del material particular de que se trate. En algunas substancias, la aproximación del electrón libre es muy apropiada, en tanto que en otras, la aproximación del enlace firme es mucho más correcta. Existen también cristales para los que ninguna de ellas es adecuada ya que se trata de una situación intermedia entre estos dos casos extremos. Las funciones de onda del cristal en la aproximación del enlace firme se basan en las funciones de onda de átomos aislados. Si la función de potencial relacionada con un átomo aislado es V0 (r), entonces la solución de la ecuación de Schródinger (8.7-1) representa las funciones de onda electrónicas del átomo. Supóngase que la función de onda de estado basal 1/1 0 no está degenerada y corresponde a una energía de estado basal e0 • Si un gran número de átomos de este tipo se combinan en una red periódica, de tal manera que el valor del potencial en las regiones que rodean a cada átomo individual en donde la función de onda de estado basal es grande, no se ve muy afectada por la presencia de los átomos vecinos, la función de onda del cristal (por lo menos para estos estados de enlace más firme) se puede escribir como una superposición lineal de funciones de onda atómicas de la forma t/J(r) = L: ant/JoCr - r"), (8.7-2) n en donde los vectores r y r n se relacionan tal y como se indica en la figura 8.8. La suma se toma sobre todos los átomos del cristal que, para mayor facilidad, se supondrá que tienen una extensión infinita. Puesto que todos los átomos del cristal son equivalentes, todos los coeficientes an deben tener el mismo valor absoluto; por tanto, deben poder expresarse en la forma aél>n, en donde a y cf>n son cantidades reales. Por la misma razón, la diferencia de fase cp entre cada par de átomos cerca- 256 Teoría cuántica de los electrones en redes periódicas • • p • o Figura 8.8. • • • • • • • • • • • Geometría vectorial usada en el cálculo de la sección 8.7. nos a lo largo de cualquier eje cristalino dado, debe ser la misma (aunque no necesariamente es idéntica a lo largo de los tres ejes). Esto conduce a la selección del factor de fase tPn = k • rn en donde k es un vector constante. Por último, si las funciones 1/1 0 están normalizadas de tal modo que su integral tomada sobre todo el espacio es la unidad y, si se desea conservar esta normalización, se debe tomar a= l. En consecuencia, (8.7-2) se debe escribir en la forma 8 t/lk(r) = L eik-r"t/1 0(r - rn)· (8.7-3) n Estas funciones de onda satisfacen la ecuación de Schrodinger para todo el cristal, con la función de potencial periódica de la figura 8.9, esto es, (8.7-4) El operador hamiltoniano total partes, :Yf se puede escribir como la suma de dos (8.7-5) Potencial 1 r = rn Figura 8.9. Funciones de potencial utilizadas en los cálculos de la sección 8.7. 8 Se puede demostrar que la ecuac10n (8.7-3) tiene la forma de una función de Bloch semejante a (8.2-14). Los detalles de esta comparación se asignan como ejercicio. 257 La aproximación del enlace firme siendo (8.7-6) y (8.7-7) De acuerdo con (8.7·1), es evidente que Jff ot/Jo = e0 ¡J; 0 , por lo cual, utilizando (8.7-3), J'f ot/lk = L eik '•Jff ot/lo(r- rn) =BoL eik '"t/lo(r- rn) = Bot/Jk· n (8.7-8) n Ahora, de acuerdo con (4.14-5), la energía e se puede encontrar determinando el valor esperado del operador hamiltoniano, de donde, usando (8. 7-5) y (8.7-8), f ft/lt L t/I:(Jffo + Jff')t/lk dv •~. ffN,ao ~•,+. . eikr"[V(r) -- V0 (J- rn)Jt/10(r- rn) dv f.•N.d• (8.7-9) A condición de que se haga caso omiso de la pequeña superposición de las funciones de ondas atómicas centradas en diferentes puntos de la red, las propiedades de normalización de las funciones t/Jo y la defmición (8.7-3) requieren que i t/Jkt/Jk dv sea igual a .V, es decir, el número de átomos dE'l cristal. Si se usa este hecho y se substituye el valor dado por (8.7-3) en lugar de t/Jk en el numerador de (8.7-9), se obtiene e= 60 + _!_ L \(L eik (r.-r,.) N n J t/JÓ(r- rm)[V(r)- V0(r- rn)]t/1 0(r- rn) dv}. (8.7-10) v m Se verá que, debido a la periodicidad del cristal y a causa de la suma sobre todos los valores de m, cada término de la suma sobre n da el mismo valor. El valor de la suma sobre 11, por tanto es el valor de cualquier término de la suma (por ejemplo, para mayor claridad, aquel para el que n = O) multiplicado por el número de términos de la suma, que es N En consecuencia, (8.7-10) se puede escribir como sigue e( k)= I e + Le- ik '"' vt/ló(r- r"')[V(r)- V0(r)]t/1 0(r) dv, 0 m (8.7-11) en donde la suma se toma sobre todos los átomos del cristal. Sin embargo, puesto que la función de onda t/1 0 desciende casi siempre de un modo muy rápido con respecto a la distancia y, puesto que las magnitudes de las integrales de (8.7-ll) están gobernadas esencialmente por la cantidad de superposición entre dos funciones de onda centradas en átomos separados por distancias r m, las contribuciom.s de los términos de la suma se reducen con gran rapidez conforme aumenta rm. Por tanto, generalmente se tiene como buena aproximación al considerar sólo los ténninos del vecino más cercano. De acuerdo con esto, se hará caso omiso de todos los térn;inos 258 Teoría cuántica de los electrones en redes periódicas que se relacionan con las contribuciones que van más allá de la del vecino más cercano en (8.7-11). También se supondrá que las funciones de onda 1/Jo son es[é· ricamente simétricas; en estas condiciones, todas las aportaciones del vecino más cercano serán idénticas. En consecuencia, este método se reduce al caso en el que la configuración electrónica de estado basal en el átomo aislado es la de un estado s como es, por ejemplo, para los metales alcalinos, aunque la extensión a los estados p es lo suficient~::mente directa y puede lograrse sin grandes problemas. 9 Para el caso m= O, la integral de (8.7-11) se convierte en J.l/ló(r)[V(r)- V0 (r)]if¡ 0 (r) dv = -oc, (8.7-12) mientras que, para los átomos más cercanos, (8.7-13) en donde rm es un vector que relaciona al átomo en el origen con el átomo vecino más cercano. Puesto que el cálculo real de las integrales de superposición es mu} complicado sólo se indicarán aquí los resultados en término de las cantidades que se definieron antes como -a: y - {3. En estas circunstancias, la ecuación (8.7-11) se puede escribir como sigue e(k) = Bo -oc- f3 L e-ik •m, (8.7-14) m en donde la suma sólo considera los átomos más cercanos. En ei caso de un cristal cúbico simple, las componentes del vector rm se pueden expresar como rm = (±a,O,O), (O,±a,O), (O,O,±a), (8.7-15) en donde a es la constante de red. La ecuación (8.7-14) da, entonces, e(k) = e0 -oc- 2{3(cos kxa + cos kya + cos kza). (8.7-16) De acuerdo con esta ecuación, es evidente que existe un rango de valores de energía permisibles correspondientes a varios valores que pueden tener kx, k y y kz. Los estados permisibles forman una banda de energía más o menos en la misma fom1a en que sucede con las que se vieron en relación con la aproximación del electrón libre. De acuerdo con (8.7-16), el valor mínimo de la energía está en kx =kv= kz =O en ese punto, es decir, en el origen de una gráfica con coordenadas ortogo· nales (kx, k y, kz) en el espacio k. Los valores máximos se producen en los vértices de un cubo dentro del espacio k cuyas coordenadas son ( ± ~. ± ~. ± ~). en don· a a a de todas las permutaciones de los signos 1- y -- entre las tres coordenadas se toman llon~. 9 Véa~e, por ejemplo, N 1· Mnlt y 11. Jones, Theory o[ Metals and Alloys, Dover PublicaNuev.1 York (1958), página 70. La aproximación del enlace firme 259 para generar ocho puntos de los vértices. En estos sitios cada término de coseno toma el valor - l. La diferencia de energía entre los puntos de energía máxima y mínima es, de acuerdo con (8.7-16), 12 (3. Esta es la anchura de la banda de energía correspondiente al estado s del átomo aislado. Si los átomos vecinos más cercanos están muy separados, la superposición de las funciones de onda 1/; 0 (r) y 1/; 0 (r- rm), como lo expresa el producto 1/; 0 (r)V; 0 (r- rm) en la integral (8.7-13), se hace muy pequeño como sucede con el valor de {j según lo establece dicha ecuación. En el límite donde las distancias atómicas se hacen grandes (y es en este límite en donde son realmente adecuadas las aproximaciones en las que se basan los cálculos de enlace firme), las bandas de energía permisible se hacen angostas acercándose a un solo valor de energía discreta, correspondiendo al nivel energético del estado atómico s conforme la separación se hace infinita. Esta variación de la anchura de banda con el espaciamiento atómico se ilustra esquemáticamente en la figura 8.1 O Niveles atómicos Bandas permitidas Distancia ES::>---------+- interatómica o " • Espaciamiento de equilibrio Figura 8.10. o: 00 Representación esquemática de la divhión de los niveles discretos de energía atómica en bandas, conforme los átomos aislados se combinan en una red cristalina. Para un electrón que se mueve en la dirección x, ky = kz =O. Si la cantidad de movimiento es lo suficientemente pequeña de tal manera que kx ~ rrfa, el electrón estará cerca de la base de la banda de energía. En estas condiciones, al aproximar el cos kxa en (8.7-16) mediante los dos primeros términos de su expansión de serie, (8.7-16) se convierte en (8.7-17) Esto muestra que la relación E en función de kx es parabólica y que, por tanto, el electrón se comporta básicamente como si fuera libre. Como siempre, la cantidad llkx se puede interpretar como la componente x de un vector de cantidad de movimiento del cristal p = llk. La masa efectiva está dada por (8.7-18) 260 Teoría cUIÍntica de los electrones en redes periódica De acuerdo con la simetría de la ecuación (8.7-16), es obvio que la masa efectiva asociada con el movimiento en las direcciones y y para todas las cantidades pequeñas de movimiento, será la misma que la que se dio en (8.7-18) y, por tanto, la masa efectiva es isotrópica o independiente de la dirección. No obstante, no siempre sucede así, sobre todo en cristales no cúbicos; la masa efectiva en este caso es anisotrópica con frecuencia, y debe considerarse como un tensor. Este punto se verá más detalladamente en la siguiente sección. De acuerdo con (8.7-18), parece que conforme aumenta la distancia reticular a, disminuye la masa efectiva; sin embargo, lo que sucede es exactamente lo contrario, ya que conforme aumenta a, la integral de superposición {3 disminuye con mucha mayor rapidez, de tal manera que el producto {3a 2 disminuye rápidamente al incrementarse las distancias reticulares. Por tanto, de acuerdo con (8.7-18), en el límite extremo del enlace firme, un electrón se hace muy "pesado", lo c~al constituye una expresión del hecho de que, en estas circunstancias, no se transfiere fácilmente de un átomo a otro. 8.8 DINAMICA DEL ELECTRON EN ESTRUCTURAS BIDIMENSIONALES Y TRIDIMENSIONALES; SUPERFICIES DE ENERGIA CONSTANTE Y ZONAS DE BRILLOUIN En esta sección se verá minuciosamente el comportamiento de los electrones en redes periódicas bidimensionales y tridimensionales, utilizando siempre que se p_ue_da el ejemplo del cálculo de la aproximación de enlace firme para la estructura cubica simple, como ilustración de los principios generales en cuestión. Es evidente. que las ecuaciones dinámicas de la sección 8.4 se pueden ex tender de un modo duecto a una situación bidimensional, en cuyo caso se obtiene (8.8-1) para la velocidad del electrón, en donde Vk se refiere al operador gradiente en el espacio ortogonal k cuyas coordenadas son (kx, ky, kz). Por tanto, se puede escribir (8.8-2) Si A es un vector cuyas componentes son las funciones de kx, ky y kz, cada componente A~ (o:= x, y, z) debe satisfacer la relación dA~= oA. dkx + iJAa '!_~ + iJA, dkz =(V kA). dk. dt okx dt oky dt okz dt ~ dt (8.8-3) El vector dA/dt, entonces puede expresarse, como el producto escalar del tensor10 Vk A y el vector dk/dt, de donde, dA dk - - = (VkA) • -dt dt ' (8.8-4) lO t·:n l'l ¡1péndice B ~r incluye una hreve de~cripción del análisis ten~orial que se requiere p.1ra l'ntrnder lo~ conccptm expucstm en este hhro. Dinámica del electrón, superficies de P-nergía y zonas de Brillouin 261 cada componente del producto tensorial anterior conduce a una ecuación de la forma (8.8-3). Al aplicar esta fórmula a (8.8-3), si se hace que k= p/h, se obtiene (8.8-5) Esta ecuación es básicamente la ecuación de fuerza de Newton dvg/dt = F/m*. Sin embargo, es obvio que la recíproca de la masa efectiva es un tensor de la forma (8.8-6) Los elementos de este tensor son, claramente, oe 2 li 2 okaokp' (8.8-7) lo cual demuestra que el tensor de masa efectiva recíproca es simétrico, es decir, que (1/m*)pa = (1/m*)afJ• (8.8-8) En general, se debe considerar que la masa efectiva es un tensor debido a que la curvatura de la relación e(k) no es necesariamente la misma a lo largo de todas las direcciones posibles dentro del espacio k; en consecuencia, es posible que se tenga una masa efectiva diferente para cada dirección posible. Para el cristal cúbico s1mple de la sección 8. 7, para valon:s ka ~ 1, la ecuación (8.7-16) se puede escribir en la forma (8.8-9) Esto permite ver que todos los elementos que están fuera de la diagonal del tensor de masa efectiva (8.8-7) son cero, y que cada uno de los elementos sobre la diagonal es igual a h2 /2{3t:z2, por lo cual el tensor se reduce a h2 /2{3a 2 por el tensor unitario [Da¡¡]. La masa efectiva es claramente isotrópica en estas circunstancias y puede representarse como la cantidad escalar h2 /2{32, lo cual concuerda con las conclusiones de la sección anterior. A continuación se investigará la forma de las superficies de energía constante en el espacio k, para la estructura cúbica simple que se vio en la aproximación de enlace firme en la sección anterior. La e~uación de estas superficies sencillamente es (8.7-16) en donde e(k) se considera como una constante paramétrica. En relación con (8.7-16) se mencionó que el valor mínimo de e se obtenía en el punto kx = ky = kz = O, en donde todos los términos de coseno alcanzan el valor de la unidad. Para valores de e ligeramente mayores que este mínimo, los cosenos deben estar cerca de la unidad y, por tanto, los argumentos kxa, kya y kza deben ser todos muy pequeños. En este caso, (8.7-16) se reduce a la forma antes indicada como (8.8-9), que se puede reacomodar ligeramente para dar e(k) e0 - oc - 6/3 2 2 2 kx + k, +k. = f3a 2 {3a 2 = consl. (8J~-10) 262 Teoría cutintica de los electrones en redes periódicas Evidentemente, esta es la ecuación de una esfera dentro del espacio k. La forma esférica de todas las superficies de energía constante revela que los electrones de esta región del espacio k se comportan como electrones libres; se observará en (5.2-18) que, para partículas libres, es esférica la superficie de energía constante en el espacio de la cantidad de movimiento. Conforme aumenta el valor de e, el radio de la superficie esférica de energía constante también aumenta hasta que los valores de k asociados con los puntos sobre la superficie se hacen tan grandes que la aproximación ka < 1 ya no sigue siendo válida. En este caso, se debe usar la ecuación más general (8.7-16) para graficar las superficies de energía constante y, conforme aumenta e, las superficies que se obtienen son como se ilustra en la figura 8.11(a-f). Al incrementarse e, la esfera se expande, se distorsiona un poco, como sucede en (b) y en e= e 1 + 413 (en donde e 1 es el valor de e en el punto mínimo o e0 -a- 613) adquiere una furma casi octohédrica como la que se presenta en (e). En este punto, la superficie de energía toca el cubo limitante, cuyo lado es 2rr/a, sobre el cual se hablará más tarde. Conforme e aumenta más todavía, la superficie adquiere la forma que se ilustra en (d), y cuando e= e 1 + 813 adquiere la forma que aparece en (e). En este punto la superficie se divide en ocho hojas. cada una de las cuales se acerca al vértice del cubo conforme e tiende a su valor máximo para la banda e1 + 12/3. Estas ocho ramas tienen una forma aproximada de octantes de una esfera en el límite en que e se acerca a su valor máximo. La superficie de energía constante tiene siempre una simetría cúbica en este ejemplo. Las intersecciones de la superficie de energía constante con el plano kxky se ilustran en la figura 8.12. Se puede considerar también que estas curvas son las de energía constante correspondientes a un cristal bidimensional con una red cuadrada cuyo espaciamiento interatómico es a. De acuerdo con (8.7-16), es evidente que todos los estados dentro de la banda deben tener una energía entre e 1 y e 1 + 12/3, y que todos los estados posibles dentro de este rango de energía están representados por los valores de (kx, ky, kz) 1t) 1t 1t que quedan dentro de los límites ( ± -, ± -, ±- . a a a Si se tiene un número dado de electrones que pertenecen a esta banda de energía y si la temperatura está en el cero absoluto, los estados electrónicos de energía estarán todos ocupados hasta una energía de Fermi dada, de acuerdo con el principio de exclusión de Pauli. Por tanto, la distribución de electrones quedará dentro de un volumen en el espacio k que está limitado por una superficie de energía constante y en donde el valor de la energía sobre la superficie es la energía de Fermi e1. Con frecuencia, esta superficie se denomina superficie de Fermi. De acuerdo con la exposición de la sección 5.5, se vio que la superficie de Fermi para electrones libres es una esfera. Para electrones que están dentro de un potencial periódico de un cristal, la superficie de Fermi puede ser también aproximadamente esférica si la banda está casi vacía o casi llena; este hecho se ilustra claramente en la figura 8.11(a) y (f) para el ejemplo que acaba de verse en detalle. A temperaturas que sobrepasan al cero absoluto, algunos de los electrones se excitarán a estados de energía superiores a e1 , quedando fuera de la superficie de Fermi, y se tendrán algunos estados desocupados dentro de esta superficie. En consecuencia, la transición entre los estados llenos y vacíos ya no será muy marcada. No obstante, si la temperatura es pequeña en comparación con la de Fermi, la región de transición será muy delgada y la validez esencial del cuadro de la superficie de Fermi no se verá afectada. A continuación se examinará lo que sucede en les puntos de la superficie del cubo limitante que encierra al volumen del espacio k, que pueden ocupar los estados electrónicos pertenecientes a esta banda. Para mayor simplicidad, primero se limitará la atención solamente al plano kxky; las soluciones de este plano se relacionan con Dinámica del electrón, superficies de energía y zona de Brillouin (o) (ko«l) 263 (b) (•«1+4/3) (e) (• =• 1+4/3) (e) (• =•1+8/3) Figura 8.11. (f) (•1+8/3« «1+12t:l) Configuraciones sucesiva; de la superficie de Fermi para un cristal cúbico simple con funciones de onda e'féricamente simétrica' en la aproximación en donde sólo se toman en cuenta las interacciones del vcl in o má~ cercano. Al aumentar la población electrónica en la banda, elevando con ello, el nivel de Fermi desde la base de la banda ha~ta la parte superior de la misma, la superficie de Fermi pasa de la forma casi esférica que aparece en (a), atravesando las formas intermedias compleja~ (b)-(e), hasta llegar a la configuración cubo menos esfera en la zona de Brillouin ca'i llena ilustrada en (f). una red cristalina cuadrada bidimensional. Sea un punto en el borde superior (o inferior) de la región cuadrada que se ilustra en la figura 8.12; la coordenada ky de este punto es rrfa, en tanto que la coordenada kx puede tener cualquier valor arbitrario, por ejemplo, kxo· Entonces, la longitud de onda A. del electrón estará dada por (8.8-11) 264 Teoría cuántica de los electrones en redes periódicas en tanto que el seno del ángulo incidente e relacionado con un conjunto de planos cristalinos paralelos al eje x, es sen e= ky Jk~ +k; = nfa . Jk2 n2 .xO (8.8-12) + a2 De acuerdo con esto, es obvio que la condición de Bragg (2.1-1) con n = 1, se satisface mediante la función de onda electrónica en todos los puntos en esta parte de la frontera. Del mismo modo, es fácil verificar que la condición de Bragg (relacionada ahora con un ángulo incidente que se indica como un conjunto equivalente de planos paralelos al eje y), se satisface en todos los puntos del borde derecho (o izquierdo) del cuadrado limit.mte. El electrón, considerado como una onda, se difracta internamente mediante la red, siempre que su vector de cantidad de movimiento toque esta frontera cuadrada. Los puntos del espacio k que quedan más allá de los límites de estas fronteras corresponden a los puntos que están fuera de la banda de energía más baja, perteneciendo a otras bandas que se originan en estados atómicos de energía más alta que el estado basal. Los límites de las regiones del espacio k ocupadas por las bandas más altas, se determinan mediante la orientación de las fronteras a lo largo de las cuales se pueden producir reflexiones de Bragg (n > 1) de orden más alto. Siempre existe un vacío de energía entre las bandas, como se ilustra en la figura 8.10; por ejemplo, siempre que se cruza el borde de la región cuadrada encerrada por las líneas kx = ± rr/a, ky = ± rr/a, debe ocurrir una discontinuidad de energía acompañada de una reflexión interna de Bragg. El interior de la región contiene la totalidad de estados pertenecientes a la banda de energía más baja. Se observará que el vector k tiene las mismas dimensiones que la red recíproca. En la sección 2.6 se demostró que la condición de reflexión de Bragg puede escribirse como (8.8-13) en donde k es el vector de propagación y en donde G/2rr es un vector que va desde el origen hasta cualquier punto de la red recíproca. Para una red cuadrada bidimensional de puntos cuyo espaciamiento reticular es a, la red recíproca es una red cuadrada con un espaciamiento reticular 1/a. Si para mayor facilidad se considera que el origen está en un punto de red, los vectores G tienen la forma 2n • G,.. = -(¡,u" + viy. ) a (8.8-14) en donde ¡.¡. y v son enteros y en donde ix e iy son vectores unitarios en las direcciones kx y k y, respectivamente. Si se usa esta forma para el vector G, (8.8-13) se convierte en 1t ¡.¡.k" + vk, = -- (¡.¡. a 2 + v2 ). (8.8-15) Esta ecuación representa una familia de líneas rectas en el plano kxky. Sus intersecciones kx y ky son .. np.z+v2 k" mtcrseccwnes: - -- - - a fJ. (8.8-16) ky intersecciones: a v Diruímica del electrón, superficies de energía y zona de Brillouin 265 Cada una de estas líneas representa una frontera a lo largo de la cual se produce una reflexión de Bragg y que puede formar la frontera entre estados pertenecientes a diferentes bandas de energía. Si se toma 11 = O, v = ± 1, y 11 = ± 1, v = O en (8.8-15), se obtienen las cuatro líneas kx = ± rr/a y ky = ± rr/a que encierran la región ilustrada en la figura 8.12, cuyo interior contiene todos los estados de la Figura 8.12. Contornos de energía constante dentro de la zona de Brillouin, para una red cuadrada bidimensional, usando sólo funciones de onda esféricamente simétricas y las interacciones del vecino más cercano. Se forma el mismo patrón mediante los trazos de la superficies de Fermi de la figura 8.11 para la red tridimensional sobre el plano kxky. banda de energía más baja del cristal. Esta reg10n del espacio k se denomina la primera zona de Brillouin (esta terminología ya se introdujo en relación con los cálculos unidimensionales que se vieron en la sección 3.3). Si ahora se considera J1 = ± 1, v = ± 1, se obtienen las cuatro líneas kx ±ky = 2rr/a y kx ± ky = - 2rrfa. Estas cuatro líneas aparecen grafícadas en la figura 8.13(a). En estas fronteras, la condición de Bragg (2.1-1) se satisface con el orden de reflexión n, que es igual a 2. Esto se puede demostrar a través de los mismos métodos que se emplearon antes en conexión con las fronteras de la primera zona de Brillouin. La región encerrada entre la primera zona de Brillouin y estas cuatro líneas intersectoras contiene todos los estados correspondientes a la segunda banda de energía (que se relacionaría con el segundo nivel atómico de energía más baja si la aproximación del enlace firme fuera válida). Esta se conoce como la segunda zona de Brillouin, que tiene la misma área que la primera y, en efecto, las cuatro secciones independientes de esta zona se pueden trasladar al interior de la primera moviendo las secciones paralelas a los ejes en distancias que sean enteros múltiples de 2rr/a. Por tanto, las cuatro secciones encajan como piezas de un rompecabezas para formar una región cuadrada que es una réplica exacta de la primera zona, como lo ilustran las líneas punteadas de la figura 8.13{a). La última representación de la segunda zona es, sencillamente, la 266 Teoria cuántica de los electrones en redes periódicas Ir, c:_--:_1 Pnmera zona [~' Segunda zona r::-l Tercera zona _j ~] Cuarta zona Quinta zona • o (e) Figura 8.13. Construcción de las zonas de Brillouin para una red cuadrada bidimensional (a) Primera y segunda zona~, (b) construcción de la tercera zona, (e) las primeras cinco zonas. representación de zona reducida de la secc1on 8.5. La justificación de una transformación de este tipo con referencia al modelo de Kronig-Penney ya se vio en esa misma sección. Expresado con más precisión, si (8.8-17) es una función de onda del sistema que satisface las ecuaciones de Schrodinger y todas las condiciones de frontera pertinentes, y si se define . ('2n_,;rr) k , -_k_ lx - a . (2nyn) - lz. (211zí' C) -- ' ly - - a a (8.8-18) Dinámica del electrón, superficies de energía y zona de Brillouin 267 en donde ix, iy e iz son vectores unitarios a lo largo de las direcciones kx, k y, kz y en donde nx, ny, nz son enteros, la misma función de onda se puede expresar como = eik' •v(r), (8.8-19) en donde v(r) es nuevamente una función periódica que tiene la periodicidad de la red. De donde la función de onda se puede escribir en la forma de Bloch en términos de k o el vector de onda transformado k'. Se debe observar que (8.8-18) se puede escribir también como k'= k- G (8.8-20) en donde G/2n es un vector que conecta dos puntos reticulares de la red recíproca.11 La transformación (8.8-18) o (8.8-20) puede usarse siempre para llegar a una representación de zona reducida en la que la zona transformada ocupa la misma región del espacio k que la primera zona. La situación es muy similar a la que se encontró en la sección 3.3 en el caso de las vibraciones mecánicas de una cadena lineal de masas discretas puntuales y que se vio en relación con la figura 3.8. Las zonas más altas se pueden construir mediante una ampliación del procedimiento usado para llegar a la forma de la primera y segunda zonas. En (8.8-15), si se toma 11 = O, v = ± 2 ó 11 = ± 2, v = O, se obtienen las cuatro líneas kx = ± 2n/a, ky = ± 2n/a, como se indica en la figura 8.13(b). También en este caso es evidente que la reflexión de Bragg se desarrolla a lo largo de estas líneas y la primera reacción es asignar todos los espacios que quedan fuera de la segunda zona y dentro del área encerrada por estas cuatro líneas, a la tercera zona de Brillouin. Sin embargo, esto no es correcto, ya que esta área es mucho mayor que la de la primera y segunda zonas, y cada zona de Brillouin debe encerrar la misma superficie dentro del espacio k. En realidad, existen líneas de reflexión adicionales de Bragg que pasan por esta superficie y forman fronteras que dividen este espacio en las zonas tercera, cuarta, quinta y sexta. El criterio que se sigue para saber de qué zona se trata es el siguiente: al desplazarse a lo largo de una línea radial general que no atraviesa ninguna intersección de las líneas de reflexión de Bragg, principiando desde el origen, se debe pasar por la primera, la segunda, la tercera, la cuarta, • • • etc., zonas sucesivamente, y cada línea de reflexión de Bragg que se cruce forma la frontera a lo largo de la trayectoria radial entre una zona y la siguiente zona vecina más alta. En consecuencia, al seguir adelante desde el origen por la línea OA, se penetra en la tercera zona en C y se sale de ella en D, con la siguiente línea de reflexión de Bragg que intersecta a OA, más allá de D, se penetra en la cuarta zona. No obstante, si se desplaza a lo largo de la línea OB, se entra a la tercera zona en E y se sale de ella en F, que se queda· sobre la línea kx = n/a que es ahora la tercera línea de reflexión de Bragg desde el origen, a lo largo de la trayectoria OB. Más allá de F, por la línea OB queda una parte de la cuarta zona. De donde, la tercera zona se compone de los ocho triángulos que se ilustran en la figura 8.13(b). Nuevamente es obvio que estos ocho triángulos se pueden ensamblar de tal modo que formen un cuadrado dentro de la primera zona, si se someten a una traslación apropiada de acuerdo con (8.8-18). Las fronteras de la cuarta zona se forman, en parte, por las 11 En efecto, la expresión (8.8-20) es en realidad la definición fundamental de esta transformación, mientras que (8.8-18) se refiere específicamente a una transformación de esta naturaleza en el caso particular de la red cúbica simple. 268 Teoría cuántica de los electrones en redes periódicas líneas para las que J.1 = ± 1, v = ± 2, y J.1 = ± 2, v = ± 1 (en donde se toman todas las permutaciones posibles de los signos más y menos). Se obtiene una familia de ocho líneas (tales como kx ± 2kx =- Srr/a), que conduce a las fronteras de las zonas cuarta y quinta, como se indica en la figura 8.13(c), por los procedimientos antes descritos. Evidentemente, este método de cálculo se puede extender ad infinitum para encontrar tantas zonas como se desee. Al construir las fronteras de las zonas de Brillouin, de este modo, generalmente conviene principiar con vectores G cuyas magnitudes (según se obtienen a partir de [8.8-14] o su equivalente en otra estructura cristalina) son tan pequeñas como sea posible, y luego procediendo al siguiente (a) (d) (e) Figura 8.14. Configuración de la primera zona de Brillouin para (a) una red cúbica simple, (b) una red cúbica centrada en el cuerpo, (e) una red cúbica centrada en la cara y (d) una red hexagonal. conjunto de vectores G más cortos, Juego a los siguientes más reducidos y así sucesivamente. Puesto que la condición de reflexión de Bragg implica la formación de ondas estacionarias a una incidencia normal, la velocidad de grupo y, por ende, el gradiente de e normal a la frontera de cualquier zona de Brillouin, debe desaparecer, es decir, (-aro) ak 1 = n · Vkw =- n · Vke =O .l a la frontera li (8.8-21) en la zona de frontera, si n es un vector unitario normal a la frontera. Se puede verificar esta conclusión general a partir de los resultados del modelo de potencial de Aisladores, semiconductores y metales 269 Kronig-Penney, la aproximación del electrón libre y la aproximación del enlace firme. Estos detalles quedan como ejercicio para el lector. La extensión de estos resultados para incluir redes tridimensionales es totalmente directa. Por supuesto, en este caso las zonas de Brillouin son regiones tridimensionales del espacio k encerradas por planos a lo largo de los cuales se satisface la condición de Bragg. Las ecuaciones de estas fronteras de plano se obtienen de la ecuación (8.8-13) al igual que sucedió en el caso bidimensional. Nuevamente cada zona tiene un volumen equivalente y las partes separadas de las zonas más altas se pueden juntar para formar una réplica de la primera zona, aplicando la transformación apropiada de (8.8-20). Es evidente que la primera zona de Brillouin para una red cúbica simple es un cubo cuyo lado es 2Tr/a. La forma de la primera zona de Brillouin para las redes cúbicas centrada en la cara y centrada en el cuerpo, así como para la estructura hexagonal, se ilustran en la figura 8.14. La zona para la red cúbica centrada en el cuerpo es un dodecaedro rómbico en el que todas las caras son planos { 11 O} dentro del espacio k. La zona para la red cúbica centrada en la cara es un tetradecaedro, un poliedro de 14 caras, que tienen una orientación {110} y { 111}. La superficie de Fermi debe tener, en todos los casos, las propiedades de simetría de la zona de Brillouin correspondiente que, a su vez, se relacionan con las propiedades de simetría de la red cristalina. 8.9 AISLADORES, SEMICONDUCTORES Y METALES En la seccwn 8.5 se demostró que no se puede obtener una corriente eléctrica en bandas vacías o bandas totalmente llenas. Por tanto, cualquier conductividad eléctrica que presente un cristal debido al movimiento de electrones libres, se debe al movimiento de electrones dentro de las bandas de energía que están sólo parcialmente llenas. Esta observación constituye la base de la diferencia entre los aisladores, los conductores metálicos y los semiconductores. En un aislador, el número de electrones dentro del cristal es apenas el suficiente para llenar completamente cierto número de bandas de energía. Sobre estas bandas de energía existe una serie de bandas totalmente llenas; pero entre las bandas llenas y vacías se encuentra una región de energía prohibida tan ancha que es prácticamente imposible, a temperaturas físicamente posibles, excitar térmicamente un número importante de electrones para que atraviesen esta región desde la parte superior de la banda llena más alta a la base de la banda vacía más baja. Entonces, todas las bandas están ya sea llenas o vacías y no puede fluir una corriente de electrones libres. Esta situación se ilustra en la figura 8.15(a). Si es muy pequeño el vacío de energía .1€ entre las bandas llenas y vacías en este tipo de cristal, y, por tanto, se tiene una probabilidad estadística apreciable de que los electrones puedan excitarse térmicamente de estados cercanos a la parte superior de la banda llena, para atravesar el vacío, hasta los estados cercanos a la base de la banda vacía. Se dispondrá de un número limitado de electrones libres para conducción de corrientes eléctricas en la banda superior casi vacía y, además, los estados electrónicos vacíos que quedan cerca de la parte superior de la banda más baja permiten que esta banda contribuya al flujo de corriente eléctrica a través del mecanismo de conducción por huecos. Un material de esta naturaleza se conoce como semiconductor; su conductividad eléctrica es casi siempre mucho menor que la de un metal debido a la concentración limitada de electrones libres y huecos y, además, depende enormemente de la temperatura, que aumenta con gran rapidez al incrementarse ésta, ya que la probabilidad de la excitación térmica se incrementa con la 270 Teoría cuántica de los electrones en redes periódicas temperatura. Por supuesto, la conductividad eléctrica de un semiconductor es también una función del vacío de energía ..::le- La diferencia entre los aisladores y los semiconductores es sólo de grado; todos los semiconductores pueden hacerse aisladores ideales conforme la temperatura se acerca al cero absoluto, debido a que entonces la probabilidad asociada con la excitación térmica se hace tan pequeña que tiende a desaparecer. Del mismo modo, a temperaturas lo suficientemente elevadas (que con frecuencia son imposibles de alcanzar en la práctica debido a que el cristal se funde o se evapora), todos los aisladores presentan propiedades semiconductoras. La estructura de las bandas de un semiconductor aparece ilustrada en la figura 8.15(b). Si el número de electrones de un cristal no base.! para llenar por completo la banda de energía más elevada, sino que la deja sólo llena en parte, muchos de ellos pueden comportarse como electrones libres y servir como carga o portadores de carga. En la figura 8.15(e) se ilustra esta situación. Un cristal de esta índole presentará todas las propiedades características de un conductor metálico, por ejemplo, alta conductividad eléctrica y térmica y una gran reflectividad óptica. Distribución de Fermi-Dirac Banda "vacía" 6• Banda "casi vacía" ---~-Banda superior superpuesta Electrones térmicamente excitados l- \-~------ ;_;= l Ban:~;~ ~:~~~:l=:_:nte llena ~~T ~~ ~j~&~~~ E d 1 • ~~ :wd~sta os e ectronico~ vacíos ~~y~~9~L );;:;: Banda inferior;; casi llena /; W(///~% W'ff~ w~lena/;/~ 2LL/.'///h ?/íllenaW 0gUenaW o (o) Aislador Figura 8.15. (bl Semiconductor (el Metal (Banda parcialmente llena) (d) Metal (Banda superpuesta) Diagrama de las bandas de energía de (a) un aislador, (b) un semiconductor, (e) un conductor metálico (banda parcialmente llena) y (d) un conductor metálico (bandas superpuestas). La determinación del número de estados electrónicos disponibles en una banda de energía dada de una substancia particular, no es un procedimiento del todo directo y, en general, implica el uso de técnicas de cálculo de la mecánica cuán tic a que están fuera del alcance de esta obra. Si se supusiera que siempre es válida la aproximación del enlace firme, las bandas de energía siempre se originarían de los niveles de energía de los átomos aislados, las funciones de onda de una banda dada se compondrían siempre de una combinación lineal de las funciones de onda del estado electrónico de energía correspondiente de los átomos aislados y el factor de degeneración, asociado con un nivel de energía dado en la banda de energía, sería el mismo que el del nivel correspondiente del átomo libre. De acuerdo con esto, se Aisladores, semiconductores y metales 271 tendría una banda ls ccrrespondiente al nivel ls, una banda 2s, una banda 2p, una banda 3s, una banda 3p, una banda 3d y así sucesivamente. De acuerdo con la ecuación (8.2-20), el número de niveles de cada banda sería N y, puesto que la degeneración de cada nivel es el mismo que el del nivel atómico correspondiente, el aúmero de estados cuánticos electrónicos (incluyendo la degeneración de espín) de cada banda sería el que se indica en la tabla 8.1. TABLA 8.1. Banda No. de estados Is 3p 2N 2N 6N 2N 6N 3d ION 2s 2p 3s Por ejemplo, ahora se verá un metal alcalino como el sodio. El sodio tiene dos electrones Is, dos electrones 2s, seis electrones 2p y un solo electrón 3s. En un cristal de N átomos se tienen, entonces, 2N electrones ls, 2N electrones 2s, 6N electrones 2p y N electrones 3s. Si se comparan estas cifras con las que se dan en la tabla 8.1, se llega a la conclusión de que las bandas ls, 2s y 2p, están totalmente llenas; pero que la banda 3s, que contiene 2N estados, sólo está llena a la mitad. Por tanto, se puede esperar que el sodio -junto con todos los demás metales alcalinos- sea un conductor metálico, como en efecto lo es. Por otro lado, si se acepta estríctamente este método, debe esperarse que el magnesio, cuya estructura atómica es Is 2 )2s 2 2p 6 )3s 2 , sea un aislador o semiconductor, ya que ahora la banda 3s está llena. El hecho de que el magnesio (y otros elementos alcalinotérreos) sean metales, se debe al hecho de que la energía de las bandas 3s y 3p se superpone y algunos de los electrones "se derraman" de la banda 3s a la 3p, dejando a la primera no del todo llena y haciendo que está última esté parcialmente ocupada, como se ilustra en la figura 8 lS(d). En realidad, las funciones de onda 3s y 3p de estas bandas se entremezclan intensamente, de modo que ni siquiera es del todo correcto referirse a las bandas en esta forma. A decir verdad, el método sencillo del enlace firme ya no es una buena aproximación que permita describir el comportamiento de los electrones s y p en la capa exterior de valencia de la mayoría de las substancias metálicas; esta mezcla de las bandas s y p para los electrones de valencia es más bien la regla que la excepción. Por ejemplo, en el caso del silicio, los estados 3s y 3p se combinan en dos bandas que no se superponen, en donde cada una de ellas contiene 4N estados, de tal manera que los electrones de valencia 4N ocupan por completo la banda inferior para fonnar la configuración de banda de un semiconductor como la de la figura 8.15(b). La superposición de bandas se produce a pesar de que existe un vacío de energía en todos los puntos en la frontera de la zona de Brillouin que separa las dos bandas. Usando la zona cuadrada de la figura 8.12 como ejemplo, se puede ver claramente cómo se presenta esta situación. La superficie de Fermi en esta figura toca primero la frontera de zona a lo largo de los ejes kx y ky a una energía E= e 1 + 4(3; pero la zona de Brillouin y la banda de energía correspondiente no ~stán completamente llenas hasta que e -- <: 1 + 8(3. Puede suceder que el vacío de energía entre esta banda y la siguiente, en la dirección de los ejes kx y k y, sea 272 Teoría cuántica de los electrones en redes periódicas menor que 4(3, que es la energía adicional requerida para llenar por completo la banda inferior. Si esto sucede, los electrones se derramarán hacia la banda superior en las direcciones kx y ky antes de que se llenen por completo los vértices de la zona original, dando como resultado la situación de superposición de bandas que se mencionó anteriormente. Esta situación se ilustra en la figura 8.16. Debe recalcarse ~(k) Esquinas no llenas Electrones que de la banda inferior llenan parcialmente (conducción por huecos) la sigUI en te zona superior Los electrones "se derraman" sobre la siguiente banda (conducción por electrones) Esquinas de la zona no llena (a) .,. a - - ~(k) Relación a lo largo de la trayectoria OA - - - <(k) Relación a lo largo de la trayectoria OB (b) Figura 8.16. (a) Un caso en el que los estados de energía más bajos dentro de la banda más alta (en los centros de los lados de la zona cuadrada, sobre los ejes kx y kY.) tienen una energía más baja que los estados de energía más alta de la banda más baja (en las esquinas de la zona). En estas circunstancias, los electrones comienzan a ocupar la banda más alta antes que la más baja esté completamente llena. (b) Representación esquemática de la relación de f en función de k en la dirección OA (las curvas continuas) y OB (curvas punteadas) que ilu~tra de un modo ligera· mente distinto la situación descrita en (a) que cuando se presenta esta circunstancia, la supostcton simple del enlace firme de las funciones atómicas de onda asociadas con un solo nivel ya no es válida y que las bandas de energía se deben volver a calcular, suponiendo una mezcla de funciones de onda relacionadas con ambas bandas. También debe hacerse notar que en esta situación, tanto la conducción electrónica efectuada por los electrones que se derraman hacia la banda superior, como la conducción de huecos realizada por los estados vacíos en la parte superior de la banda más baja, se producen de un modo simultáneo. La superficie de Fermi entonces tiene dos ramas separadas, una para electrones en la zona externa y otra para huecos en la zona original. Si la masa efectiva del hueco es menor que la del electrón, esta situación conduce a un coeficiente positivo de Hali.l 2 Así se puede comprender una de las discrepancias más inquietantes de la teoría original del electrón libre de los metales. 12 En un capítulo posterior se verá la forma en que esto sucede. Densidad de la función de estados y Cllmbios de fase 273 Se observa que la teoría cuántica permite entender en términos generales, por qué las propiedades eléctricas de los conductores metálicos y los aisladores son tan marcadamente distintos, aun a pesar de que con frecuencia se requiere un cálculo de mecánica ondulatoria muy elaborado para establecer con exactitud las superficies de énergía y las funciones de onda relacionadas con las bandas electrónicas de valencia en una substancia en particular. 8.10 DENSIDAD DE LA FUNCION DE ESTADOS Y CAMBIOS DE FASE EN ALEACIONES BINARIAS En el capítulo 5 se derivó la función de densidad de estados para partículas libres en la forma de la ecuación (5.2-22). Intuitivamente, parece obvio que la función de densidad de estados para los electrones dentro de los cristales debe ser la misma que la que se obtuvo antes, excepto quizá que se debe incluir la masa efectiva en lugar de la masa inercial. En breve se verá que esto es cierto, a condición de que las superficies de energía constante sean esféricas. Sin embargo, si las superficies de energía constante se desvían de la forma esférica, la función de densidad de estados se hace mucho más compleja. Para principiar, es importante indicar que los valores permisibles para la cantidad de movimiento del cristal hk, cuando se imponen condiciones periódicas de frontera, de acuerdo con (8.2-20), son los mismos que los valores permisibles de la cantidad de movimiento inercial de una partícula libre, como lo establece (5.2-15). El volumen de espacio de la cantidad de movimiento por estado cuántico, entonces es el mismo que antes y la tarea de determinar la densidad de estados puede lograrse, como antes, encontrando el número de estados cuánticos dv entre las superficies de energía constante correspondientes a las energías e y e +de, calculando el volumen del espacio de la cantidad de movimiento entre las dos superficies y dividiendo entre t/h 3 , el volumen por estado cuántico. El elemento de volumen del espacio de cantidad de movimiento se puede escribir como sigue h3 dvP = p 2 sen(} dp d(} d</J = 8n: 3 k 2 sen 8 dk d(} d</J, (8.10-1) por lo cual, el número de estados dentro del volumen es dvP 1 1 dk lh 3 = -4 3 k 2 sen(} dk d(} d</J = - 3 - • k 2 sen(} de d(} d<jJ. z n: 4n: de (8.10-2) El número de estados dv = g( e) de en el rango dt: energía de alrededor de e se obtiene integrando sobre los ángulos polares O y cf> en el espacio k. De donde, f 1 ffk 2 sen(} d8 dcp 1 dSk g(e) = 4n: 3 (defdk) = 4n: 3 Js (defdk)' (8.10-3) en donde dSk representa el elemento de superficie de área k 2 sen OdO dcf> sobre la superficie de energía constante dentro de la zona de Brillouin. Es evidente que si se conoce la función e(k), la densidad de estados se puede calcular, en principio, a partir de (8.10-3). Sin embargo, desafortunadamente la forma matemática de e(k) es 274 Teoría cuántica de los electrones en redes periódicas tan compleja en casi todos los casos de interés práctico, que la integración se puede efectuar sólo por métodos númericos. Para la red cúbica simple en la aproximación del enlace firme, la función e(k) para una banda s está dada por (8.7-16) y la densidad correspondiente de la función de estados, según lo establece (8.10-3), es como se ilustra en la figura 8.1 7. Figura 8.17. Curva de densidad de estados para una red cúbica simple de acuerdo con la aproximación del enlace firme, como se calculó a partir de (8.10-3) y (8.7-16). Cerca de la base de la banda de energía de este ejemplo en particular, la forma de e(k) está rlada por (8.8-9); entonces, se tiene, para esta región. de y 2 dk = 2{Ja k. (8.10-4) Puesto que e es independiente de 8 y cp en estas circunstancias, (8.10-3) se puede integrar sobre estos ángulos para que dé i i" e 2 dk " g(e) = -4 13 k 2 -d sen n eoo 2 dk , dO de/> = k2 -d ne (8.10-5) o bien, usando (8.10-4), (8.10-6) Si se usa (8.7-18) para expresar {Xl 2 en términos de la masa efectiva, esto se puede escribir como 8~ g(e) = _v_ "'-~' m*312 h3 Je--e 1 (e - e1 ~ 12{1), (8.10-7) que, a condición de que el origen de la energía se tome en la base de la banda, es la expresión parabólica acostumbrada de la densidad de estados de' electrón libre, en donde la masa inercial se ha substituido por la masa efectiva m*. De un modo algo similar, se puede demostrar que para energías cercanas a la parte superior de la Densidad de la función de estados y cambios de fase 275 banda, en donde las superficies de energía constante vuelven a tener una forma esférica, se puede escribir sJ2n g(e) = -¡:;r m* 312 J---c-· + 12/3 &1 & (e1 + 12p - e ~ 12/3). (8.10-8) Esta función de densidad de estados se desvanece en la parte superior de la banda, en donde e= e 1 + 12{3, y aumenta parabólicamente para energías decrecientes. En consecuencia, se puede considerar como una función de densidad de estados de partículas libres para conducción por huecos en una banda casi llena. Las funciones de densidad de estados de electrón libre (8.1 0- 7) y (8.1 0-8), se obtuvieron en relación a un ejemplo específico; pero se puede demostrar que se obtienen las mismas expresiones para cualquier estructura cúbica, ya sea que la aproximación de enlace firme se aplique o no. En los metales del grupo de transición, una banda más bien angosta que se origina en los estados atómicos 3d, que alojan a 1ON electrones, se superpone a la banda electrónica de valencia 4s, dando origen a una curva de densidad de estados para los electrones de valencia como la que se ilustra esquemáticamente en la figura 8.18. A esta curva peculiar de densidad de estados se deben muchas de las propiedades características de estos metales. g(•) d-Banda Figura 8.18. Característica de superposición de las bandas s- y d- de los metales de transición. La forma de la curva de densidad de estados y el concepto de la superficie de Fermi para los electrones de valencia dentro de la zona de Brillouin, se ha utilizado para explicar ciertos cambios de fase que se relacionan con las aleaciones binarias de cobre, plata y oro con metales divalentes y trivalentes. El cobre, la plata y el oro puros son todos elementos nomovalentes que tienen una estructura cúbica centrada en la cara. Por ejemplo, si se principia con plata pura y se agregan cantidades crecientes de cadmio, la estructura cúbica centrada en la cara que se denomina de fase a se conserva hasta una concentración determinada de cadmio (llamada límite a), que es un punto en el que se produce un cambio de fase y la estructura del cristal cambia de cúbica centrada en la cara a cúbica centrada en el cuerpo, siendo esta última denominada fase (3. Si la concentración de cadmio se incrementa más todavía, la estructura cúbica centrada en el cuerpo de fase (j es estable sobre cierto rango de concentración después del cual se llega a otro punto de transición (denominado límite (j) y la fase (j se transforma en una fase 'Y cuya estructura es un arreglo cúbico muy complejo en el que se tienen aproximadamente 52 átomos por célula unitaria. A concentraciones de cadmio todavía mayores, se llega al límite 'Y y 27 6 Teoría cuántica de los electrones en redes periódicas se forma una fase hexa~onal 'TI de empaquetamiento compacto. Las aleaciones de otros metales nobles y las que se logran con otros aditivos multivalentes, siguen el mismo patrón general de cambios de fase aunque los límites a:-, {j- y r- son diferentes en cada sistema individual. Hume-Rothery 13 sefialó que los límites a:-, {j- y r- de estos sistemas de aleaciones se producen siempre en ciertas razones bien definidas de electrones de valencia por átomo. En consecuencia, parece ser que el límite {j se alcanza siempre en el punto en el que se tiene justamente alrededor de 3/2 de electrones de valencia por cada átomo del cristal, y el límite 'Y se obtiene a una relación de electrón de valencia por átomo de 21/13. Jones 14 explicó estas observaciones empíricas de acuerdo con las bases fundamentales. En primer lugar, se debe observar que para el metal puro monovalente cúbico centrado en la cara que está en la fase a:, la zona de Brillouin (reducida) para los electrones de valencia es como se indica en la figura 8.14(e). Puesto que los electrone~ de valencia de los metales nobles son de tipo s, se puede esperar que esta zona de Brillouin contenga 2N estados electrónicos. En el caso del metal puro, la zona está llena sólo a la mitad debido a que el número total de electrones de valencia es N, en este caso. Para mayor facilidad se supondrá, como lo supuso Jones, que la superficie de Fermi dentro de la zona es esférica en todo momento. 15 Basándose en esta simple suposición, se puede calcular la curva de densidad de estados para la zona de Brillouin de un modo muy sencillo; el resultado aparece ilustrado de una manera esquemática en la figura 8.19. La función de densidad de estados es, sencillamente, una parábola del electrón libre hasta que la esfera de Fermi toca la frontera de la zona. Sin embargo, a partir de este punto, las fronteras de la zona cortan partes de la esfera de Fermi y un incremento dado del radio (correspondiente a un incremento específico de energía) abarca sólo un número relativamente pequefio de estados en las esquinas de la zona de Brillouin. La curva de densidad de estados decrece con gran rapidez, acercándose a cero cuando el radio de la esfera de Ferrni es igual al radio de la esfera circunscrita. Se puede La esfera de Fermi ¡-toca la zona de la frontera Figura 8.19. Representación de la curva de densidad de estados de la red cúbica simple basada en la idea de la superficie esférica de Fermi que se expande dentro de la zona de Brillouin, tal y como la empleó Jones. 13 W. Hume-Rothery, The Metallic State, Clarendon Press, Oxford (1931), página 328. 14 H. Jones, Proc. Roy. Soc. 144, 225 (1934); 147, 396 (1934). Véase también N. Mott y H. Jones, op. cit. página 170. 15 Esta suposición es más apropiada en este caso que en el del cubo simple, cuyas superficies de Fermi se ilustran en la figura 8.11, debido a que la zona de Brillouin circundante tiene una forma más esférica. En cualquier caso, la forma exacta de la superficie de Fermi no es particularmente importante para energías TTIIlyores que la que se requiere para que la superficie de Fermi roce apenas la frontera de la zona. Densidad de lo función de estados y cambios de fose 277 observar la misma conducta general en la curva de densidad de estados de la figura 8.17, que se relaciona con una red cúbica simple. Cuando los átomos de un metal multivalente forman una aleación con la fase a: monovalente, aumenta el número de electrones libres por átomo, se eleva el nivel de Fermi y también aumenta el radio de la esfera de Fermi dentro de la zona de Brillouin asociada con los electrones de valencia. Más allá del punto en el que la esfera de Fermi toca la frontera de zona, se produce un gran incremento de energía electrónica con cada pequeño incremento de concentración de electrones libres y, por tanto, con cada pequeño aumento en la concentración del aditivo multivalente. En este punto, se obtendrá una energía electrónica total más baja si el cristal sufre un cambio de fase a una red cuya zona de Brillouin dé acomodo a una esfera inscrita de mayor tamaño y, en efecto, esto es lo que sucede. La fase a: cúbica centrada en la cara cambia a una fase (j cúbica centrada en el cuerpo, cuya zona de Brillouin [figura 8.14(b)] tiene, en efecto, una esfera inscrita de mayor tamaño, aunque se trate del mismo volumen. Si se hace una adición posterior del elemento multivalente de la aleación, el radio de la esfera de Fermi aumenta más todavía y por último toca la superficie de la zona de Brillouin de fase (j. Nuevamente se produce un cambio de fase, la zona de Brillouin de la fase 'Y resultante viene a ser un poliedro complejo de 36 caras que tiene una forma más bien esférica 16 que el dodecaedro rómbico asociado con la fase (j y cuya esfera inscrita es, por ende, mayor todavía. De acuerdo con estos argumentos, se pueden hacer cálculos cuantitativos de los límites a:-, (j- y -y-. En la fase a:, la esfera de Fermi llega primero a la frontera de zona en las direcciones {lll} dentro del espacio k. El plano (111) que forma parte del poliedro de la zona de Brillouin tiene [de acuerdo con (8.8-13)], la ecuación kx +k,+ k,.= 3nfa. (8.10-9) En el punto de contacto, en el centro de la cara (111), kx = ky = kz = rra, por lo cual, el radio de la esfera de Fermi es el punto de contacto, kc, debe ·estar dado por (8.10-10) En estas condiciones, el volumen de la esfera de Fermi es 4rrkU3, ó 4 ./frr(rr/a )3, en tanto que se puede demostrar fácilmente que el volumen total de la zona es la mitad del volumen de un cubo de lado 4rrfa, ó 32(rr/a) 3 . La razón del volumen de la esfera inscrita a la zona es, por tanto, la relación de estos dos números, o sea, rr y3/8. El número promedio de electrones de valencia por átomo es el número por átomo cuando la zona está llena (es decir, 2) por la fracción del número de estados dentro de la zona que están ocupados. El número de electrones de valencia por átomo para el límite a: es, entonces, rr y3/4 ó 1.362. Los valores de los límites (j- y -y- se pueden obtener usando los mismos procedimientos generales. En la tabla 8.2 se ilustran los valores obtenidos en comparación con los valores derivados empíricamente por Humes-Rothery. Naturalmente, puesto que las superficies de Fermi no pueden ser perfectamente esféricas, las estimaciones de Jones deben considerarse sólo aproximaciones; sin embargo, se ha encontrado que concuerdan muy bien con los límites de fase determinados de un modo experimental. Los diagramas de fase de sistemas de aleaciones más complejos se entienden a menudo de acuerdo con las superficies de energía 16 Véase F. Seitz, Modern Theory o[ Solids, McGraw-Hill Book Company, Inc., Nueva York (1940), figura 13, página 433. 278 Teoría cuántica de los electrones en redes periódictJS TABLA 8.2. Relación electrón-átomo Límite de fase Hume-Rothery· Jones 1.5 1.615 1.362 1.480 1.538 a p y electrónica y la función de densidad de estados dentro de la zona de Brillouin; pero los detalles de los cálculos y las respuestas resultantes son muy complejas. EJERCICIOS l. Demuestre que si en el modelo del potencial de la figura 8.2, usado en relación con el cálculo de Kronig-Penney, se permite que V0 se haga infinitamente grande y b tienda a cero en tal forma que el producto P =- {j2ab/2 se mantenga fijo, entonces la ecuación (8.3-12) se convierte en sen aa P - - + cos aa =cuska. aa Si se hace una gráfica de la función del lado izquierdo, se observará que se comporta de un modo similar a (8.3-15) y (8.3-16) como se ilustra en la figura 8.3. La cantidad P se puede considerar como la "potencia de dispersión de un solo pico de potencial". 2. Demuestre que en el caso que se vio en el ejercico 1 anterior, la cantidad de/dk desaparece en los bordes de la banda (k = nTr/a ). 3. Demuestre que para la- aproximación unidimensional del electrón libre que se vio en la sección 8.6, de/dk desaparece en los bordes de la banda. 4. Demuestre que para la aproximación de enlace firme en la red cúbica simple que se vio en la sección 8. 7, n • V.e desaparece en todos los puntos sobre las fronteras cúbicas de la primera zona de Brillouin. 5. Demuestre explícitamente que los poliedros que aparecen en la figura 8.14(b) y (e) son las formas correctas correspondientes a la primera zona de Brillouin para las redes cúbica centrada en el cuerpo y cúbica centrada en la cara, respectivamente. 6. Encuentre la relación e(k) para una banda s (funciones de onda esféricamente simétricas) en la aproximación de enlace firme para un cristal cúbico centrado en el cuerpo. Tom,!l·ep cuenta sólo las integrares de superposición del vecino más cercano. Grafique las formas de las superficies de energía constante para varias energías dentro de la zona. Demuestre que estas superficies son esféricas, como sucede en el caso de los electrones libres, para energías cercanas a la base de la banda. Demuestre también que n • v'.e se desaparece;: en las fronteras de la zona. 7. Obtenga todos los resultados que se requieren en el eJercicio 6 anterior, para una banda s en un cristal cúbico centrado en la cara de acuerdo con la aproximación del enlace firme, teniendo .m cuenta sólo la superposición de las funciones de onda del vecino más cercano. 8. Haga un diagrama rsimilar al de la figura 8.13(c)] dentro del plano k, de las primeras cinco zonas de Brillouin de una red bidimensional definida por los vectores de base a aix, b = 3aiy Nota: no se pueden usar las fórmulas (2.5-5) para definrr una red recíproca bidimensional, debido a que el producto transversal no se puede definir en un espacio bidimensional. Proceda a partir de las defmiciones fundamentales (2.5-1) y (2.5-2). 9. Demuestre explícitamente, a partir de los resultados de la sección 8.7, que la densidad de estados cerca de la parte superior de la banda de energía, para el cristal cúbico simple, que se vio en detalle en esa sección, está dada por la ecuación (8.10-8). LO. Demuestre que la relación limitante de electrón de valencia por átomo para la tase (3 (cúbica centrada en el cuerpo) de una aleación binaria del tipo que se vio en la sección 8.10, es 1.489. Puede tomar en cuenta la suposición del cálculo de Iones. 11. Demuestre que la función de onda (8.7-3) que se usó en el cálculo de la aproximación de enlace firme, se puede expresar como una función de Bloch de la forma (8.2-14). = Lecturas recomendadas 279 LECTURAS RECOMENDADAS W. Hume-Rothery, The Metallic State, Clarendon Press, Oxford (1931). H. Jones, The Theory of Brillouin Zones and Electronic States in Crystals, North Holland Publishing Co., Amsterdarn (1960). N. F. Mott y H. Jones, Theory of Metals and Alloys, Dover Publications, Inc., Nueva York (1958). S. Raimes, The Wave Mechanics of Electrons in Metals, Interscience Publishers, Nueva York (1961). F. Seitz, Modern Theory of Solids, McGraw-Hill Book Co., lnc., Nueva York (1940). R. A. Smith, Wave Mechanics of Crystalline Solids, John Wiley & Sons, Inc., Nueva York (1961). E. Spenke, Electronic Semiconductors, McGraw-Hill Book Co., Inc., Nueva York (1958). A. H. Wilson, Theory of Metals, 2.a Edición, Cambridge University Press, Nueva York (1953). CAPITULO 9 Semieonductores electrónicos unifortnes en equilibrio 9 .l SEMICONDUCTORES En los capítulos anteriores la preocupacwn principal consistía en entender las propiedades eléctricas y térmicas de los conductores y los aisladores metálicos, así .:omo comprender por qué unas substancias son muy buenos conductores eléctricos y otras, muy deficientes. Estos objetivos se han logrado en general y, a partir de ahora la atención se centrará en un análisis detallado de las propiedades de los semiconductores. Hay tres razones por las que esto es algo muy conveniente. En primer lugar casi siempre se puede usar la estadística de Maxwell-Boltzmann para estudiar la mecánica estadística de los portadores de carga en semiconductores. Esto significa que se pueden obtener soluciones analíticas exactas para muchos problemas de semi.:onductores que se pueden resolver sólo mediante métodos numéricos o aproximados en el caso de los metales, en donde se debe utilizar la estadística de Fermi-Dirac. Comprender los efectos de esta índole en los semiconductores puede proporcionar .:onocimientos físicos valiosos respecto a sus equivalentes en substancias metálicas. En resumen, los procesos electrónicos se pueden comprender con mayor facilidad y profundidad en los semiconductores que en otras clases de cristales. En segundo lugar, la tecnología del crecimiento de cristales ha hecho posible producir cristales de ciertas substancias semiconductoras (principalmente germanio y silicio) de una pureza y perfección cristalina fantásticas, en un grado mucho mayor de lo que se puede vbtener en la actualidad con metales y aisladores. La existencia de estos cristales casi perfectos permite al experimentador observar las propiedades de transporte electrónico, los efectos termoeléctricos y galvanométricos con facilidad y precisión, teniendo la certeza de que lo que está tratando de observar no lo oscurecerán los efectos provocados por impurezas o imperfecciones estructurales en la red cristalina. Por tanto en los semiconductores se pueden observar e interpretar con facilidad los fenómenos que, en las substancias metálicas, serían difícil o imposible medir con precisión o explicar de un modo cuantitativo. Por último, los semiconductores han adquirido una enorme importancia tecnológica durante las dos últimas décadas. Se han llegado a utilizar para fabricar todo tipo de dispositivos electrónicos incluyendo rectificadores, transistores, fotoceldas, reguladores de voltaje, amplificadores paramétricos y dispositivos de conmutación. La apreciación de las propiedades fundamentales del transporte electrónico en estas substancias tiene una aplicación directa en la comprensión y el análisis del funcionamiento de todas las estructuras de dispositivos que actualmente tienen importancia técnica. 281 282 Semiconductores electrónicos uniformes en equilibrio El semiconductor es una substancia cristalina que tiene una estructura de bandas de energía en la que una banda de estados electrónicos, completamente llena a la temperatura cero, se separa de otra que está totalmente vacía al cero absoluto. por medio de una región angosta de energías prohibidas. Esta estructura de banda se ilustra esquemáticamente en la figura 9.l(a). En el cero absoluto, el semiconductor es un aislador perfecto, ya que no cuenta con bandas parcialmente llenas. Sin embargo, a temperaturas más altas, algunos electrones de la banda de valencia pueden adquirir la suficiente energía térmica aleatoria para excitarse a través de la banda prohibida con el fin de convertirse en electrones de conducción en la banda de conducción que hasta entonces estaba vacía. Los estados vacíos que quedan en la banda inferior o de valencia pueden contribuir también a la conductividad comportándose como huecos positivamente cargados. Fs evidente que el número de electro- Electrones de conducción / _ térmicamente excitados Banda "de conducción" vacía - ~e~~~----------- Región prohibida t:u (Banda de energía prohibida) (o) 0°K Figura 9.1. Estados vacíos de la banda de valencia (huecos) ( b) Temperatura ambiente (300° K) Bandas de conducción y valencia de un semiconductor (a) al cero absoluto, (b) a la temperatura ambiente, mostrando electrones y huecos térmicamente excitados. nes de conducción y el número de huecos debe elevarse al incrementarse la temperatura y, por tanto, la conductividad eléctrica también aumenta al subir la temperatura. El mecanismo físico de la conducción por electrones y huecos en semiconductores covalentes, tales como el carbono (diamante), germanio y silicio, que forman cristales con la estructura del diamante de la figura 1.9, se puede entender con mayor claridad en la figura 9.2. En esta figura se muestra la estructura calculada de bandas de energía del diamante graficada en función del espaciamiento interatómico, como se hizo en la figura 8.1 O. Los diagramas correspondientes al silicio y al germanio son muy similares. Cuando N átomos aislados se combinan en un cristal, los niveles atómicos 2s y 2p se amplían a bandas de energía; conforme el espaciamiento interatómico disminuye, estas bandas se hacen cada vez más anchas y terminan por superponerse. Cuando la distancia interatómica se hace más pequeña todavía, el continuo de lo que originalmente eran los estados 2s y 2p se divide una vez más en dos bandas, cada una de las cuales cuenta ahora precisamente con 4 N estados. A la distancia interatómica de equilibrio a, estas bandas están separadas por un "vacío de energía" o región prohibida cuya anchura es ll.e. Puesto que la estructura electrónica del carbono es ls 2 )2s 2 2p 2 , se tienen 4 N electrones de valencia disponibl.- que bastan exactamente para llenar la más baja de las dos bandas y formar la banda de valencia del cristal. La banda superior se convierte en la de conducción. La región de energía prohibida en condiciones normales tiene una anchura aproximada de 7 e V en el diamante, 1.2 eV en el silicio y 0.7 eV en el germanio. Debido a la expansión Semiconductores 283 tu=7eV (Diamante) 1 z'ev '(Silicio! (Germanio) ~~~--~6~N~es~t-ad~o-s-+ 2 P >Niveles átómicos ffiin:s:o-2~N~e-,st-ad-¡-o-s---¡. 2 • \~nD~=-------------~2~N~e~s~ta~d~o~s---t'• -----+--:---::-:----:---::-::-:---------;;;;t- _ a(= Valor de equilibrio del diamante) Figura 9.2. 00 Espaciamiento interatómico Las bandas que se originan de los estados atómicos ls, 2s y 2p del carbono (diamante) como función de la distancia interatómica. [De acuerdo con W. Shockley, Electrons and Holes in Semiconductors, D. van Nostrand Co., lnc., Nueva York (1950).] ténnica de la red, este "vacío de energía" tiene una dependencia débil en función de la temperatura; de acuerdo con la figura 9.2, es evidente que el vacío en la energía disminuye confonne se expande el cristal. También es obvio, de acuerdo con este diagrama, que A. e. será una función de la presión, haciéndose mayor confonne se reduce el espaciamiento interató!llico mediante la aplicación Je presión por medios hidrostáticos o de otra naturaleza. Más a la izquierda del punto A de la figura 8.10, en donde se superponen las bandas ls y 2s, se pierde el carácter s y p de los estados electrónicos; por tanto, en la banda de valencia del semiconductor, las funciones de onda del electrón son una mezcla de funciones de onda atómicas s y p. Los electrones de la banda de valencia son los que fonnan los enlaces covalentes de parejas de electrones tetraédricamente dispuestos entre los átomos, en la figura 1.9. La excitación ténnica de un electrón de la banda de valencia a la de conducción corresponde físicamente a la supresión de un electrón de la pareja del enlace covalente por medio de la agitación ténnica de la red. Por tanto, el electrón se convierte en un electrón libre fuera del enlace covalente de la red y queda disponible para funcionar como portador de carga a fin de conducir una corriente a través del cristal. Este proceso se describe esquemáticamente en la figura 9.3(a), aunque se debe recordar que el patrón de enlaces usado es una versión bidimensional de lo que en realidad es una red tridimensional de enlaces tetraédricos. la excitación de un electrón deja un defecto localizado en la estructura del enlace covalente del cristal, que se puede identificar como un estado de banda de valencia que podría ser ocupado por un electrón; pero que en realidad está vacío. Este defecto constituye el "hueco" de la sección 8.5. Tanto el electrón libre como el hueco son migratorios; el electrón libre puede ''vagar" dentro del cristal en una fonna aleatoria, impelido por la energía ténnica que pueda adquirir de la propia red. Del mismo modo, el hueco puede desplazarse porque un electrón de un enlace covalente adya~ente al hueco puede moverse con suma facilidad hacia el hueco, completando así la pareja de enlace en el sitio original del hueco; pero transfiriendo la ubicación del hueco al 284 Semiconductores electrónicos uniformes en equilibrio sitio de donde provino el electrón. Esta migración del hueco también puede producirse por una agitación térmica de la red. Los electrones libres y los huecos se moverán también en respuesta a un campo eléctrico y pueden dar origen a una corriente macroscópica que fluye por el cristal. En la figura 9.3(b) se ilustra esta situación. En este caso, todos los electrones del-cristal, tanto en la banda de conducción como en la de valencia están sometidos a la fuerza - eE que actúa a la derecha del diagrama. Los electrones libres se mueven hacia la derecha produciendo un flujo de corriente convencional a la izquierda, debido a su carga negativa. Además un electrón de un enlace covalente adyacente a un hueco se puede desplazar a la derecha hacia el sitio vacío del electrón asociado con él, y el hueco se desplaza hacia la izquierda al sitio de donde provino este electrón; este proceso se puede repetir y el resultado neto es una transferencia neta de un electrón hacia la derecha que va acompañada del movimiento del hueco hacia la izquierda, es decir, en la 11 11 11 11 11 =@=@=@=@=@= 11 11 11 11 11 =@=@=@=@=@= 11 11 e11 11 11 =@=@-@=@=@= 11 11 11 11 11 =@=@=@=@=@= 11 11 11 11 11 =@=@=@=@=@= 11 11 11 11 _.11 11 11 11 " =@j~'~@=@=@= 11 11 11 11 11 =@=@=@=@=@= 11 11 11 11 11 @=@=@=@=@= 11 Electrones de _.....-. enlace covalente (o) Figura 9.3. 11 =@=@=@=@=@= 11 11 11 11 11 =@=@=@=@=@= 11 ll ()¡¡---iT-e 11 11 11 11 11 -E (b) (a) Un electrón libre y un hueco producidos por la ionización térmica de un electrón que originalmente se encontraba en un enlace covalente. (b) Movimiento del electrón libre (a la derecha) y el hueco (a la izquierda) cuando se aplica un campo eléctrico tal y como se indica. dirección en que la partícula de carga positiva se movería bajo la influencia de un campo aplicado. La corriente neta de electrones hacia la derecha da origen nuevamente a un flujo convencional de corriente hacia la izquierda que puede representarse como una corriente de huecos positivos en tal dirección. Así pues, el flujo de la corriente puede deberse tanto al movimiento de electrones libres como a la migración de electrones de valencia dentro y fuera de estados vacíos de la banda de valencia, que se puede considerar mejor como la migración de huecos positivos. 9.2 SEMICONDUCTORES INTRINSECOS Y SEMICONDUCTORES CON IMPUREZAS Un semiconductor en el que los huecos y los electrones se crean exclusivamente mediante una excitación térmica a través de la banda prohibida de energía, se conoce como semiconductor intrínseco. Los huecos y los electrones creados de esta Semiconductores intrínsecos y semiconductores con impurezas 28S manera a menudo se denominan portadores intrínsecos de carga y la conductividad originada por estos portadores se llama conductividad intrínseca. En un semiconductor intrínseco, las concentraciones de electrones y huecos siempre deben ser las mismas, ya que la excitación térmica de un electrón origina inevitablemente sólo un hueco. La población de huecos y electrones en un semiconductor intrínseco se describe estadísticamente de acuerdo con la función de distribución Fermi-Dirac y las funciones de densidad de estados para las bandas de valencia y conducción. Puesto que la parte baja de la banda de conducción y la parte superior de la de valencia muestran una dependencia esencialmente parabólica de su relación e y k, el comportamiento de los electrones y los huecos en estas regiones es fundamentalmente el de una partícula libre, con los factores apropiados de masa efectiva. Los electrones y los huecos se ven raramente excitados hacia las regiones de las bandas de conducción y valencia en donde sus propiedades pueden diferir del comportamiento de una partícula libre a temperaturas físicamente posibles de manera que los efectos de estas excitaciones se pueden desechar para fines prácticos. Entonces, las funciones de densidad de estados que se van a usar son en esencia las de las partículas libres y la densidad de estados de la banda de conducción está dada por ge(e) de= sJh32n m* n 312 Je -e de e (9.2-1) y la densidad de estados de la banda de valencia es ~de 312 g v( e) de= Sj2n h3 m*P V t>v- t ' (9.2-2) m; en donde m~ es la masa efectiva de los electrones de la banda de conducción y es la masa efectiva de los huecos de la banda de valencia. 1 Por supuesto, la densidad de estados en la región prohibida ev <e < ec es cero. En la figura 9.4 aparece una gráfica de la curva de densidad de estados correspondiente a un semiconductor intrínseco. Si y m~ son precisamente iguales, la energía de Fermi debe quedar m; Figura 9.4. Función de densidad de estados de un semiconductor intrínseco. 1 Los subíndices n y p se refieren a los portadores de carga negativos y positivos. Esta regla se aplicará de un modo invariable. 286 Semiconductores electrónicos uniformes en equilibrio exactamente en el centro de la región prohibida. Esto es lo correcto debido a que. de otra manera, la población de electrones en la banda de conducción y los huecos de la banda de valencia, obtenidos integrando el producto de la función de densidad de estados y el factor de probabilidad f 0 (e) para los electrones en la banda de conducción, ó 1 - f 0 (e) para los huecos en la banda de valencia, no sería idéntica. La situación se representa diagramáticamente en la figura 9.5(a). Si y m~ no son iguales (y este es el caso general), la energía de Fermi debe sufrir un pequeño ajuste ascendente o descendente, alejándose del centro exacto de la banda prohibida de energía, para igualar las integrales de población y, por tanto, debe quedar cerca, pero no en el centro de la región prohibida. En la figura 9.5(b) se muestra esta circunstancia. En una sección posterior se investigará más detalladamente la estadística de huecos y electrones. m; ·t -fo(•l g(•l 1 1 1---uc<•l 1 1 1 Probabilidad f 0 de ocupación de electrones 1 _Producto f0 (. l9c(• l ., ., .... Producto [1-f0 (•l]uv<•l .... Probabilidad 1- t0 para huecos '' '' 9v<•l f 0 =0 (o) m~ =m~ Figura 9.5. '/' , 1 1 2 (b) m*p =m*, Función de distribución, nivel de Fermi, función de densidad de estados y poblaciones de electrones y huecos de un semiconductor intrínseco (a) en donde =m~ y (b) en donde >m~. Ui "ampliación" de la distribución de Fermi se ha exagerado aquí para ilustrar con mayor claridad; en realidad, a 300°K, la distribución de Fermi sería más bien como la función "escalón" que se encuentra para T=O. mp mp Es muy fácil introducir cantidades muy pequeñas de substancias tales como arsénico, antimonio u otros elementos pertenecientes al grupo V de la tabla periódica, en cristales puros de silicio o germanio, como impurezas de substitución, es decir, como átomos de impurezas que ocupan sitios de la red que normalmente estarían ocupados por átomos del semiconductor covalente. Los átomos del grupo V tienen cinco electrones de valencia. Cuatro de ellos se usan para formar enlaces covalentes con átomos circunvecinos del semiconductor y el quinto se enlaza al átomo de impureza sólo mediante fuerzas electrostáticas que son muy débiles y, por ende, se pueden ionizar con facilidad mediante la agitación térmica de la red a Semiconductores intrínsecos y semiconductores con impurezas 287 temperaturas ordinarias para proporcionar una conducción electrónica adicional. Entonces, el átomo de impureza que queda se convierte en un ion positivo, que, sin embargo, es inmóvil, en vista de que está fuertemente unido a cuatro átomos vecinos por medio de los enlaces covalentes normales. Esta situación se ilustra en la figura 9.6(a). En cristales que contienen este tipo de impureza existen más electrones que huecos (aunque algunos huecos siguen estando presentes debido a los pares hueco-electrón que se siguen creando térmicamente de vez en cuando). Estos cristales se denominan semiconductores tipo n, designados así porque la mayoría de los portadores de carga son electrones negativos. La componente de la conductividad eléctrica que se produce por los átomos impureza se llama conductividad de impureza. Una substancia cuya mayoría de portadores se origina debido a átomos de impureza, se conoce como semiconductor con impurezas. Los átomos del grupo V de substitución se llaman con frecuencia átomos donadores, ya que cada uno de ellos dona un electrón libre adicional al cristal. Se requiere tan poca energía (como se verá en breve) para ionizar un átomo de impureza donadora típico del grupo V en Si y Ge, que prácticamente todas las impurezas del grupo V en estos materiales se ionizan a temperaturas superiores a aproximadamente 20°K. 11 hbre 11 11 11 11 11 11 11 =@=@=@=®= Hueco---¡¡"' =@=@~@=@= =@~@=@=@= ' ,t 11 11 11 =®=@~CGt=@= 11 11 11 11 11 11 11 ' ~. 11 =@=®=(e/=@= 11 11 =@=@=@=@= (a) Figura 9.6. 11 11 =@ =@ =@ = O..,l.l ~lectrón =~ 11 (tipo·n) 11 1 11 11 11 '~u 11 11 =®=®=@=@= 11 11 (b) 11 11 (tipo-p) (a) Electrón libre originado por la ionización de un átomo de impureza de arsénico de substitución, (b) hueco libre producido por la ionización de un átomo de indio de impureza de substitución. Si en lugar de los átomos del grupo V se introducen en la red átomos de impurezas del grupo lli (Al, Ga, In, etc.), se observará un efecto muy distinto. Estos átomos tienen sólo tres electrones de valencia que se usan para formar enlaces covalentes con tres átomos cercanos; pero el cuarto enlace siempre carece de un electrón. En efecto, existe un hueco adicional que se crea en la estructura del enlace covalente en el átomo de la impureza. Este hueco puede emigrar fácilmente alejándose del sitio de la impureza debido a que un electrón adicional del enlace covalente cercano puede emigrar al sitio de la impureza y llenar el cuarto enlace de par de electrones (que, por supuesto, representa una carga negativa en el átomo de impureza); a continuación, el hueco se asocia con el átomo cercano que no se puede distinguir de un hueco térmicamente formado. En la figura 9.6(b) se ilustra esta situación. La energía necesaria para la migración del hueco lejos del sitio de la impureza es del orden de la energía que se requiere para eliminar el electrón adicional de un átomo donador. En consecuencia, excepto a temperaturas muy bajas, todos los huecos serán migratorios y todos lo átomos de impurezas del grupo IIl tendrán la naturaleza de iones negativos inmóviles. En cristales que contienen predominantemente este tipo de impureza se tienen más huecos que electrones, aunque 288 Semiconductores electrónicos uniformes en equilibrio .t ·t lectrones Electrones .,_-+-_ Nivel de Fermi intrínseco- Nivel de F -"---- ., Huecos fo= o (a) tipo-n Figun 9.7. fo= O ( b) tipo-p Función de distribución nivel de Fermi y poblaciones de electrones y huecos para (a) un semiconductor con impurezas tipo n y (b) un semiconductor con impurezas tipo p. Una vez más, como en la figura 9.5, la "ampliación" de la distribución de Fermi se exagera con fines ilustrativos. siempre habrá algunos electrones que se originan debido a la excitación térmica. Los cristales de esta índole se conocen con el nombre de semiconductores tipo p, dado que los portadores de carga mayoritarios son positivos. Los átomos de substitución del grupo III se clasifican casi siempre como átomos receptores, debido a que pueden recibir un electrón de la -estructura del enlace covalente liberando un hueco móvil. Cuando en un cristal semiconductor existen impurezas de ambos tipos, la conductividad es invariablemente mayor que la referente a un semiconductor puro o intrínseco a la misma temperatura, debido a los portadores .1e carga lldicionales originados por los átomos de impurezas y, en general, mientras más grande es 1~ concentración de impurezas, tanto mayor es la conductividad. La representación estadística de los semiconductores tipo n y p se caracterizan por la presencia del nivel de Fermi superior (para el tipo n) o inferior (para el tipo p) a la posición asociada con el cristal puro o intrínseco. Por ejemplo, en un cristal tipo n, no puede haber más electrones que huecos, a menos que el nivel de Fermi se ajuste de un modo ascendente en relación con la posición intrínseca, y viceversa para el tipo p, como se ilustra en la figura 9.7. Conforme varían la temperatura y la concentración de impurezas, la posición del nivel de .Fermi cambia de un modo muy complejo. Este tema se ampliará más adelante. 9.3 ESTADISTICA DE HUECOS Y ELECTRONES; EL CASO DEL SEMICONDUCTOR INTRINSECO En condiciones de equilibrio térmico, el número de electrones dn 0 por unidad de volumen que tienen una energía dentro del rango de alrededor de e en la banda Estadística de huecos y electrones; el caso del semiconductor intrínseco 289 de conducción de cualquier semiconductor, intrínseco o con impurezas, de acuerdo con los resultados del capítulo 5, es f ( ) de d n0 -- 10 e 9c( e) d S-- ----¡;:r- mn*3/2 J~ !.....!! sJ2.n (9.3-1) 1 +e kT en donde f 0 (e) representa la función de distribución de Femli en equilibrio (5.5-20) y gc(e) es el factor de densidad de estados (9.2-1). Ahora, ~€, la anchura de la región de energía prohibida, es casi siempre del orden de 1 eV y kT a la temperatura ambiente (300°K) es aproximadamente 1/40 eV. Si la energía de Fermi está dentro de la región prohibida, a varias unidades kT lejos del borde de la banda de conducción (es decir, si €e- e¡'> kl), entonces para todas las energías pertenecientes a la banda de conducción, el factor exponencial del denominador de la función de distribución de Fermi es mucho mayor que la unidad. Por tanto, la función de distribución de Fermi se puede representar en relación con la banda de conducción como fo(s) ~ e-(e-e¡)/kT (9.3-2) que es una función de distribución con una forma esencialmente maxwelliana. La situación en este caso es prácticamente la que se vio en el capítulo 5 en conexión .:on la ecuación (5.5-27). Puesto que ya se indicó en la figura 9.5 que la energía de Fermi para un semiconductor intrínseco debe quedar dentro de la región prohibida de energía, y dado que kT ~ ~€ a todas las temperaturas accesibles, como se señaló mtes, la condición €e- e¡'> kT se satisface siempre en la práctica y siempre se puede utilizar la expresión (9.3-2) para semiconductores intrínsecos mejor que la que es más complicada, (5.5-20). En realidad, en la mayoría de los casos relacionados .:on semiconductores con impurezas, se descubrirá que esta condición se satisface, lo .:ual también permite utilizar (9.3-2) para estos semiconductores. Por ejemplo, es evidente que esta simplificación sería válida para los semiconductores con impurezas de la figura 9. 7. En las figuras 9.5 y 9. 7 se puede ver que la "cola" exponencial de la función de distribución de Fermi es la única parte de dicha función que tiene una superposición con las bandas de c0nducción y valencia. La parte de la función de Fermi en las cercanías de la energía de Fermi, que es invariablemente la parte que origina dificultades matemáticas, coincide en todos los casos con una región en dor.de la densidad de los estados electrónicos disponibles es cero. La aproximación de simplificación (9.3-2) se conoce con el nombre de aproximación de Boltzmann. Si se utiliza esta aproximación en (9.3-1) y se integra para obtener el número total de electrones por unidad de volumen en la banda de conducción, se encuentra .:¡ue nO = I 00 ~ J dn = - 8 2n. O h3 I 00 m*3f2 e•¡lkT n -- Je-e e e-•tkT de · (9.3-3) ~ En realidad, los límites de integración deben ser desde Ee hasta la parte supenor de la banda de conducción, sea donde fuere; sin embargo, puesto que !o(€) desciende muy rápidamente al incrementarse e (-por lo menos para valores razonables de temperatura), la mayoría de los electrones se concentran en los estados cercanos J. la base de la banda de conducción. En tanto que la parte superior de la banda tenga una energía muchas unidades kT mayor que Ee, no hay mucha diferencia en el 290 Semiconductores electrónicos uniformes en equilibrio hecho de si se integra a la parte superior de la banda o a infmito. Cuando se hace la substitución ¡;-Be X=-e kT (9.3-4) la integral (9.3-3) se puede expresar en la forma (9.3-5) De acuerdo con (5.4-4), el valor de la integral antenor es r(3/2) = y1r/2. Si se substituye e.ste valor para la integral, el resultado sería (9.3-6) en donde (9.3-7) El valor numérico de la cantidad Uc se puede escribir (usando las unidades cgs) como (9.3-8) en donde m 0 es la masa inercial del electrón. Para m:; = rn 0 y T = 300°K, esto da Uc = 2.51 X 10 19 cm- 3 . El número de huecos Po por unidad de volumen en la banda de valencia de un semiconductor, se puede encontrar de un modo similar. En este caso se puede expresar como dp 0 , el número de huecos en la banda de valencia dentro del rango de energía de alrededor de e, (9.3-9) La cantidad [po(e) es la probabilidad de que un hueco esté asociado con un estado cuántico de energía e, en otras palabras, que dicho estado estará desocupado. Esta probabilidad es justamente, uno menos la probabilidad de ocupación f 0 (e). Puesto que [ 0 (e) está dada por (5.5-20), se puede ver fácilmente que 1 /po(e) = 1-/o(e) = 1 - 1 + e<• .,J!kT - 1 + e<•' •JikT. (9.3-10) Nuevamente, si la energia de Fermi tiene varias unidades kT por encima del borde de la banda de valencia, es decir, si e¡- Ev ~ kT, el factor exponencial del denominador de la expresión (9.3-10) ¡;s mucho mayor que la unidad, para todos los valores de e en la banda de valencia, se puede hacer que (9.3-11) Esta es la aproximación de Boltzmann para los huecos en la banda de valencia. Si se usa (9.3-11) y la función de densidad de estados (9.2-2) en (9.3-9) y se i,r.tegra Estadística de huecos y electrones; el caso del semiconductor intrínseco 291 sobre la banda de valencia, se obtiene (9.3-12) También en este caso el límite inferior de la integral es - oo y no la base de la banda de valencia; esta simplificación se justifica más o menos con el mismo argumento que se usó en relación (9.3-3) para la banda de conducción. Cuando se hace la substitución 8v- e X=-v kT (9.3-13) la integral se puede expresar en la forma (9.3-14) que se puede evaluar como una función r-, como antes, para dar (9.3-15) con (9.3-16) El valor numérico de Uv puede obtenerse a partir de (9.3-8), substituyendo en la fórmula mp por m~.' Se puede demostrar con facilidad que el producto m 0 p 0 es una función exclusiva de la banda prohibida de energía t:.e, las masas efectivas y la temperatura, e independiente del nivel de Fermi o del contenido de impurezas. Por tanto, al multiplicar las expresiones (9.3-6) y (9.3-15) para n 0 y p 0 , ~e puede obtener (9.3-17) Si se usa (9.3-7) y (9.3-16), esto se puede escribir en la forma (9.3-18) Para una substancia semiconductora dada, las masas efectivas y la banda prohibida de energía ~e son fijas; de donde, el producto n 0 p 0 de un material dado debe ser una función exclusiva de la temperatura. Esta es esencialmente una ley de acción de las masas que rige las concentraciones relativas de huecos y electrones en un material en particular. Si el semiconductor se encuentra en un estado intrínseco o puro, las concentraciones de huecos y electrones deben ser iguales, como se vio antes, debido a que sólo los huecos y los electrones que pueden estar presentes son los que se generan en pares mediante la excitación térmica de los electrones de la banda de valencia. En consecuencia, en este tipo de materiales, Po = n0 = n¡(T) (9.3.19) 292 Semiconductores electrónicos uniformes en equilibrio en donde n¡(T) representa el número de huecos o electrones por unidad de volumen dentro de una muestra intrínseca del semiconductor en cuestión a la temperatura T. En una muestra de la misma substancia que no es intrínseca, sino más bien un semiconductor con impurezas, el número de huecos y electrones ya no es el mismo: sin embargo, de acuerdo con (9.3-17), el producto n 0 p 0 debe ser el mismo para este material que para la substancia intrínseca. Por tanto, se puede escribir, de acuerdo con (9.3-19), (9.3-20) siendo (9.3-21) como lo establece (9.3-18). De acuerdo con estos resultados, la concentración de portadores en un semiconductor intrínseco tiene una gran dependencia de la temperatura, aumentando rápidamente conforme se incrementa esta última y, de igual manera, depende enormemente de la banda prohibida de energía Lle, decreciendo con gran rapidez al aumentar Lle. La relación de la acción de las masas (9.3-17) ó (9.3-20) recuerda claramente las leyes que gobiernan las concentraciones relativas de iones en substancias que están débilmente ionizadas, por ejemplo, los iones H+ y OH- en sistemas acuosos. En realidad los semiconductores se pueden comprender como un ejemplo de la teoría clásica de Arrenhius sobre los electrolitos débilmente ionizados en relación con un sistema en el que un enlace covalente se disocia en un electrón y un hueco con la energía de disociación Lle. En una muestra puramente intrínseca, en donde las concentraciones de huecos y electrones son iguales, se pueden igualar las expresiones (9.3-6) y (9.3-15), tomar el logaritmo de ambos lados de la ecuación resultante y resolver para la energía de Fermi, lo cual da (intrínseca). (9.3-22) Puesto que Uv y Uc están dadas por (9.3-16) y (9.3-7), se puede expresar este resultado en la forma (intrínseca), (9.3-23) usando el símbolo e¡¡ para denotar la energía de Fermi de un semiconductor intrínseco. De acuerdo con esto, es evidente que en un semiconductor intrínseco la energía de Fermi queda desplazada del centro del vacío de energía sólo por una cantidad relativamente pequeña de energía, según lo indica el segundo término del lado derecho de (9.3-23). Si m;= m~, el nivel de Fermi se encuentra exactamente en el punto medio de la región prohibida, como sr señaló con anterioridad. 9.4 ENERGIA DE IONIZACION DE CENTROS DE IMPUREZAS Un centro donador de un semiconductor se compone de un icn fijo de carga +e con el que está enluado débilmente un electrón. Si la energía de enlace es lo Energía de ionización de centros de impurezas 293 suficientemente pequeña, la "órbita" del electrón será tan grande en comparación con el espaciamiento interatómico, que la trayectoria del electrón alrededor del ion donador 2 abarcará muchos átomos. En estas circunstancias, es correcto pensar que el electrón está sumergido en un medio uniforme polarizable cuya constante dieléctrica K, es la constante dieléctrica macroscópica del cristal semiconductor, ya que la fuerza electrostática entre el ion donador y el electrón entonces se modificará en promedio, por la polarización de los muchos átomos que intervienen. La representación es similar a la de un átomo de hidrógeno dentro de un medio uniforme continuo, cuya constante dieléctrica es " si se puede imaginar esta situación. Esta representación será válida siempre y cuando K tenga tal magnitud que las órbitas de Bohr sean grandes en comparación con el espaciamiento interatómico. Ahora se puede calcular el tamaño de las órbitas y los niveles de energía asociados de acuerdo con la teoría de Bohr que se vio en la sección 4.5. Sería más exacto usar la mecánica ondulatoria del átomo de hidrógeno para estos cálculos; pero puesto que se sabe que la teoría de Bohr y el promedio de la mecánica ondulatoria de las distancias nucleares electrónicas son casi las mismas, se puede confiar en que la teoría simple de Bohr dará respuestas adecuadas para esta situación que es muy similar. La condición de cuantización para la cantidad de movimiento angular orbital se aplica en ambos casos, de modo que la ecuación (4.5-2) sigue siendo correcta, a condición de que la masa electrónica se substituya por m~. Por otra parte, debido a la polarización del cristal, la fuerza electrostática entre el ion donador y el electrón enlazado se reduce en un factor ", haciéndose e2 /Kr~, de tal manera que la ecuación (4.5-3) ahora se debe escribir como sigue (9.4-1) A continuación, las ecuaciones (9.4-1) y (4.5-2) se pueden resolver como ecuaciones simultáneas para rn y wn, dando [(en analogía con (4.5-4) y (4.5-5)], (9.4-2) y m:e 4 Wn=~li3 2 n K (9.4-3) Las energías cinética y potencial ahora se pueden evaluar como se hizo en (4.5-6) y (4.5-7), recordando, sin embargo, que la energía potencial ahora está dada por - e2/K.rn, por lo cual la energía total es (9.4-4) La teoría de Bohr para el átomo de hidrógeno se expresa mediante las ecuaciones anteriores con m~= m 0 y K = l. De acuerdo con (9.4-2), es ev.idente que las 2 Aunque describe la situación, esto no constituye un buen lenguaje de mecánica cuántica; sería más exacto decir que la función de onda del electrón se extiende sohre muchas distancias interatómicas, de tal manera que se incluyen muchos átomos dentro de la región en donde la densidad de probabilidad es grande. 294 Semiconductores electrónicos uniformes en equilibrio órbitas de Bohr para el centro donador son más grandes que las órbitas del hidm. geno por un factor K y también por un factor m 0 /m~. Para el germanio tipo 11. K= 16 y m~~ m 0 /4, de tal manera que el radio de la primera órbita de Bohr es 64 veces el radio de la primera órbita de Bohr del hidrógeno. El valor del hidrógeno ea 0.528A, de tal suerte que el valor para el átomo donador en el germanio es alredodor de 34 A. En efecto, esto es considerablemente mayor que la distancia interátomica (que es más o menos 2.44A para el germanio), de donde, esta representaciÓII del centro donador está justificado en este caso desde el punto de vista físico. La energía de ionización del centro donador, de acuerdo con (9.4-4), es menor que la del átomo de hidrógeno por un factor 1/K 2 y también por un factor m~/m 0 • Para el caso del germanio, esto representa (1/256) • (1/4) = 1/1024. Entonces, podría esperarse que la energía de ionización para el estado basal de un átomo donador sea aproximadamente 1000 veces menor que la del estado basal del átomo de hidrógeno (13.6 eV). En consecuencia, se llega a la cantidad 0.013 eV para la energía de ionización de un átomo donador en el germanio. Este valor concuerda aceptablemente con los valores determinados en la práctica y que se obtuvieron por la medición de concentraciones de portadores en función de la temperatura y por la absorción óptica en el infrarrojo, según lo indica la tabla 9.1. Los valores más elevados de energía de ionización observados para el silicio, se explican en parte por la constante dieléctrica menor (K = 12) de este material, y en parte por las masas efectivas más grandes de los electrones del silicio. Las características de los centros receptores se pueden comprender siguiendo el mismo razonamiento, utilizando una representación que comprenda un ion receptor negativamente cargado y un hueco de carga positiva dentro de un medio dieléctrico uniforme. TABLA 9.1. Energías de ionización de centros donadores y receptores en Ge y Si Impureza Ge Si p As Sb 0.012 eV 0.0127 0.010 0.045 eV 0.05 0.039 B Al Ga In 0.0104 0.0102 0.0108 0.0112 0.045 0.06 0.07 0.16 Por tanto, se puede considerar que los electrones cedidos por átomos donadores se originan en estados donadores localizados dentro del vacío de energía prohibida, a unas cuantas centésimas de electrón volt por d•bajo de la banda de conducción. De igual manera se puede considerar que los huecos cedidos por los átomos receptores se crean cuando los electrones, que normalmente deberían ocupar los estados cercanos a la parte superior de la banda de valencia, se desplazan a niveles receptores que estaban vacíos en un principio, y cuya energía se localiza a unas cuantas centésimas de electrón volt por encima de la banda de valencia. Este patrón de niveles donadores y receptores se ilustra en la figura 9.8(a). La representación correspondiente de la densidad de estados aparece en la figura 9.8(b). Estadística de los semiconductores con impurezas E t 295 Banda de conducción Electrones _ / de conducción •e ""'""'~-=--=-~:.__-=--- Ee ----~Niveles donado::s ... Electrones de la banda de valencia que ocupan los niveles receptores f /Niveles _ _ _ _¿ _ r~eptores •., •• •• L Banda de valencia (a) Figura 9.8. 9.5 (b) (a) Diagrama de bandas de energía de un semiconductor con impurezas indicando los niveles donador y receptor, (b) curva correspondiente a la densidad de estados. ESTADISTICA DE WS SEMICONDUCTORES CON IMPUREZAS Antes de estudiar la mecánica estadística verdadera de los semiconductores con impurezas, es necesario examinar una característica sutil de la estadística de ocupación de los niveles donadores y receptores. Si se confinara el estudio a los niveles donadores uno se sentiría tentado a llegar a la conclusión de que la probabilidad de ocupación asociada con dichos niveles estaría dada por la función de equilibrio de Fermi (5.5-20), siendo e= ea. Sin embargo, esto no es del todo correcto, debido a la degeneración del espín de los niveles donadores. Existen en realidad dos estados cuánticos asociados con cada nivel de impurezas donadoras correspondientes a las dos orientaciones del espín permisibles del electrón sobre el átomo donador. No obstante, tan pronto como se ocupa uno de estos estados, se excluye la ocupación del otro, ya que los requisitos de valencia del ion donador se satisfacen con un solo electrón. Esta situación altera el problema estadístico que conduce a la función de distribución. Sea un sistema que tiene niveles de energía de este tipo, como se ilustra en la figura 9.9. Se supondrá que los electrones que ocupan los niveles son partículas Figura 9.9. No. nivel de energía 2 3 4 1------1 1----------11 n Energía ., •z .3 .4 ., Degeneración g, 9z g3 g4 9¡ glt No. de electrones N, Nz N3 N4 N¡ N" ." Niveles de energía y notación usada en los cál..,ulos de la sección 9.5. 296 Semiconductores electrónicos uniformes en equilibrio indistinguibles y que existen N¡ electrones en el iésimo nivel cuya degeneración es g¡. El número de formas de insertar el primer electrón en los estados cuánticos pertene-cientes al iésimo nivel, es g¡; el número de maneras de colocar el segundo es g¡- ~ dado que la ocupación del primer estado por el primer electrón excluye la ocupación del estado de espín opuesto; el número de maneras de insertar el tercero es g¡- 4 y así sucesivamente. Para el iésimo, el número será g¡- 2N¡ + 2. El número total de modos de arreglar N¡ electrones no distinguibles en g¡ estados, en estas circunstancias, es g¡(g¡- 2)(g¡- 4) ··· (g¡- 2N¡ + 2) N¡! (9.5-1) El factor N¡! del denominador se incluye porque las distribuciones que son idénticas a excepción de la permutación de los electrones entre ellas mismas no deben contarse como distribuciones diferentes, ya que los electrones no son distinguibles unos de otros. El número total de formas de lograr una distribución en la que se tengan N 1 , N 2 • • • N n electrones en los niveles 1, 2, • • • n, es el producto de los factores de la forma (9.5-1) sobre los niveles del sistema. Esta es precisamente la cantidad Q(N1 N 2 • • • Nn) del capítulo 5 [véase, por ejemplo, (5.5-3)]. Por tanto. para este sistema se tiene (9.5-21 La función de distribución resultante se determina maximizando In Qa como antes, utilizando el método de los multiplicadores lagrangeanos que se desarrolló en el capítulo 5, siendo el resultado en donde Et es la energía de Fermi definida del modo acostumbrado. Para los niveles donadores, el número de átomos donadores es la mitad de la cantidad de estados de espín o sea, 1/2g¡, de tal manera que para este sistema se puede escribir n d - N- d 1 + te(~d E¡)/kT (9.5-4) en donde Na es la concentración de átomos donadores de impurezas, Ea es la energía de los niveles donadores y na es el número de electrones por unidad de volumen que ocupan los niveles donadores (es decir, la concentración de donadores no ionizados). Evidentemente, la función de Fermi está modificada por la presencia del factor 1/2 que va en el denominador antes del término exponencial. De manera similar, se puede demostrar que si Na es la concentración de átomos de impureza receptores y Ea la energía de los niveles receptores, la concentración de huecos asociada con Jos átomos receptores (o sea, la densidad de los sitios receptores no ionizados) Pa, será Pa = } + te<•! Ea)/kT • (9.5-5) Estadística de los semiconductores con impurezas 297 La densidad de estados asociada con los niveles donadores y receptores se puede representar en términos de las funciones 8- de Dirac por medio de (9.5-6) y (9.5-7) Estas ecuaciones significan que no existen niveles donadores o receptores a energías que no sean ea y ea, y que la cantidad total de estados cuántico donadores y receptores por unidad de volumen es 2Na y 2Na, respectivamente. Si la aproximación de Boltzmann es válida, tanto para la banda de conducción como para los niveles donadores (es decir, si el nivel de Fermi está a varias unidades kT por debajo de ea), el factor exponencial del denominador de la expresión en (9.5-4) es mucho mayor que la unidad, y por ende, puede hacerse caso omiso de este último; en donde, la ecuación (9.5-4) se puede escribir como (9.5-8) Puesto que la concentración de electrones en la banda de conducción está dada por (9.3-6), se puede escribir la relación de na, el número de electrones asociado con los donadores no ionizados, y n 0 + na, que es el número total de electrones libres y débilmente enlazados como sigue (9.5-9) Ahora, ec - ea es la energía de ionización de los donadores que por lo general es del orden de kT o un poco más pequeña; de donde, el factor exponencial anterior es del orden de la unidad. Si Nv ~-!-Uc, la relación entre el número de electrones en donadores no ionizados y el número total será muy pequeña. Puesto que a 300°K Ue es del orden de 10 19 cm- 3 , esta condición se satisface a esa temperatura para todas las concentraciones de impurezas donadoras que son reducidas en comparación con esta cifra. En estos casos, es evidente que los donadores están casi totalmente ionizados y por lo general es más conveniente y exacto proceder sobre la suposición de que su ionización es completa, haciendo que na sea igual a cero. A temperaturas muy bajas, el factor exponencial de (9.5-9) puede ser apreciablemente más pequeño que la unidad y el criterio para la ionización completa de los donadores se debe escribir en la forma más general (9.5-10) De modo similar, a condición de que la aproximación de Boltzmann para los huecos sea válida tanto para la banda de valencia como para los niveles receptores, se puede demostrar que estos últimos quedan prácticamente ionizados por completo siempre que (9.5-11) A menos que la temperatura sea muy baja, esto equivale al requisito Na ~tUv. En casi todas las circunstancias el nivel de Fermi quedará dentro de la banda prohibida, a muchas unidades kT lejos tanto de los niveles receptores, como de los 298 Semiconductores electrónicos uniformes en equilibrio donadores, y las impurezas receptoras y donadoras que puedan estar presentes estarán ionizadas casi por completo. En un semiconductor en equilibrio debe haber un hueco térmico o un ion donador positivamente cargado por cada electrón libre, y un electrón térmico o un ion receptor negativamente cargado por cada hueco libre. Por tanto, todo el cristal debe ser eléctricamente neutro. Esta condición de neutralidad eléctrica se puede expresar igualando a cero la suma algebraica de todas las cargas negativas y positivas. por lo cual (recordando que la concentración de los donadores ionizados es Na- na y la de los receptores ionizados es Na - Pa), (9.5-12) Para todas las temperaturas, excepto las más bajas, y también para los valores más elevados de concentración de impurezas, la aproximación de Boltzmann será valida para las bandas de conducción y valencia, y también para los niveles donadores y receptores, de donde, las concentraciones de donadores y receptores no ionizados, Pa y na, se pueden omitir en (9.5-12), lo cual da (9.5-13) o bien, si se emplea (9.3-6) y (9.3-15), (9.5-14) Si se hace que IX = e•¡/kT, Pe = e -•clkT y (9.5-15) entonces, (9.5-14) se puede escribir en la forma (9.5-16) Al resolver esta ecuación cuadrática para o: y tomar el logaritmo del resultado, se obtiene (9.5-17) Se debe escoger el signo positivo del radical de (9.5-17), ya que cuando Na= Na =O, ee¡fkT debe ser una cantidad positiva. Esto se puede expresar de un modo más satisfactorio haciendo notar que (9.5-18) Al utilizar esta relación y substiuir los valores dados por (9.5-15) para f3v y f3c. (9.5-17) se puede expresar como sigue (9.5-19) Estadística de los semiconductores con impurezas 299 Como se puede ver de (9.3-23), los dos primeros términos del lado derecho de esta ecuación representan el nivel de Fermi E¡¡ para un semiconductor intrínseco y, ya que de acuerdo con (9.3-17) y (9.3-20), n¡=..JUcUve-i::.ef 2 kT, (9.5-19) se puede escribir fmalmente como e1 = e1 ¡ + kT se nh -l(Nd-2n¡Na) . (9.5-20) ~.---------------- ~--------------- ~----------------- ~"---------------- ., ---------- .. --------- t'f - - - - - - - - - - ~------------- (a) (tipo·nl Figura 9.10. (b) (tipo-p) Posiciones relativas de los bordes de banda, nivel intrínseco de Fermi y nivel real de Fermi en (a) semiconductores tipo n y (b) tipo p. Esta expresión da el nivel de Fermi para un semiconductor con impurezas dentro del rango en el que se satisface la aproximación de Boltzmann y los donadores y receptores se pueden considerar como totalmente ionizados. Las cantidades n 0 ,p 0 ,nd y Pa se pueden obtener fácilmente a partir de (9.3-6), (9.3-15), (9.5-4) y (9.5-5) una vez que se ha determinado el nivel de Fermi. Puesto que senh-lx es positivo para x >O y negativo para x <O, se ve claramente que E¡> E¡¡ para semiconductores tipo n (Nd - Na > O) y E¡< E¡¡ para semiconductores tipo p (Nd -Na< 0), como se ilustra en la figura 9.10. Si la cantidad de donadores y receptores es idéntica, la función senoidal hiperbólica inversa desaparece y el material se comporta exactamente como un semiconductor intrínseco en lo que respecta a las poblaciones de electrones y huecos. En estas condiciones, se dice que las impurezas tipo n y p están plenamente compensadas. Si la densidad neta de impurezas INd- Nai es mucho mayor que n¡, el número de portadores térmicamente excitados será pequeño en comparación con la cantidad total; en este caso, el argumento de la función senoidal hiperbólica inversa de (9.5-20) es muy grande. Puesto que senh- 1x ~±In 12xl para valores grandes de x, es obvio que en estas circunstancias (9.5-20) se convierte en (9.5-21) en donde el signo más se usa para el material tipo n (Nd >Na), y el signo menos para el tipo p (Na> Nd). Se dice que un material semiconductor de esta naturaleza es un semiconductor fuertemente extrínseco y el rango de aplicabilidad de (9.5-21) se cita a menudo como el rango extrínseco. Por supuesto, la densidad de portadores en las bandas de conducción y valencia se puede encontrar substituyendo la expresión (9.5-17) en lugar del nivel de Fermi en (9.3-6) y (9.3-15). Se pueden determinar estas cantidades también en la condición de neutralidad eléctrica (9.5-13), con la ayuda de (9.3-20). Por ejemplo, cuando se substituye Po= nl/n 0 en (9.5-13), se obtiene (9.5-22) 300 Semiconductores electrónicos uniformes en equilibrio que se puede resolver para n 0 , dando (9.5-23) Para resolver la ecuación' cuadrática, es necesario seleccionar el signo positivo para el radical, ya que el resultado debe reducirse a + n¡ para Nd =Na =O. Del mismo modo, cuando se substituye n0 = n[ jp 0 en la ecuación de neutralidad de carga, se puede demostrar que (9.5-24) De acuerdo con estas fórmulas, es evidente que cuando Nd- Na= O, no=Po =n¡. Este es el caso de la compensación total (o, si Nd =Na= O, de un semi· conductor intrínseco). Si N d - Na >O, n 0 >Po como es de esperarse en un se· miconductor de impurezas tipo n; si Nd -Na< O, Po > n 0 como se requiere en el caso de un semiconductor tipo p. Para materiales fuertemente extrínsecos, estas fórmulas se simplifican mucho. Por ejemplo, si Nd -Na;;» n¡, como sucede para una muestra de un fuerte tipo n, entonces, (9.5-25) y en tanto que para un material fuertemente p, en donde Nd -Na es grande y negativo, y n~ no~ N ~N. a (9.5-26) d Con el fin de conservar una generalidad total, se ha supuesto desde el principio que están presentes tanto impurezas donadoras como receptoras. No obstante, en muchos casos, sobre todo los relacionados con cristales en los que se han incorporado intencionalmente impurezas de un tipo, la concentración del otro tipo de impurezas puede desecharse por completo y, en efecto, igualarse a cero, en todas las fórmulas de esta sección. 9.6 EL CASO DE LA IONIZACION INCOMPLETA DE NIVELES DE IMPUREZA (TEMPERATURA MUY BAJA) Es posible que a temperaturas muy bajas no exista la suficiente energía térmica disponible para conservar la ionización completa de los niveles de impurezas donadoras y receptores como lo determinan los criterios (9.5-10) y (9.5-11). Por ejemplo, a la temperatura del cero absoluto, en un semiconductor tipo n, los niveles donadores deben estar totalmente ocupados y la banda de conducción vacía por completo de electrones. Estas dos condiciones no se pueden alcanzar a menos que el nivel de Fermi quede entre los niveles donadores y la banda de conducción, como se rl~scribe en la figura 9.11. En este .caso, la aproximación de Boltzmann ya no se puede usar para describir la probabilidad de aplicación asociada con los niveles donadores, ya que el nivel de Fermi se encuentra ahora más bien arriba que debajo de los niveles de energía donadores. Sin embargo, la aproximación de Boltzmann se puede seguir aplicando a los electrones de la banda de conducción debido a que el nivel de Fermi El caso de la ionización incompleta de niveles de impureza 301 .t •• -r-----==.t ., •• f 0 =O Figura 9.11. 1/2 Función de distribución en un semiconductor tipo n a temperatura muy baja. pennanece a muchas unidades kT debajo de la base de la banda de conducción; en relación a esto se debe recordar que kT es sólo aproximadamente 0.001 eV a 10°K. Se analizará en detalle el caso de un semiconductor de tipo puramente n en donde Na= O, y se supondrá que T es tan baja que puede eliminarse la concentración de huecos creados térmicamente. Por supuesto, ya que Na =O, Pa debe desvanecerse también. Si se hace que Na = Pa =Po = O en (9.5-12), se puede escribir (9.6-1) Si se usa (9.3-6) y (9.5-4) para expresar n 0 y nd en esta ecuación, se obtiene (9.6-2) Sin embargo, puesto que 1- 1 1 1 + te.<•• .,¡¡kT- -:-1-+---=2-e--;:<•:-·-.:-,"Jtk..,.T' (9.6-3) (9.6-2) se puede convertir en (9.6-4) Si se hace que y (9.6-5) (9.6-4) se convierte en (9.6-6) 302 Semiconductores electrónicos uniformes en equilibrio Esta ecuación se puede resolver para a de tal modo que dé (9.6-7) Se debe escoger el signo más para que a= e"tfkT sea positiva y, por ende, e1 sea real. Ahora, por definición, (9.6-8) -- Al tomar el logaritmo de ambos lados de (9.6-7), usando (9.6-8) y volviendo a la notación original con (9.6-5), se puede obtener finalmente e = -1 (e + e ) + -kT In _Nd - kT senh _ 1 f 2 e d 2 2Ue (J Ue e _li•<flkT ) _ 8Nd ' (9.6-9) en donde !::.e¡ = Ec - ed es la energía de ionización de los donadores. La densidad de los electrones libres en la banda de conducción se puede calcular a partir de (9.3-6). En el cero absoluto, (9.6-9) da e1 = t(ec + ed), lo que significa que el nivel de Fermi está a la mitad entre los niveles donadores y la banda de conducción. Al aumentar la temperatura, el nivel de Fermi aumenta ligeramente (no obstante, permaneciendo por debajo de Ec) y luego decrece desplazándose hacia abajo por los niveles donadores hacia el centro de la banda prohibida. Para temperaturas en que el nivel de Fermi esté a varias unidades kT por debajo de la energía de los donadores ed, punto en el que los donadores están casi completamente ionizados, la ecuación (9.6-9) se reduce aproximadamente a (9.5-21). La prueba de este enunciado se asigna como ejercicio al lector. Se puede demostrar de manera similar, que para un semiconductor tipo p en estas mismas circunstancias, el nivel de Fermi a la temperatura cero queda hacia la mitad entre los niveles receptores y la banda de valencia y que, al aumentar la temperatura, se mueve primero un poco hacia abajo y luego ascendentemente acercándose al valor dado por (9.5-21) conforme los niveles receptores se ionizan por completo. En semiconductores tipo n y tipo p, el nivel de Fermi tiende al valor intrínseco e¡¡ como lo establece (9.3-23) a temperaturas lo suficientemente altas, ya que a una temperatura elevada, el número n¡ de portadores térmicamente excitados tendrán un exceso notable en relación con el número INd- Nal con el que contribuyen las impurezas donadoras y receptoras. Al exceder este punto, el comportamiento del material será muy aproximado en todos los aspectos al de un semiconductor intrínseco. No obstante, en algunos casos esta temperatura de transición puede exceder el punto de fusión del semiconductor. El nivel de Fermi, como lo determinan (9.6-9) en el rango de temperaturas bajas y (9.5-20) a temperaturas elevadas, se ilustra como una función de temperatura para materiales tipo n y tipo p en la figura 9 .12. 9.7 CONDUCTIVIDAD La densidad de corriente debida a huecos y electrones es igual al producto de su densidad de carga y velocidades respectivas. Por tanto, la densidad de corriente o Conductividad i., i., (T) 303 (T) -r ~r------------------------- -r •• o (o) tipo-n Figura 9.12. (b) tipo-p Variación de la energía de Fermi en función de la temperatura para semiconductores (a) tipo n y (b) tipo p, de varias densidades de impurezas. Las curvas marcadas con "1" corresponde!• a densidades de impurezas relativamente bajas, las marcadas con "2" a densidades intermedias, y las marcadas con "3" a densidades de impurezas relativamente altas. la densidad de carga por unidad de tiempo transportada por huecos y electrones es (9.7-1) y (9.7-2) en donde Pn y Pp se refieren a las densidades de carga asociadas con las densidades de electrones y huecos n y p, y Vn y vP son las velocidades vectoriales promedio de los electrones y los huecos, respectivamente. Puesto que la velocidad electrónica promedio es - J.LnE y la velocidad promedio de los huecos es J.LpE, en donde J.Ln y J.Lp son las movilidades del electrón y el hueco y E es el campo, {9.7-1) y {9.7-2) se puede escribir como sigue (9.7-3) (9.7-4) por lo cual, la densidad total de corriente eléctrica 1 se puede expresar como 1 = e{nJ.Ln + PJ.Lp)E = aE. (9.7-5) La conductividad eléctrica a está dada entonces por (9.7-6) 304 Semiconductores electrónicos uniformes en equilibrio Las movilidades P.n y P.p de las fórmulas anteriores se definen como y (9.7-7) en donde 1'n y Tp son los promedios ponderados de los tiempos de relajación 7 n para electrones y 7 P para huecos sobre la distribución Maxwell-Boltzmann calculadas como lo establece la ecuación (7 .3-12). También se debe observar que n y p son los valores instantáneos reales de la concentración de huecos y electrones que no necesariamente son idénticos a las densidades de equilibrio de huecos y electrones n 0 y Po. Sin embargo, hasta ahora se ha supuesto que no existen gradientes de densidad de portadores (que originarían corrientes de difusión). Por supuesto, si las densidades de portadores son las relacionadas con el estado de equilibrio, se descubrirá que (9.7-8) es el valor correspondiente de conductividad. Es necesario establecer esta distinción. porque es posible crear densidades de portadores en exceso de los valores de equilibrio en los semiconductores, como se verá más tarde. Para un semiconductor intrínseco con densidades de portadores iguales a los valores de equilibrio, n 0 = p 0 = n¡ y (9.7-8) se convierte en (9.7-9) en donde b se define como la relación entre la movilidad de los electrones y los huecos, es decir, b = /ln/ /lp· (9.7-10) Si se usa (9.3-21), (9.7-9) se puede escribir en la siguiente forma (9.7-11) Puesto que la movilidad P.p tiene casi siempre una dependencia de la tempera· tura que anula en su mayor parte la variación de temperatura '['3/ 2 del término que precede al factor exponencial y, puesto que b no depende mayormente de la temperatura, la variación anterior de a0 como una función de 1/T es esencialmente exponencial. De donde, una gráfica semilogarítmica de a 0 en función de 1/T da una línea recta con una pendiente fle/2k, y el valor de la banda prohibida !le puede determinarse con mucha precisión valorando la pendiente de una gráfica experimentalmente medida de ln a 0 en función de 1/T en el rango intrínseco. Para un semiconductor que no es necesariamente intrínseco, sino que tiene densidades de huecos y electrones que corresponden a los valores de tquilibrio n 0 ,p 0 , la conductividad está dada por (9.7-8). Usando (9.7-10) para ebninar P.n, y luego substituyendo las expresiones (9.5-23) y (9.5-24) para n 0 y p 0 , la conductividad se puede escribir como CTo = e¡lp (bno +Po)= e/lp [~ (b- l)(N 4 - Na)+ (b + l)J~(N4 - N + n/ J. 0) 2 (9.7-12) Conducdwdad 305 Temperatura en °K Temperatura en °K 33 3 1000300 78 20 4 10 14.3 10 333 18300 78 204 14 3 10 6 4 2 o u :e •:::1 u o ~ E -... u ' .§ .e eQ) E ~ u . , e o a. 11 'C "'E' "'u ·;::: Q) "'::J 'C "C u "C "' E e o o ~ ~ 0001~----~----~----~----~----~ o 00<! 0.04 006 0.08 1 1 Temperatura en °K (a) 002 0.10 (b) 0.04 0.06 008 t 1 Temperatura en °K .... u 1 > ;:;... E u eQ) "C "' 10 4 ~---------------------------+~~~~~~ ~ ·:; o :¡¡;; 61 58 Nd ~ 10 11 cm-z I0 3 ~~~~~~A---~~~~~------~--__J 10 20 30 40 50 60 80 100 200 300 (e) Figura 9.13. Temperatura en °K (a) Conductividad eléctrica, (b) concentración de portadores y (e) movilidad de electrones para una serie de muestras de germanio tipo n que cubren una amplia variación de contenido de impurezas donadoras. [De acuerdo con E. M. Conwell, Proc. I.R.E., 40: 1327 (1952).] 01 306 Semiconductores electrónicos uniformes en equilibrio Véase ahora un semiconductor tipo n para el que Nd- Na es positivo. A temperaturas bajas, n¡ ~Nd- Na, por lo que, de acuerdo con (9.7,12), a 0 ~ (NdNa)beJlp = (Nd- Na)eJln, que es independiente de la temperatura, excepto en lo que Jln pueda depender de T. Por tanto, el semiconductor es un material fuertemente extrínseco y la mayoría de sus portadores se originan en los átomos de impurezas. Al aumentar la temperatura, n¡ aumenta con gran rapidez, de acuerdo con (9.3-21), después llegará un momento en que será igual y luego sobrepasará a NdNa. Para temperaturas tales que n¡';PNd -Na, (9.7-12) da a 0 ~eJlpn¡(b + 1), que es el mislno valor dado por (9.7-9) para un semiconductor intrínseco. Entonces la conductividad aumenta con gran rapidez al incrementarse la temperatura debido al rápido aumento de n¡. La muestra es ahora básicamente un semiconductor intrínseco. La transición entre estos dos extremos de comportamiento se produce a la temperatura en que n¡ = Nd- Na. Al aumentar la densidad de impureza Nd- Na, esta temperatura de transición aumenta y para diferentes substancias semiconductoras con la misma densidad de impurezas, la temperatura de transición aumenta al incrementarse la banda prohibida /),¡¿ ya que la temperatura necesaria para generar una densidad dada de portadores intrínsecos aumenta con /),¡¿_ Se puede demostrar que se sigue el mismo comportamiento cualitativo de (9.7-12) en los materiales tipo p, en cuyo caso Nd- Na es negativo. En la figura 9.13 se ilustra una gráfica semilogarítmica de la conductividad en función de 1/T como lo predice (9.7-12) para·varias muestras con diferentes contenidos de impurezas. A temperaturas extremadamente bajas (menos de aproximadamente 30°K), no existe la suficiente energía térmica disponible para mantener la ionización de los niveles donadores y receptores. En este rango de temperatura, la conductividad desciende de nuevo con rapidez al reducirse la temperatura, conforme los electrones libres y los huecos se "congelan" de las bandas de conducción y valencia hacia los niveles donadores y receptores. En cristales con una densidad de impureza muy elevada, las funciones de onda de los electrones de átomos donadores cercanos o huecos de átomos receptores cercanos pueden superponerse apreciablemente. El resultado de esto es la ampliación del nivel donador o receptor a una banda angosta de energía, al igual que los niveles atómicos de energía se ensanchan para formar una banda en la aproximación de enlace filme, conforme las funciones de onda electrónicas de átomos vecinos comienzan a superponerse. Puesto que existe el doble de estados en estas bandas que electrones (o huecos), se puede observar una pequeña conductividad residual de la banda de impllrezas en la banda de impurezas parcialmente llena en la región de temperaturas extremadamente bajas, en donde los electrones y los huecos se "congelan" de las bandas de conducción y valencia hacia los niveles donadores y receptores. 9.8 EL EFECTO DE HALL Y LA MAGNETORRESISTENCIA En la seccwn 7.6 se estudió el efecto de Hall en los gases de electrones libres para el caso en que los electrones y los huecos tienen la misma componente de velocidad x. Este análisis conduce a la expresión (9.8-1) para el campo transversal de Hall, en donde ! 0 es la densidad de corriente, B 0 la inducción magnética y R la constante de proporcionalidad denominada coeficiente de Hall. En la figura 7.3 se ilustra la orientación de la muestra, la corriente y los El efecto de Hall y la magnetorresistencia 307 campos. En el caso sencillo que se vio en la sección 7 .6, en donde se supuso que los portadores de carga eran electrones, se obtuvo la expresión 1 R=-n0ec (electrones) (9.8-2) para el coeficiente de Hall. De acuerdo con el análisis de la secc10n 7.6, se ve claramente que si los portadores de carga son huecos positivos, cuya concentración es p 0 , la expresión para el coeficiente de Hall sería 1 R=Poec (huecos). (9.8-3) Y a se señaló que el efecto de la distribución de velocidades se despreció al obtener estos resultados. Ahora se incluirá el efecto de la distribución de velocidad para volver a determinar el coeficiente de Hall de un semiconductor. Además, hay que tener en cuenta que en un semiconductor pueden estar presentes simultáneamente portadores de carga positivos y negativos. Además de estos efectos que tienen un interés inmediato para este estudio, existen otras dos complicaciones que se deberán resolver eventualmente. Hasta ahora, en todos los cálculos de población de portadores y transporte que se han llevado a .:abo, siempre se ha supuesto que las superficies de energía constante dentro del espacio de la cantidad de movimiento o espacio k, eran esféricas. Esta suposición se 0rigina naturalmente cuando el valor mínimo de energía en la zona reducida de Brillouin ocurre en el punto central k = O. Sin embargo, existen substancias, incluyendo al germanio y al silicio (sólo en las bandas de conducción), en las que el mínimo de energía se produce, no en el origen, sino en un grupo de puntos cristalográficamente equivalentes en otras partes de la zona de Brillouin. En tales casos, las superficies de energía constante en las cercanías de los mínimos de energía pueden ser elipsoidales más bien que esféricas. Esto introduce una anisotropía en la masa ~fectiva asociada con cada elipsoide; aunque los portadores se comportan como partículas libres en el sentido de que la variación de e con k es parabólica en cualquier dirección de movimiento, tienen una masa efectiva diferente a lo largo de cada una de estas direcciones. A pesar de que la anisotropía en las propiedades de transporte se pierde cuando se suman los elipsoides de energía asociados con todos los puntos mínimos de energía, el procedimiento para computar los factores de densidad de ~stados y promediar las propiedades de transporte sobre las velocidades, se debe modificar para tener en consideración esa configuración diferente de las superficies de energía constante. Además de esto, las bandas de valencia del germanio y el silicio se componen realmente de dos bandas distintas superpuestas en donde cada una de éstas se asocia .:on una masa efectiva distinta. Aunque las superficies de energía constante para estas dos bandas son aproximadamente esféricas cerca del punto máximo en k = O, existen en realidad dos especies de huecos presentes (huecos "ligeros" y huecos ··pesados" correspondientes a las dos masas efectivas) en forma simultánea. Cualquier teoría de procesos de transporte que intente explicar a fondo los abundantes datos experimentales que existen en este campo en relación con el germanio y el silicio, debe necesariamente tener en cuenta estas dos complicaciones adicionales. Sin embargo, para principiar será suficiente ampliar el cuadro del efecto de Hall y los fenómenos relacionados con el mismo, para cubrir de un modo simultáneo a huecos y electrones e incluir el efecto de la distribución de velocidades. Por tanto, se seguirá suponiendo que se maneja un semiconductor simple con superficies -ie energía esféricas tanto en la banda de conducción como en la de valencia y que 308 Semiconductores electrónicos uniformes en equilibrio sólo se tiene una variedad de electrones y huecos. Más tarde se indicará cómo estos resultados se puede ampliar para admitir las dos dificultades adicionales que se acaban de mencionar. En primer lugar se considerará un solo tipo de portador (se escogió a los huecos) y se incorporará el efecto de la distribución de velocidad. La forma más evidente para proceder es a partir de la ecuación de Boltzmann con el término de la fuerza de Lorentz (7.6-2). No obstante, es más sencillo y provechoso utilizar otro método 3 que principia con la ecuación de movimiento para un hueco en presencia de un campo eléctrico uniforme E y una inducción magnética uniforme 8 0 . Esta ecuación se puede escribir como sigue * dv e t e F = mP -d = eE + - v X B0 • (9.8-4) Si se supone que la muestra, la corriente y el campo magnético están orientados como se indica en la figura 7.3, es obvio que B0 tiene sólo una componente z y (9.8-4) se reduce a dos ecuaciones para las componentes x y y de la velocidad, que tienen la forma (9.8-5) (9.8-6) en donde roll = eB 0 /m;c. (9.8-7) Este conjunto de ecuaciones se puede resolver más fácilmente multiplicando (9.8-6) por el número imaginario i y sumando el resultado a (9.8-5). Mediante este procedimiento se obtiene una sola ecuación dV e8 -+ iro 0V = dt m*p (9.8-8) en donde las cantidades complejas V y 8 se defmen mediante V= v,. + iv7 8 =E,.+ iE,. y (9.8-9) La ecuacton (9.8-8) se resuelve fácilmente multiplicando los dos lados por &wot. El lado izquierdo se puede expresar como la derivada en el tiempo de Veiwot, y la ecuación resultante se integra con respecto al tiempo para dar 1 1 e8 . V t> too = - - e•toor + C . 0mP* 1ro (9.8-10) 3 Véase, por ejemplo, H. Brooks, Advances in Electronics and Electron Physics, Nueva York: Academic Press, Inc. (1955), Vol. VII, página 127 ff. El efecto de Hall y la magnetorresistencia 309 en donde e es una constante de integración. Si se hace que V0 = Vxo + ivyo sea el valor de V en t = O, se puede evaluat en términos de V0 a partir de esta ecuación, lo cual permite escribir {9.8-10) como e V= V.oe-imot + ~* {l _ e-iwot) o 1w0 m, (9.8-11) o Esta expres10n se debe promediar primero sobre la distribución exponencial de tiempos de relajación, lo cual da, en analogía con (7.2-13). f'x' V(t)e- 11'' dt (V) Prom. _Jo sobre t - oo fo e-1/•, dt _ - 1 • 1 + IC.Oot, [V.o+ e~t,] * , m, (9.8-12) en donde 7 P representa el tiempo de relajación para huecos. A continuación se deberá promediar esta expresión sobre la distribución Maxwell-Boltzmann de velocidades. Como siempre, se supondrá que 7 P es una función de la magnitud v; pero es independiente de la dirección, es decir, isotrópica, de donde los promedios asociados con el primer término de (9.8-12) siempre darán un promedio de una función sólo de la magnitud de v por una componente Vxo ( = v0 sen cos cf>) o Vyo ( = v0 sen e sen cf>). Un promedio de esta naturaleza será siempre cero ya que la integral de la expresión resultante sobre la coordenada azimutal cf> siempre se desvanece. Por tanto, en este estudio se puede omitir por completo de este término. Si se separa el segundo término anterior en sus partes real e imaginaria, la parte real se puede identificar como Vx y la imaginaria como vy, de acuerdo con (9.8-9). De donde, se obtiene e (9.8-13) y ésta es la expresión que se debe promediar sobre la distribución de Boltzmann para obtener los valores promedios de Vx y Vy. En la sección 7.3 se vio, utilizando la ecuación de Boltzmann, que si .a:(v) es la cantidad que se va a promediar, el promedio correcto que se debe sacar es (9.8-14) Si no se tiene un campo magnético, entonces, en la expresión (9.8-13), w 0 =O y la ecuación da simplemente las velocidades vx y vy en función de los campos eléctricos Ex y Ey. En este límite, la ecuación debe concordar con (7.3-11) y, en efecto, lo hace, a condición de que 7 P se promedie de acuerdo con lo establecido en {9.8-14). En realidad, como caso general, todos los promedios se deben calcular de esta manera, lo cual conduce a (9.8-15) 310 Semiconductores electrónicos uniformes en equilibrio en donde (9.8-16) y - - e v, = lm(V) = ---;¡; [ ( 1 mP -r:P 2 2 ) E-, - + w 0 -r:P Wo ( 1 -r:P 2 + w 02 -r:P2 ) Ex ] . (9.8-17) Las componentes x y y de la densidad de corriente, en la forma acostumbrada pueden expresarse como y (9.8-18) Como se ilustra en la figura 7.3, en t>l arreglo experimental acostumbrado, la componente y de la corriente es cero, de donde, de acuerdo con (9.8-17), (9.8-19) Al substituir esto en (9.8-16), se obtiene finalmente (9.8-20) Si rp es independiente de v, entonces f(rp) =f(rp) y las ecuaciones anteriores se reducen a los resultados simples e intuitivos (9.8-21) (9.8-22) que concuerdan con (7.3-14) al igual que con (9.8-1) y (9.8-3). Es obvio que la simple expresión del coeficiente de Hall obtenida anteriormente, es correcta aun cuando exista una distribución de velocidades de Boltzmann, a condición de que T sea independiente de la velocidad. También es evidente en (9.8-21), que en este caso la conductividad eléctrica es independiente del campo magnético, es decir, no existe una magnetorresistencia. Sin embargo, generalmente T P depende de la velocidad y, entonces estos resultados ya no son correctos. En tales circunstancias, es más conveniente establecer la suposición de simplificación que consiste en que w 0 T P ~ l. Esta condición se satisTará mejor para valores pequeños de inducción magnética y valores también pequeños de T P que casi siempre se asocian con temperaturas más altas. La condición se satisface normalmente en la mayoría de las substancias en las condiciones experimentales comunes hasta el rango de la temperatura del nitrógeno líquido, aunque también es muy posible violarla, si esto es lo que se desea. Por ejemplo, si B 0 = 10,000 oersteds, T ,, =- JO- 12 seg. (correspondiente a una movilidad del orden de El efecto de Hall y la magnetorresistencia 311 2000) y m;= m 0 , entonces, WoTp::::: 0.2. En este caso, el requisito quedaría marginalmente satisfecho; pero campos más altos y tiempos de relajación mayores darían como resultado su violación. Si se supone que la condición es aplicable, se puede hacer caso omiso de la cantidad w~T~ en (9.8-20) en comparación con la unidad. De donde [expresando w 0 media..tlte (9.8-'i')j, ~::sta expresión se puede escribir como sigue (9.8-23) en donde a 0 = p 0 e 2 rp/m;. Ahora parece que la conductividad eléctrica depende del campo magnético; a este efecto se le conoce como magneto"esistencia. Se puede demostrar que el segundo término entre paréntesis angulares de la expresión anterior es siempre positivo, de tal modo que la conductividad se reduce invariablemente por acción del campo magnético. La ecuación (9.8-23) se escribe con mayor frecuencia de un modo diferente; resolviendo para Ex en función de lx y observando que tl - w~r~)- 1 ::::: 1 + w~r~ para w 0 r P ~ 1, se puede obtener (9.8-24) en donde Po = 1/a0 es la resistividad de campo cero. El coeficiente de magneto"esistencia se define entonces como (9.8-25) De acuerdo con (9.8-24), es evidente que la magnetorresistencia longitudinal de campo pequeño predicha por estas ecuaciones, es proporcional al cuadrado de la inducción magnética B 0 • Desde el punto de vista físico, el efecto de la magnetorresistencia se debe al hecho de que el campo magnético desvía las partículas de un modo ascendente o descendente a lo largo del eje y, en una dirección normal a la dirección del vector de corriente. Las trayectorias resultantes son más bien curvas que rectas y la distancia promedio de arrastre a lo largo de la dirección del flujo de la corriente entre colisiones, por ende, se reduce. Si se emplea la misma aproximación en (9.8-19), el campo de Hall Ey se convierte en (9.8-26) En esta ecuacwn, el campo Ex se puede expresar con exactitud aceptable como lx/a0 , y el término magnetorresistente de (9.8-24) es pequeño en comparación con el término de campo cero para w 0 r P ~ l. Al substituir este valor junto con las expresiones para a 0 y w 0 en (9.8-26), se obtiene E,= RB0 lx (9.8-27) 312 Semiconductores electrónicos uniformes en equilibrio en donde [recordando (9.8-14)] el coeficiente de Hall R está dado por 1 t2 1 (v 2 )(v2 t 2 ) R=----P-=-P 2 Poec (ip) p 0 ec (v 2 tp) 2 • (9.8-28) El coeficiente de Hall lo modifica el factor (~)/(7p) 2 en relación con el valor dado por la teoría del capítulo 7. También es evidente que el valor dado por (9.8-27) es un valor de campo pequeño que sólo es bueno en tanto que w 0 r P <a¡; 1; si w 0 r P iguala o excede a la unidad, el término de magnetorresistencia de (9 .8-241 sería de magnitud comparable al término de campo cero y ya no se podría reemplazar Ex por lx/a 0 en (9.8-26). Ex tendría que expresarse como lx/a, en donde o tiene una fuerte dependencia en función del campo magnético. El coeficiente de Hall entonces presentaría una marcada dependencia en relación al campo magnético. La extensión de estos análisis al caso en que w 0 r ya no sea pequeño en comparación con la unidad, implica muchos cálculos numéricos que no se efectuarán aquí. En el análisis anterior se supuso que los portadores de carga eran huecos. El resultado para un espécimen tipo n, en donde los portadores de carga son electrones, se puede obtener substituyendo en todos los puntos e por -e. Se debe hacer notar que cuando esto se hace, la frecuencia característica (9.8-7) se convierte en - eB 0 /m~c. y por tanto, también se debe substituir w 0 por - w 0 . De esta manera se puede asegurar que cuando los portadores son electrones, se cambia el signo de coeficiente de Hall; pero la forma de los coeficientes de conductividad y magnetorresistencia queda igual. Si el proceso de dispersión dominante es la dispersión de red de modo acústico, de acuerdo con los resultados de la sección 7.5, la trayectoria libre media será básicamente independiente de la velocidad, por lo que Tp(v) = "A.p/v. De donde, es evidente que (v 2 r ~> = ('A.~) = A.~; también, de acuerdo con (7 .3-12) y (7 .3-18), se observa que (v 2 ) = 3kTfm y (v-zr p> = A.p<v> = A.pC, en donde e esta dada por (5.4-20). Si se substituyen estos valores en (9.8-28), se obtiene r~/(7p) 2 = 3rr/8, y el coeficiente de Hall se convierte en 3n 1 R=-8 p0 ec 3n 1 8 n0 ec =---- (tipo-p) (tipo-n ). (9.8-29) El coeficiente de magnetorresistencia no se puede expresar en forma tan simple, porque diverge la integral requerida para evaluar T~ y es necesario un planteamiento más exacto. Esta divergencia se puede evitar señalando que para la dispersión de red, r se hace muy grande a velocidades bajas, en tanto que para la dispersión por impurezas sucede exactamente lo contrario. Entonces, lo que sucede es que por debajo de cierta velocidad, la dispersión de impurezas y no la de red es la que se convierte en el factor dominante y para estas velocidades (a las que se encuentra la divergencia), los promedios se deben calcular basándose en la relación tiempo de relajación, en función de la velocidad asociada, con la dispersión de impurezas en lugar de la que se asocia con la dispersión de red. Por tanto, se podría esperar que la magnetorresistencia se vea afectada enormemente por pequeñas contribuciones de la dispersión de impurezas. En efecto, este es el caso. También puede esperarse que, sobre estas bases, el análisis que da el coeficiente de Hall suponiendo solamente la dispersión de red, sea inválido en la región en donde r P está limitado por la dispersión de impurezas como en realidad sucede. En este caso no existe una divergencia El efecto de Hall y la magnetorresistencio 313 en los promedios relacionados con este rango de velocidad. A menos que la densidad de impurezas sea alta o la temperatura muy baja, la fracción de portadores dentro del rango de velocidades bajas es muy pequeña y el resultado (9.8-29) no se afectará mucho. Ahora se verá un cristal semiconductor que no es fuertemente extrínseco, pero que contiene electrones libres y huecos en concentraciones importantes. En este caso, los huecos y los electrones, se pueden considerar por separado, utilizando exactamente los mismos métodos que se emplearon antes para derivar las ecuaciones (9.8-16) y (9.8-7). Entonces, las componentes de velocidad de los huecos y los electrones se expresan como ecuaciones que tienen la forma de (9.8-16) y (9.8-17), siendo las componentes de velocidad vpx y Vpy de los huecos idénticas a estas ecuaciones, en tanto que las componentes de velocidad de los electrones Vnx y Vny están dadas por ecuaciones en las que e se substituye por medio de -e, m; por m~, r P por r n (en donde el último símbolo se relaciona con el tiempo de relajacwn para los electrones que están dentro de la banda de conducción) y eB 0 /m;c por - eB 0 /m~c. Si también se supone que w 0 r <;¡; 1 tanto para huecos como para electrones, de tal manera que el término w~r 2 pueda desecharse en los denominadores de los promedios, las componentes de la corriente se pueden expresar como sigue (9.8-30) y en donde eB0 Won =-.- y m"C eB0 m,c Wop = -.-. (9.8-32) Si se usa (9.7-7) para eliminar las masas efectivas, y se reacomodan los términos, las ecuaciones anteriores pueden aparecer enJa forma 1" = noeJ.LnEE"- EyW0 n('r;/'rn)- E.xro:n(t!/tn)J + p0 e¡.t,[E.x + Eyw ,(r;¡:c")- E.xw:,(r!tt,)], 0 (9.8-33) y (9.8-34) Dado que el voltaje de Hall se mide en condiciones de circuito abierto, ly = O, como antes, de donde, (9.8-34) se reduce a t2 p t2 n PoJ.L,Wop ::- - noJlnWon ::- E = y r, noJln + Pollp t". E " (9.8-35) 314 Semiconductores electrónicos uniformes en equilibrio Al substituir esta expresión de nuevo en (9.8-33), después de algunas operaciones algebraicas se obtiene en donde a0 , como siempre, está dado por (9.7-8). El término de la magnetorresistencia es ahora mucho más complejo; pero sin embargo, es pequeño en comparación con el valor de campo cero a condición de que Won T n .~ 1 y Wop T p <{ l. El campo de Hall está dado por (9.8-35) y el coeficiente de Hall de campo pequeño se puede obtener reeemplazando Ex por fx/a 0 , como se hizo antes, y en donde la diferencia entre a y a 0 según se representa mediante el término de magnetorresistencia, es despreciable en estas condiciones. Al expresar Won y w 0 p mediante (9.8-32) y eliminando las masas efectivas en favor de las movilidades y los tiempos de relajación por (9.7-7), se obtiene (9.8-37) en donde, como siempre, b = llnlllp· Esta expresión da el coeficiente de Hall en un semiconductor no extrínseco. Se ve que se reduce a (9.8-29) cuando Po ~ n 0 o n 0 ~Po. Si el proceso de dispersión dominante para huecos y electrones es la dispersión de fonones de modo acústico, 4 T'!/(7n) 2 = ~/(7p) 2 = 3rr/8 como se demostró anteriormente y, en este caso, (9.8-37) da (9.8-38) Para un semiconductor intrínseco, Po = n 0 = n¡ y (9.8-38) se reduce a 3n 1 1 - b R=---8 n¡ec 1 + b (Intrínseco). (9.8-39) Para p 0 ~ n 0 , el coeficiente de Hall según lo da (9.8-37), es positivo y para n 0 ~ p 0 es negativo. Se requiere una inversión del signo del coeficiente de Hall para valores de p 0 y n 0 para que se desvanezca el numerador de (9.8-37). Si se satisfacen las condiciones en las que (9.8-38) es válida, esta inversión del signo del campo de Hall se produce cuando Po = b 2 n0 • Puesto que n 0 p 0 = n[, esto representa, sencillamente, Po = bn¡ o bien, n 0 = n¡/b. Si b 1, el punto de inversión no coincidirá exactamente con el punto intrínseco. Por ejemplo, para b > 1, se tendrá un rango de concentración de portadores dentro del cual el signo del coeficiente de Hall es negativo a pesar del hecho de que la muestra sea tipo p. * 4 A pesar de que la fórmula (9.8-38) se usa con mucha frecuencia para analizar mediciones de Hall en materiales no extrínsecos, estas condiciones no siempre quedan estrictamente satisfechas, sobre todo debido a la presencia de una dispersión de fonones de modo óptico. El efecto de Hall y la magnetorresistencia 315 Además de cualquier interés fundamental que pueda despertar, el efecto de Hall es importante debido a que permite un método práctico para saber si una muestra es tipo n o tipo p y para determinar la concentración de los portadores. Cuando se combina con mediciones de la conductividad, el efecto de Hall puede usarse también para determinar la movilidad de los portadores de carga. En muestras que son sumamente extrínsecas y en las que el mecanismo de dispersión predominante es la dispersión con fonones de modo acústico, de (9.8-29) es claro que la medición de R se puede emplear directamente para obtener n 0 o p 0 y el tipo de conductividad se obtiene del signo de R. Si hay otros mecanismos importantes de dispersión, entonces, por supuesto, para obtener una medición absoluta de la concentración de portadores, se debe conocer la cantidad ? /(7) 2 asociada con el mecanismo dominante de dispersión y, para poder evaluarla, es necesario saber la forma en que r varía como función de la velocidad. No obstante, el factor ?/(7) 2 no es mucho mayor ni mucho menor que la unidad para cualquier proceso de dispersión conocido que se produzca en la práctica, de tal modo que la medición de la concentración de portadores que sea exacta dentro de aproximadamente un factor de dos, se puede obtener siempre, cualesquiera que sean los mecanismo de dispersión y, CO!l frecuencia esto es todo lo que se requiere. La movilidad de los portadores de carga en muestras extrínsecas se obtiene eliminando la concentración de portadores entre la expresión (9.8-28) y la ecuación a 0 =PoeJlp que se deriva de (9.7-8) cuando se hace caso omiso de la concentración de los portadores minoritarios (en este ejemplo, los electrones). Para un semiconductor tipo p, el resultado es (9.8-40) Para un semiconductor extrínseco tipo n, se puede demostrar también que (9.8-41) El producto ± cRa 0 a menudo se define como la Movilidad de Hall, de donde, ILHn = -cRao (tipo-n) cRa 0 (tipo-p). ILHp = (9.8-42) Las ecuaciones (9.8-40) y (9.8-41) se pueden escribir, entonces como sigue llp = ILHp((ip) 2 /~) (9.8-43) y (9.8-44) Las cantidades llp y Jln son las verdaderas movilidades de arrastre o movilidades de conductividad; por otra parte, la movilidad de Hall es simplemente una cantidad con las dimensiones de la movilidad que se obtiene a partir de cantidades que son muy fáciles de medir en la práctica. Se debe conocer el factor (7)2 /r 2 para convertir la movilidad de Hall en la de arrastre real. Sin embargo, puesto que este factor rara vez se aleja mucho de la unidad, la movilidad de Hall da una indicación 316 Semiconductores electrónicos uniformes en equilibrio aproximada de la verdadera movilidad donde el error producido en la mayoría de los casos se origina en el propio experimento. Las mediciones experimentales de la concentración de portadores y la movilidad de Hall de electrones para muestras de germanio tipo n, en función de la temperatura, se ilustra en la figura 9.11 para una gran variedad de concentraciones de impurezas donadoras. En el caso de muestras no extrínsecas, se procede más o menos en la mi~ forma. A partir de (9.8-37) o (9.8-38), se puede eliminar n 0 o Po por medio de la relación de acción de las masas n 0 p 0 = n~. La ecuación resultante que expresa a n0 1 o p 0 en función de R es de cuarto grado y no se puede resolver analíticamente de un modo sencillo, sino que se debe resolver en cada caso por métodos aproximados o numéricos. Además, existe una ambigüedad en el hecho de que se tienen dos raíces reales en lugar de una. Esto se observa en la figura 9.14, en donde el coeficiente de Hall se ha graficado en función de p 0 ; para un valor dado de R existen siempre dos valores posibles de Po. No obstante, en la práctica es bastante sencillo seleccionar cuál de las raíces es la correcta haciendo una serie de mediciones del R OOin; -Po (escala logarítmica) Figura 9.14. Coeficiente de Hall de un cristal semiconductor en función de la concentración de huecos. efecto de Hall sobre una gran variedad de temperaturas. Además, para obtener las concentraciones de portadores mediante el procedimiento anterior, es necesario conocer la relación de movilidades b. Esto se puede obtener haciendo mediciones independientes de la movilidad de Hall en muestras sumamente extrínsecas tipo n y tipo p o bien, a partir de los resultados de las mediciones de arrastre de portadores en exceso que se verá más tarde. Si n 0 y p 0 se obtienen del coeficiente de Hall, y si se conoce la relación llnfllo = b, la movilidades Jln y Jlp se pueden determinar basándose en los datos de conductividad, según la expresión (9.7-8). 9.9 RESONANCIA DE CICLOTRON Y SUPERFICIES ELIPSOIDALES DE ENERGIA Se puede hacer que los electrones y los huecos de los semiconductores exhiban una resonancia en presencia de un campo magnético fuerte y constante (que se supondrá sobre el eje z) y una pequeña radiofrecuencia osciladora transversal o Resonancia de ciclotrón y superficies elipsoidales de energía 317 campo electromagnético de microondas cuyo vector eléctrico queda en el plano xy. Las órbitas resultantes de los huecos o los electrones son circulares en la resonancia y la energía se absorbe del campo de radiofrecuencia cada medio ciclo, como en un ciclotrón. En efecto, la situación es precisamente análoga a lo que sucede con partículas nucleares cargadas dentro de un ciclotrón y, por esta razón, el fenómeno se denomina resonancia de ciclotrón. Primeramente se investigará el caso de las superficies esféricas de energía y una sola masa efectiva escalar. La fuerza de Lorentz sobre un hueco (y se estudiarán los huecos de una muestra tipo p en este cálculo en particular), está dada por {9.8-4). Si la masa efectiva es independiente de la dirección y si se supone que el vector eléctrico del campo oscilante, cuya frecuencia es w, vibra a lo largo de la dirección x, entonces, m; (9.9-1) mientras que Bx = B, =O, (9.9-2) y las componentes de la fuerza de Lorentz dan, para las ecuaciones de movimiento, (9.9-3) (9.9-4) (9.9-5) Al escribir estas ecuaciones se supuso que el vector magnético del campo de radiofrecuencias es despreciable en comparación con el campo constan te 8 0 • La ecuación de la componente z {9.9-5) se limita a indicar que la partícula se desplaza a velocidad constante sobre la dirección z; esto carece de interés especial y no será necesario hablar más al respecto. Las ecuaciones de la componente x y y se pueden escribir como sigue d 2x dy eE0 1..., -=c.o -+-e 0 2 dt dt m* , (9.9-6) (9.9-7) en donde w 0 es la misma frecuencia que define (9.8-7) en conexión con el efecto de Hall. Si se suponen soluciones oscilatorias de la forma x =x 0 &wt y y =y 0 eiwt estas ecuaciones se reducen a (9.9-8) 318 Semiconductores electrónicos uniformes en equilibrio y (9.9-9) que se pueden resolver para las amplitudes x 0 y Yo para dar Xo = eE0 /m; 2 Wo - w 2 iw 0 iw 0 eE 0 / m; Xo = ( 2 w w Wo - w 2)' Yo = - (9.9-10) (9.9-11) Cuando w = w 0 = eB 0 /m;c, se produce la resonancia y las amplitudes se hacen muy grandes. La frecuencia de resonancia w 0 se denomina a menudo frecuencia de ciclotrón. Evidentemente, si w 0 se mide de un modo experimental y si la inducción magnética B 0 se conoce con precisión, se puede determinar la masa efectiva En la práctica, el efecto de la resonancia de ciclotrón constituye uno de los mejores métodos para medir las masas efectivas. De acuerdo con (9. 9-l O) y (9 .9-ll ), se observa que conforme w -+ w 0 m;. (9.9-12) de donde, (9.9-13) (9.9-14) Entonces, en la resonancia, x(t) y y(t) son vibraciones armomcas ortogonales con la misma amplitud y con una diferencia de fase de 90°. Se puede ver con facilidad que la trayectoria de la partícula resultante, que representa la órbita del hueco, es circular. En la práctica, la resonancia se observa normalmente midiendo el factor Q de una cavidad resonante de microonda mientras se hace variar el campo magnético B 0 (y, por ende, la frecuencia w 0 ). Cuando w 0 es igual a la frecuencia de excitación de microondas, se obtiene una disminución brusca en el valor de Q de la cavidad, ya que en la resonancia se absorbe una gran cantidad de la energía del campo electromagnético cuando los portadores se excitan a amplitudes grandes de resonancia y luego se dispersan por acción de las impurezas o por las vibraciones de red. Conviene observar que en este experimento se desea que la cantidad w 0 T sea mucho mayor que la unidad, de manera que los portadores puedan excitarse a través de varias órbitas completas antes de dispersarse. En estas condiciones son capaces de absorber una gran cantidad de energía de las microondas y cuando se produce la dispersión, transformarla en vibraciones de la red cristalina. Por lo general, el experimento se lleva a cabo a una temperatura baja para obtener un valor grande de T, y con un campo estático B 0 tan grande como sea posible para satisfacer el requisito de que w 0 sea una frecuencia de microonda experimentalmente accesible. Por otro lado, en el caso de las mediciones del efecto de Hall, el objetivo a menudo es lograr que w 0 T sea mucho menor que la unidad para simplificar la interpretación de los datos. Cuando el efecto de resonancia de ciclotrón en el silicio y el germanio se estudió de una manera experimental, se descubrió que para ambas substancias existen Resonancia de ciclotrón y superficies elipsoidales de energía 319 más de dos resonancias (una para los electrones y otra para los huecos), como lo predijo la teoría sencilla que se estudió anteriormente. 5 •6 Más aún, se observó que algunas de las frecuencias resonantes del ciclotrón sufrían cambios notables cuando se alteraba la orientación del cristal con respecto al campo magnético estático, en tanto que otras eran prácticamente independientes de la orientación de la muestra. Estos efectos se explicaron finalmente utilizando un modelo en el que las superficies de energía constante de los electrones, dentro del espacio k, eran elipsoidales más que esféricas, y en donde se consideró la presencia de tres bandas de valencia independientes, dos de las cuales se degeneraban a k = O. Las superficies de energía constante para huecos de estas bandas de valencia son más o menos esféricas, aunque, puesto que a2 e/ak 2 difiere para distintas bandas de valencia, existe más de una masa efectiva posible para los huecos. Las diferentes características de este modelo se han comprobado no sólo mediante la concordancia que tiene con los datos experimentales que se han obtenido, sino también por medio de cálculos de mecánica cuántica de la estructura de bandas de energía que se inician más o menos a partir de los principios. 7 • 8 • 9 En primer lugar se estudiará la cuestión de las superficies elipsoidales de energía y se investigará la forma en que los resultados del experimento de resonancia de ciclotrón se modifican cuando las superficies de energía tienen esta forma. Hasta ahora se ha supuesto siempre que el punto de energía mínima en la zona reducida de Brillouin ocurre a k= O, en el centro de la zona, como se ilustra en la figura 8.6. En este caso, un electrón que se encuentra cerca de la energía mínima presenta el comportamiento dinámico de un electrón libre, conduciendo a una superficie de energía constante que, dentro de esta región del espacio k, es más o menos esférica, como se ilustra en la figura 8.ll(a). Sin embargo, se encontró que el valor mínimo de energía dentro de la zona reducida necesariamente no debía encontrarse en k= O, sino que podía localizarse en cualquier otro punto dentro de la zona. En efecto, esta es la situación que se observó en el caso de los electrones dentro de la banda de conducción del germanio y el silicio. Puesto que la red de diamante, en realidad es dos redes cúbicas centradas en la cara que tienen una interpenetración y que están separadas a lo largo de la diagonal del cubo por una distancia a ..j3/4 (en donde a es el lado del cubo), la célula unitaria primitiva para esta red es la misma que la que se muestra en la figura 1.5, excepto que existe un segundo átomo dentro de la célula. La red recíproca, por ende es la misma de la estructura cúbica centrada en la cara y, por tanto, la zona de Brillouin tiene la misma forma que la zona cúbica centrada en el cuerpo que aparece en la figura 8.14(c). En la figura 9.15(a) se ilustra una gráfica de e en función de k en la dirección (1 00) en esta zona de Brillouin para los electrones de la banda de conducción del silicio. El valor más pequeño de e se alcanza a un valor de k que es aproximadamente 0.8(27T/a). Este es el valor mínimo absoluto de e dentro de la zona de Brillouin. se pueden tener otras curvas de e en función de k para otras direcciones, que presenten otros valores mínimos de e; pero ninguno será tan bajo como el valor ee de la figura. Para energías mayores que ee, se pueden construir superficies de energía constante alrededor del punto de energía mínima. Es obvio que la curva de energía en función de la cantidad de movimiento del cristal de la figura 9.15(a) es aproximadamente parabólica alrededor del punto mínimo, correspondiendo al comportamiento del electrón libre con una masa efectiva 5 G. Dresselhaus, A. F. Kip y C. Kittel, Phys. Rev. 92, 827 (1953). 6 R. N. Dexter, H. J. Zeiger y B. Lax,Phys. Rev. 104, 637 (1956). 7 F. Herman, Phys. Rev., 93, 1214 (1954); Proc. lnst. Radio Engrs. 43, 8 D. P. Jenkins, Physica, 20, 967 (1954). 9 E. M. Conwell, Proc. Inst. Radio Engrs., 46, 1281 (1958). 1703 (1955). 320 Semiconductores electrónicos uniformes en equilibrio •• -;0=-t---------;,---+(a) Silicio Figwa 9.15. *· *·· -;o::;t-----------+-k{111) (b) Germanio Zona de frontera La relación de € en función de k para (a) la banda de conducción del silicio graficada a lo largo de la dirección k, (b) la banda de conducción del germanio graficada en la dirección (111) dentro del espacio k. apropiada que se denominará mjj. Si se graficara la curva de e en función de k a lo largo de una dirección que pase por el punto mínimo, pero perpendicular al eje kx (por ejemplo, una línea paralela al eje ky). también se podría obtener una curva que sería parabólica alrededor del punto mínimo; pero en este caso no se obtiene el aspecto de simetría del cristal que requeriría que la curvatura en esta dirección fuera la misma que se tiene a lo largo de la dirección kx. (Esta situación se ilustra en -la figura 9.16.) Como resultado, la masa efectiva relacionada con los cambios en la componente de h cantidad de movimiento en esta dirección tiene un valor que Como se verá difiere del que se dio con anterioridad y que se designará como en breve, esto hace que los requisitos de la simetría del cristal establezcan que la masa efectiva tenga el mismo valor para cualquier dirección dentro del espacio k, normal a la dirección kx en este ejemplo. La energía que sobrepasa el valor de Ec representa la energía cinética de un electrón libre dentro de la banda de conducción, de donde, mi. mi (9.9-15) c{k) - Graficada hacia la dirección *• - - Graficada hacia la dirección k, o kz 1 1 -4---------------r-----1--k Figura 9.16. La relación de E en función de k para la b.anda de conducción del silicio graficada en la dirección k" (curva continua) y a lo largo de una línea normal al eje kx que pasa por el punto kmín (curva punteada). Las diferentes curvaturas en el punto mínimo reflejan la anisotropía de la masa efectiva. Resonancia de ciclotrón y superficies elipsoidales de energía 321 en donde Pxo = hkxo representa el valor de Px en la base de la banda, como se ilustra en la figura 9.15(a). De acuerdo con esto, la superficie de energía constante de un electrón cuya energía e es ligeramente mayor que Ec, es un elipsoide de revolución cuyo centro se localiza en kx = kxo, ky = kz =O. No obstante, puesto que las seis direcciones (100) de una red cúbica son cristalográficamente equivalentes, la curva de e en función de k en cualquiera de estas seis direcciones debe ser la misma. Entonces, deben tenerse seis mínimos de energía equivalentes a lo largo de las seis direcciones (1 OQ)· y con cada uno de estos mínimos debe asociarse una familia de superficies elipsoidales de energía constante similares a las que se describen en (9.9-15). En la figura 9.17(a) se da una representación de esta situación. Esto pone en claro por qué los elipsoides deben ser de revolución; como se vio en el capítulo anterior, la superficies de energías constantes deben tener todas las propiedades de simetría de la zona de Brillouin que, a su vez, conserva todas las propiedades de simetría de un cristal cúbico. Si los elipsoides no son de revolución, la familia de superficies de energía constante ya no sería invariable en todas las operaciones para las que un cristal cúbico permanece invariable. (a) Silicio Figura 9.17. (b) G~rmanio Superficies elipsoidales de energía constante dentro del espacio k para (a) el silicio y (b) el germanio. En el primero, los ejes principales de la elipsoide siguen las direcciones {100} mientras que en el segundo, puesto que el mínimo de energía se localiza en la frontera de zona, las superficies de energía constante forman ocho medias elipsoides cuyos ejes principales quedan sobre las direcciones {111}. La situación para los electrones de la banda de conducción del germanio es algo similar, excepto que se tiene un conjunto de ocho puntos equivalentes de energía mínima que quedan en las direcciones (111) dentro del espacio k en la intersección de tales direcciones con la superficie de la zona de Brillouin. Por tanto, estos mínimos quedan en centros de las caras hexagonales de la zona de Brillouin. Las superficies de energía constante tienen nuevamente la forma elipsoidal; pero, puesto que los mínimos de energía están en la frontera de la zona y, dado que existe una región de energía prohibida bastante amplia que debe vencerse antes de que los electrones puedan excitarse para salir de la zona de Brillouin en estas direcciones, existen ocho mitades de elipsoides que se extiende hacia el interior de la zona de Brillouin en las direcciones ( 111), como se muestra en la figura 9 .l 7(b ). Esto puede considerarse, para muchos fines, como equivalentes a cuatro elipsoides completos. En ambos casos se tiene un tensor de masa efectiva asociado con cada 322 Semiconductores electrónicos uniformes en equilibrio elipsoide cuyos elementos describe la expresión (8.8-7). Al calcular las propiedades de transporte y otras características físicas de los cristales en los que las superficies de energía son elipsoidales, por lo general se determina el efecto debido a una elipsoide (que es casi siempre anisotrópico) y luego se suma sobre todas las elipsoides. Se ha encontrado que las propiedades de transporte en cristales cúbicos son isotrópicas después de efectuar la suma, a pesar del hecho de que las anisotropías se asocian con elipsoidales individuales. Tanto en el germanio, como en el silicio, el efecto lortgitudinal de la masa es mucho mayor que la masa transversal de donde, los elipsoides son muy largos y delgados. Los valores reales, tal como se determinan mediante los experimentos de resonancia de ciclotrón, 5 son los que aparecen en la tabla 9.2. mW m!, TABLA 9.2. Masas efectivas de electrones en el germanio y el silicio "relación de masas" mW/m! m! Germanio Silicio 20.0 0.0819 mo 0.19 mo 1.64 mo 0.98 mo 5.2 A continuación se investigará el efecto de resonancia de ciclotrón en materiales en los que las superficies de energía son elipsoidales. Para principiar, se calculará la frecuencia de resonancia asociada con un solo elipsoide que se supondrá simétrico alrededor del eje kz y que está centrado en el punto kzo, como se indica en la figura 9.18. La inducción magnética B0 forma un ángulo 8 con el eje principaf del elipsoide y, para mayor facilidad, se supondrá que el vector del campo eléctrico oscilante tiene sólo una componente y. La selección de este sistema de coordenadas se hace sólo con el fin de realizar estos cálculos y, cuando concluyan, se verá que la única coordenada de importancia física es el ángulo () entre el campo y el eje longitudinal del elipsoide. En estas circunstancias, la ecuación de movimiento (para una partícula de carga positiva e) se puede escribir en función del tensor (8.8-6) que representa la recíproca de la masa efectiva como -dv = ( - 1 ) · F = ( - 1 ) • (eE +-e v X B). dt m* m* e (9.9-16) La relación entre e y k para el caso de la superficie de energía elipsoidal que se mu-:,tra en la figura 9.18, debe ser, de acuerdo con (9.9-15), _ ¡¡ _ ,. 2 [k~ +k~ ¡¡e-" * + 2m.L (k.- k. 0) 2 ] * 2m 11 • (9.9-17) Las componentes del tensor (1/m*)«fl se pueden encontrar ahora de acuerdo con (8.8-7). En este caso, a2 ejakaakfJ =O para oc"" {J, de tal manera que todos los Resonancia de ciclotrón y superficies elipsoidales de energía Figura 9.18. 323 Geometría vectorial usada en el cálculo de la sección 9.9. elementos del tensor que quedan fuera de la diagonal son cero. Los elementos de la diagonal se calculan fácilmente y el resultado es (1/m*)xx = (1/m*)yy = 1/m! y (1/m*)u = 1/mjj · (9.9-18) De donde, el tensor de la masa efectiva tiene la forma 1 o mi o (~.) = o m1 o o o (9.9-19) 1 ---¡ mil y 1 m1 o o Fx Fxfm! 1 o . F, F,/m! Fz Fzfmii . (~.). F = o m! o o 1 m•u (9.9-20) Si se insertan las componentes de la fuerza de Lorentz para Fx, Fy y Fz, y se igualan a lar. componentes de dvfdt, como lo requiere (9.9-16), la ecuación rlel 324 Semiconductores electrónicos uniformes en equilibrio movimiento se puede escribir como sigue (9.9-21) Si se observa que Bx =bo sen8,Bz =Bo cosO, By= O,Ey =E0 eiwt,Ex =Ez= O. estas ecuaciones se pueden expresar como (9.9-22) dv.fdt = - w 11 vY sen(} en donde y eB 0 W¡¡ = -.-. m c (9.9-23) 11 Al igual que antes, se pueden suponer soluciones oscilatorias de la forma x(t) = x 0 eiwt, y(t) = y 0 eiwt, y z(t) = z 0 eiw t, substituyendo éstas en las ecuaciones de movimiento (9.9-22) y resolviendo para las amplitudes, (9.9-24) iw 11 sen (} eE 0 Zo = - mi w(w 2 - wf cos 2 ( } - wJ.wll sen 2 8) · Estas amplitudes se hacen muy grandes cuando (9.9-25) y este> ·.oncuerda con la frecuencia de resonancia de ciclotrón para el elipsoide partirnldf que se está estudiando. La frecuencia de resonancia depende sólo del ca•¡,po magnético, las masas efectivas y el ángulo (} comprendido entre el campo 8 0 :. el eje principal de la elipsoide. Para superficies de energía elipsoidales, es evidente que la frecuencia de resonancia es una función fuerte de la orientación de la mues· tra con el campo magnético. Se puede demostrar que, a la frecuencia de resonancia. Resonancia de ciclotrón y superficies elipsoidales de energía 325 las órbitas de la partícula son elípticas, de acuerdo con (9.9-24) y que quedan en un plano perpendicular al campo B0 . Los resultados anteriores se derivaron para partículas positivas con carga e; pero para el caso de los electrones sólo se necesita substituir e con -e (en cuyo caso también se debe hacer la substitución de wll por - w 11 y w 1 por - w 1). Evi den temen te, la frecuencia de resonancia no la alteran estas substituciones; la única diferencia es que los electrones atraviesan sus órbitas en el sentido opuesto del que se encontró para las partículas positivas. En el caso del silicio, si el campo B0 se orienta en la dirección z, entonces (} = O para las dos elipsoides cuyos ejes principales se encuentran a lo largo de la dirección kz y (} = 90° para los otros cuatro elipsoides. Entonces, de acuerdo con (9.9-29), habrá dos picos de resonancia superpuestos en w = w1 de los dos primeros elipsoides y cuatro resonancias superpuestas a w = ..jw1w 11 de los otros cuatro. Suponiendo que el número de electrones pertenecientes a cada elipsoide es igual, lo cual es cierto en la condición de equilibrio, la segunda resonancia que cubre cuatro elipsoides debe tener el doble de la fuerza de absorción de la primera, que sólo cuenta con dos. Si el campo B0 tiene otra orientación, se pueden encontrar hasta tres tipos de resonancia correspondientes a los tres ángulos posibles entre B0 y los ejes de la elipsoide. Esta teoría de la resonancia de ciclotrón con las superficies de energía elipsoidales sirven para explicar todas las resonancias observadas experimentalmente, que se ven muy afectadas por la orientación de la muestra, y permite determinar m l y m~ basándose en frecuencias de resonancia de ciclotrón determinadas de un modo experimental, y así se pudo proponer un modelo correcto para la orientación de las elipsoides. Los datos de resonancia de ciclotrón para huecos en las bandas de valencia del silicio y el germanio no presentan las características típicas del efecto con superficies de energía elipsoidales. Aunque en ambos materiales existen numerosos picos de resonancia para los huecos, los cambios característicos de la frecuencia de resonancia con la orientación de la muestra que se observan en las superficies elipsoidales de energía, están ausentes o son mucho menos pronunciados. El modelo de la banda de valencia que parece ajustarse mejor a estos (y otros) datos, es el de dos bandas separadas que se degeneran en el máximo de energía en k = O; pero que tienen diferentes masas efectivas. Existe también una tercera banda "de separación" con una energía máxima (en k = O) un poco inferior a la parte superior de la banda de valencia. En la figura 9.19 se ilustra esta situación. Están presentes simultáneamente Figura 9.19. Las tres distintas ramas de las bandas de valencia del silicio y el gennanio. 326 Semiconductores electrónicos uniformes en equilibrio huecos ligeros y pesados (pertenecientes a las bandas l y h de la figura), y se puede observar un efecto de resonancia de ciclotrón diferente para cada tipo. Puesto que las l..Jperficies de energía asociadas con estas bandas son más o menos esféricas, la dependencia de la orientación que tiene el efecto de resonancia de ciclotrón es mucho menos pronunciada que la que se asocia con las superficies elipsoidales de la banda de conducción. No obstante, las superficies de energía son aproximadamente esféricas; están algo distorsionadas de la forma realmente esférica, incluso para valores pequeños de k. Esta "desviación" debe tomarse en cuenta para explicar todos los detalles de los datos de resonancia de ciclotrón, sobre todo en el caso de la banda de huecos pesados en donde la desviación de la esfericidad es más pronunciada. La diferencia de energía entre el punto máximo de la banda "de separación" de posición más baja y el máximo de la banda de valencia (ev- €8 en la figura 9.19). es aproximadamente 0.28 eV en el germanio y 0.035 eV en el silicio. En el caso del germanio, esta diferencia de energía es lo suficientemente grande para que en condiciones ordinarias, se desprecie la población de los huecos de la banda más baja. Sin embargo, en el caso del silicio, excepto a temperaturas bajas, se encontrará un número importante de huecos en esta banda. La separaclón de las bandas se debe a la interacción de los espines electrónicos de los electrones de valencia con el momento magnético producido por su movimiento orbital. Si no fuera por este acoplilmiento esptn-órbita la diferencia de energía €v - e8 sería cero y las tres band~ coincidirían en el punto k= O. Las masas efectivas asociadas con las tres variedade de huecos se dan en la tabla 9.3. TABLA 9.3. Masas efectivas de huecos en el germanio y el silicio Germanio Silicio 0.044mo 0.16 mo 0.28 mo 0.49 mo 0.077 mo 0.245 mo La existencia de un hueco como una especie particular, en general, está limi· tada a un solo tiempo libre medio. Por ejemplo, un hueco se puede dispersar fácilmente de la banda l a la banda h, o viceversa, mediante cualquiera de los procesos de dispersión con los que normalmente se asocia. Por esta razón no es posible detectar la existencia de las variedades independientes de huecos en cualquier medi· ción (por ejemplo, la conductividad o· el arrastre de portadores) que implica sólo el comportamiento promedio del portador promediado sobre un gran intervalo durante el que las identidades de los huecos dentro de las tres bandas pueden intercambiarse con frecuencia. En el experimento de la resonancia de ciclotrón, en donde se mide una resonancia que se excita en un tiempo corto en comparación con el tiempo libre medio (w 0 r ;:¡¡:. 1), se puede manifestar fácilmente la presencia de algunas varie· dades de huecos. Se puede hacer la misma observación en relación con los electrones en los diferentes mínimos equivalentes de energía de la banda de conducción; los procesos normales de dispersión pueden transferir electrones sin más problemas, de una elipsoide a otra (dispersión entre valles), de tal manera que en un tiempo largo en comparación con el de relajación, se pierde irrecuperablemente la identidad de un electrón que indica a qué elipsoide en particular pertenece. Densidad de estados, conductividad y efecto de Hall 9.10 327 DENSIDAD DE ESTADOS, CONDUCTIVIDAD Y EFECTO DE HALL CON SUPERFICIES COMPLEJAS DE ENERGIA En una situación en donde existen dos bandas parabólicas que se degeneran en k = O, con superficies de energía esféricas que dan origen a dos especies diferentes de portadores, las poblaciones relativas de las dos especies y los factores de densidad de estados se pueden calcular con facilidad. Se analizará el caso de una banda de valencia de esta naturaleza en la que se encuentran presentes simultáneamente huecos ligeros (con una masa efectiva mt) Y huecos pesados (con una masa efectiva m~). En estas circunstancias, el total de concentración de huecos p 0 se puede escribir como la suma de la concentración de huecos ligeros p1 y la de huecos pesados Ph• de donde, de acuerdo con (9.3-15) y (9.3-16), (9.10-1) en donde Uv 1 y Uvh son factores de la forma (9.3-16) para huecos ligeros y pesados. Esto se puede escribir en la forma - (2nm;.kT)3/2 -c•,-•.>fkT h2 e ' Po- 2 (9.10-2) como si se tratara de una sola especie de portadores, si se define la masa efectiva equivalente de la densidad de estados m~ 9 , como (9.10-3) Esta es una aproximación de la situación real en la banda de valencia del germanio y el silicio, aunque es sólo aproximada, ya que el efecto de la banda "de separación" se hace a un lado por completo y dado que las superficies reales de energía no son perfectamente esféricas en modo alguno. La conductividad procede directamente de (9.10-2) utilizando (4.7-8). Para un grupo de superficies elipsoidales de energía tales como las que se vieron en relación con la banda de conducción del germanio o el silicio, se puede calcular el factor de densidad de estados g(e) mediante una extensión del procedimiento desarrollado en la sección 5.2. La ecuación (9.9-17) para una de las elipsoides se puede reducir mediante la transformación (9.10-4) a la de una esfera dentro del espacio p'. 8 - Be= p~2 + p'2 + p'2 >' 2m 0 z p'2 = 2m 0 • (9.10-5) 328 Semiconductores electrónicos uniformes en equilibrio El volumen del espacio p' de la capa esférica limitada por los radios p' y p' + dp' para una sola elipsoide, ahora se puede calcular del mismo modo que se hizo en la sección 5.2 para las superficies esféricas de energía; pero puesto que se tiene más de una superficie elipsoidal de energía constante, el volumen total del espacio p' correspondiente a las energías dentro del rango e a e+ de, se obtiene multiplicando el volumen encontrado para una sola superficie por el número de elipsoides equivalentes. Si este número es v, el volumen correspondiente dVp, dentro del espacio rJ es (9.10-6) Sin embargo, de acuerdo con (9.10-4), los elementos de volumen dV = dpxdPydPz y dVP' = dPx•dPy•dPz' están relacionados por medio de m~/2 dVp' = ( m.~.*2 m*)1/2 dVP, (9.10-7) 11 por lo cual, el volumen dVP del espacio p dentro del rango de energía e a e+ de. se convierte en dVP-- 4V¿. '2nv(m*.l. 2 m*) 11 112 Je - ee de • (9.10-8) Al dividir esto entre el volumen h 3 /2 asignado a un solo estado cuántico, se obtiene el número de estados cuánticos dentro de este rango de energías que, por definición, es g(e)de, de donde, 8 ¡;;2 ( *2 *)1/2 ( )de -_ ...; ...nv hm.~. m 11 g e 3 J-e - ee de. (9.10-9) Si de nuevo se define una masa efectiva equivalente de densidad de estados m~ 9 , como *3/2 _ (m*2m*)1/2 m ds .l. 11 ' (9.10-10) la ecuac10n (9.10-9) se puede escribir (excepción hecha del factor v) en la misma forma (5.2-22) como la expresión acostumbrada de la densidad de estados para el caso en que las superficies de energía son esféricas. Aplicando directamente los procedimientos por los que se obtuvieron (9.3-6) y (9.3-7), es claro que se debe obtener (9.10-11) siendo r,¡Js como lo indica (9.10-10). Al calcular la conductividad de un semiconductor en el que las superficies de energía constante son elipsoidales, primero es necesario determinar la contribución de eurriente o conductividad para una sola elipsoide y luego sumar sobre todas las elipsoides para determinar la conductividad total. Puesto que la masa efectiva asociada con cada elipsoide individual es una cantidad tensorial, también lo será la conductividad. En general, las ecuaciones relacionadas con la densidad de corriente y el Densidad de estados, conductividad y efecto de Hall 329 campo eléctrico se pueden escribir como relaciones tensoriales de la forma (9.10-12) y E= p· 1 (9.10-13) en donde a es el tensor de conductividad y p es un tensor de resistividad. Evidentemente, pÜesto que de acuerdo con (9.10-12) (9.10-13), y e · 1 = e · ~ · E = E, (9.10-14) se de be tener (9.10-15) en donde ! es el tensor unitario cuyos elementos son {Ja. 8 . En consecuencia, el tensor de resistividad es la inversa del tensor de conductividad, es decir, (9.10-16) Los elementos del tensor de cvnductividad a<il relacionados con la iésima elipsoide de energía se pueden escribir, en analogía con (7 .3-15), como (9.10-17) en donde rl(i) es la densidad de portadores de carga asociados con dicha elipsoide. Por tanto, la conductividad total se puede expresar como (9.10-18) y la suma se hace sobre todas las elipsoides. Si se usa (8.8-7) para expresar las componentes tensoriales (9.1 0-17) se puede escribir como sigue a2¡p> ak X2 . n< 0e 2i ¡J2¡;(i) a<•>= - 1i2 oky okx a2e(i) ok% okx a2e(i) a2e(i) okx oky o 2e(i) okx okz a2e(i) o~k2y a2¡;<i> aky ak% ' o 2e(i) okz oky ok z2 (9.10-19) en donde ¡;(i)(k) es la energía expresada en función de k para la iésima elipsoide. En el caso del silicio, los principales ejes de las elipsoides yacen a lo largo de los ejes de coordenadas del espacio k; para las dos elipsoides cuyos ejes principales quedan sobre el eje kz, en las direcciones [001] y [001], la función ¡;(OOI)(k) está dada por (9.9-17), lo cual conduce a las componentes de tensor (9.9-18) para el tensor 330 Semiconductores electrónicos uniformes en equilibrio de conductividad para estas elipsoides se convierte, entonces, en 1 m! a<OOl) = a<oon = n<001>e2i o o o o 1 o m! (9.10-20) o m¡¡1 * Las ecuaciones de las otras elipsoides se pueden escribir y los componentes de tensor se obtienen de la misma manera. Para las dos elipsoides cuyos ejes principale1 se orientan a lo largo del eje kx, 1 CJ(lOO) = CJ(TOO) = n(lOO)e2i o *m u 1 o o m*J. o o o (9.10-21) 1 m*J. en tanto que, para los dos elipsoides cuyos ejes principales siguen la dirección de: eje ky, 1 m! CJ(OlO) = CJfOTO) = n(010)e2i o o o o 1 o *m u 1 o (9.10-22) m! Dado que las seis elipsoides tienen mínimos de energía equivalente n(loo) = n<1oo) = n<tot) = n<ofo) = n< 001 ) = n<oo1) = n 0 /6. Cuando se efectúa la suma indicada en (9.3-14) y se aplica este hecho, se obtiene 1( 2 1) o o 3 m!+ m 0 1( 2 1) o o 3 m!+ m 0 1( 2 1) o o 3 m!+ m0 *m )t_ 1 ( --¡ 2 + 1 = n 0 e 2 i -3 m1. (9.10-23) 11 para la conductividad total. Puesto que CJ es un múltiplo escalar del tensor unitario !_, la conductividad total es isotrópica (a -pesar de que la conductividad asociada con Densidad de estados, conductividad y efecto de Hall 331 una sola elipsoide no lo sea). La magnitud escalar de la conductividad se puede representar como (9.10-24) en donde m~ es una masa efectiva de conductividad defmida por l. 1( 2 1) m: = 3 m! + m¡j · (9.10-25) Se puede demostrar que se obtendría exactamente el mismo resultado para cualquier conjunto de superficies elipsoidales de energía de que se trate, siempre y cuando la configuración sea invariable en todas las operaciones de simetría en las que el cristal cúbico sea inalterable. De hecho, se puede demostrar que la conductividad de todos los cristales cúbicos debe ser isotrópica sea cual fuere la forma específica que puedan tomar las superficies de energía constante. En particular, las ecuaciones (9.10-23) a (9.10-25), también son válidas para los electrones de conducción en el germanio, en donde las elipsoides de energía constante están orientados a lo largo de las direcciones (111). Es muy ilustrativo desarrollar el tensor de conductividad para el germanio, y este problema queda asignado como ejercicio para el lector. El tensor de resistividad es una matriz de componentes inversa a la matriz de conductividad. Lo elementos de la matriz que es la inversa de la ~ cuyos elementos son a,.11 están dados por la fórmula e _ 1 a,.p = cof(a 11,.) á(a) ' (9.10-26) en donde cof (a11,.) es el cofactor 10 del elemento a11,. y A(a) es el determinante de los coeficientes de ~· En consecuencia, es evidente que los elementos de e_ son anayz - a:x:yarr a""a•• - a;. (9.10-27) en donde (9.10-28) Se ve claramente que si a tiene la forma (9.10-23), el tensor de resistividad es isotrópico y se puede represeñtar mediante una cantidad escalar cuya magnitud es, sencillamente, el recíproco de la conductividad (9.10-24). A continuación se ilustrará la computación del efecto de Hall en un material con superficies elipsoidales de energía, considerando en detalle el efecto de Hall en lO Véase, por ejemplo, L. A. Pipes, Applied Mathematics for Engineers and Physicists. Nueva York. McGraw-Hill (1946), página 71. 332 Semiconductores electrónicos uniformes en equilibrio un material en el que los ejes principales de las elipsoides se extienden a lo largo de los ejes kx, k y y kz (como por ejemplo, en el silicio), en el caso espec:al en el que el campo magnético está orientado en la dirección z y la corriente fluye en la dirección x. También se supondrá que existe sólo una especie de portadores. En estas condiciones, los tensores inversos de la mas.a efectiva para diferentes elipsoides tienen la forma que se señala en las ecuaciones (9.10-20, 21 y 22) y, en particular. la ecuación tensorial de movimiento para portadores con carga e en los elipsoides (100) y (TOO), se pueden escribir, en analogía con (9.8-4), como o e eEx +- (v,B. - v.B,) dvxfdt 1 (~.).! = o mi o e eE7 + - (v.Bx- vxB.) dv7 /dt 1 e eE. +- (vxBy- v1 Bx) dv.fdt 1 o mn* o o e e mi e (9.10-29) Si se hacen las multiplicaciones de matriz indicadas, se escriben las ecuaciones de las componentes del movimiento y se observa que Bx =By =O, en tanto que Bz = 8 0 se obtiene dvx eEx -=-+w 11 v7 dt mjj dv, eE, dv. eE. dt = mi- WJ.Vx (9.10-30) dt= mi' en donde wll y w 1 son como se indica en {9.9-23). _ _ Si la primera de estas ecuaciones se multiplica por yw1 y se suma a iywll por la segunda, la ecuación resultante se puede expresar en la forma dZ . ~ (JroJ. -d + !y ro 11 roJ.Z =e -.-Ex+--.- E, t m 11 mJ.. iJW"; ) (9.10-31) en donde Z es la cantidad compleja z = vxJwJ. + iv,Jwn. (9.10-32) Evidentemente, la ecuación (9.10-31) tiene exactamente la misma forma que (9.8-8). Todos los pasos comprendidos en la solución de esta ecuación y el promedio sobre las trayectorias y la distribución de velocidad que conducen a las ecuaciones (9.8-16) y (9.8-17), se pueden repetir ahora principiando con (9.10-31). La justificación física de cada etapa es la misma que ya se dio. De esta manera, se puede demostrar que ii~too) = ii~Too> = 1 - ~ Re(Z) yC.OJ. (9.10-33) Densidad de estados, conductividad y efecto de Hall 333 mientras que 1 T - ¡;~too> = ¡;~ oo> = - = lm(Z) Jwu (9.10-34) Si estos resultados se restringen al coeficiente de Hall de campo pequeño, se puede suponer wnwlr 2 ~ 1 y dejar sin efecto los términos wnwlr 2 de los denominadores de las ecuaciones (9.10-33) y (9.10-34). Ahora se pueden obtener las densidades de corriente a partir de las velocidades, al igual que antes, de donde, para la iésima elipsoide, ¡<i) = p<i>ev<i> y y o y ' (9.10-35) mientras que, sumando todas las elipsoides, las componentes del total de densidad de corriente son 1X = "L.- p(i>ev<i> o X y J~i) = i ¿ pg>ev~i)· (9.10-36) i En el estado estacionario no puede haber una corriente en la dirección y, de modo que, de acuerdo con (9.10-36), se debe tener (9.10-37) Como se dijo antes, las concentraciones p~> para las ~eis elipsoides son las misma e iguales a p 0 /6. La expresió~ para vvoo) y ii~ 100 ) se dio antes en (9.10-34). Para las elipsoides (010) y (010), se puede establecer fácilmente, usando el tensor de masa apropiado en (9.10-29), que las ecuaciones de movimiento para las componentes x y y de la velocidad son las mismas que las que se dan en (9.10-30), excepto que ~e intercambian mjj y m! y wu y w1 . Entonces, la expresión para ¡¡~o1o) y ¡;~0 1 0) es (9.10-34) intercambiando estas cantidades. En el caso de las elipsoides (001) y (OOI), es obvio, siguiendo el mismo razonamiento, que las ecuaciones de movimiento de las componentes x y y de la velocidad son las mismas que las de (9.1 0-30), excepto que mjj y w 11 no aparecen en absoluto y que, en todo_§ los casos, se substituyen por mi y w 1 . De donde, la expresión de ¡;}0° 1 ) y P}001 ) se obtiene a partir de (9.10-34), substituyendo mjj y wu por mi y w1. Después de hacer todas estas substituciones, efectuar la suma indicada en (9.10-37) y resolver para Ey en función de Ex. se obtiene _ eB 0 ( ' 2 ) E,- 7 i 2mt f m1 •2 "'( 2 1 ) Ex. (9.10-38) m1. m 11 ---¡ +---¡ m1. m 11 Desechando los efectos de la magnetorresistencia, que no son importantes para fuerzas reducidas de campo magnético, Ex se puede expresar en términos de lx de acuerdo con (9.10-24) como sigue Ex= lx/t1o = 31 x . ( 2 +---¡ 1) Poe2 i---¡ m1. m 11 (9.10-39) 334 Semiconductores electrónicos uniformes en equilibrio Al substituir esto en (9.10-38), se puede escribir finalmente (9.10-40) siendo 3(2m! + mjj) _ _1_ -r 2 R- p0 ec (i) 2 *2 • ( 2 1) m.~. m -;¡;+11 m.~. 2· (9.10-41) ut Esto se escribe a menudo de una manera. algo diferente; si K se defme como la relación de la masa longitudinal a la transversal, según lo cual, (9.10-42) entonces, (9.10-41) se puede expresar como 1 T 2 3K(K + 2) R = -p0-ec -(i-)2 ~(2:-K.:......._+-:-1)=2 • (9.10-43) Aunque se supusieron direcciones particularmente simples para la corriente de la muestra y el campo magnético, si se hubiera procurado obtener el resultado para una dirección arbitraria de flujo de corriente u orientación de campo, se habría descubierto que el coeficiente de Hall de campo pequeño {9.10-41) ó (9.10-42) es independiente de la orientación de la corriente y la dirección de campo con respecto a las elipsoides de energía. Por tanto, se puede demostrar que el coeficiente de Hall de campo pequeño es isotrópico, aunque esto no es correcto si el campo magnético es tan grande que w uw 1T 2 ya no sea pequeño en comparación con la unidad. Los resultados anteriores se obtuvieron también para un conjunto particularmente sencillo de elipsoides de energía; pero se puede demostrar que se aplican a cualquier grupo de super· ficies elipsoidales de energía, siempre que dicho grupo tenga una simetría cúbica. Por supuesto, estos resultados se desarrollaron para portadores con una carga +e. Para semiconductores tipo n (y Si y Ge tipo n son los ejemplos más comunes de substancias con superficies elipsoidales de energía), se debe substituir e por medio de -e y p 0 con n 0 en (9.10-41) y (9.10-43). Si la ecuación (9.10-43) se multiplica por a0 y si la cantidad Ra0 se defme, al igual que antes, como la "movilidad de Hall" Jl.H, es obvio que la relación de la movilidad de Hall a la movilidad de arrastre real J1. está dada por JlH T2 3K(K + 2) ¡; = (t)2 (2K + 1)2 (9.10-44) para un semiconductor con superficies de energía constante elipsoidales. El presentar una exposición completa de los efectos galvanométricos y la magnetorresistencia para semiconductores con superficies elipsoidales de energía es algo que están más allá del alcance de esta obra y, por ende, se omitirá. Sin embargo, se debe hacer notar especialmente que la magnetorresistencia no es isotrópica en estas condiciones y que las mediciones de ésta, en func\ón de la orientación de la muestra y la dirección del campo magnético pueden constituir una fuente abundante de datos experimentales con los que se puede comprobar en detalle cualquier modelo propuesto de superficies de energía. Mecanismos de dispersión y movilidad de los portadores de carga 9.11 335 MECANISMOS DE DISPERSION Y MOVILIDAD DE LOS PORTADORES DE CARGA En los semiconductores, al igual que en los metales, los procesos de dispersión más importantes incluyen las interacciones de los electrones (o huecos) con las vibraciones de red y con átomos de impureza. En cristales relativamente puros o a temperaturas más o menos altas, la primera interacción es casi siempre predominante en tanto que a temperaturas bajas o en especímenes impuros, la segunda parece ser más importante. Existe un amplio rango de posiciones intermedias en las que ambos procesos son significativos. El efecto de cualquier interacción de dispersión, particular i, se puede evaluar calculando el tiempo libre medio T ¡ asociado con este proceso. Entonces, el tiempo libre T se puede expresar mediante 1 1 -=¿-r i (9.11-1) 'r¡ como se indicó en la secc10n 7.5. Esto pone en claro que el proceso de dispersión que conduce al tiempo libre más corto T¡, es el dominante. Una vez que se conoce el tiempo libre medio T, la movilidad se puede expresar fácilmente como e1' /m*. Desafortunadamente el cálculo del tiempo libre asociado con cualquiera de los procesos de dispersión que tienen cierta importancia en los semiconductores, es muy prolongado y elaborado, y los detalles matemáticos que comprende están por encima del nivel que se ha fijado para este estudio. Por tanto, será necesario limitar este análisis a un planteamiento cualitativo más o menos aproximado de la dispersión de red, aunque se tratará de dar un método más o menos completo de la dispersión de impurezas siguiendo el lineamiento que desarrollaron Conwell y Weisskopf. 11 A temperaturas bajas, es muy limitada la energía térmica disponible para excitar vibraciones de red de modo óptico, y el proceso de dispersión de la red, más importante, es la dispersión de portadores de carga mediante vibraciones de la red de modo acústico. Sólo se tendrá en cuenta la dispersión de portadores mediante vibraciones de tipo longitudinal; la razón por la que se desecha el efecto de los modos transversales quedará demostrado en el curso de este estudio. El paso de una vibración longitudinal a través de un cristal da origen a regiones alternas de compresión y expansión de dicha red cristalina. Cuando el cristal se comprime, las posiciones de las bandas de energía se alteran de tal manera que la anchura de la banda prohibida se reduce (véase la figura 9.2); en la condición de expansión, la anchura de la banda prohibida se incrementa . .&te efecto produce una variación local en la energía asociada con el borde de la banda de conducción, como se indica en la figura 9.20(a), que, para simplificar el cálculo, se puede substituir con la variación escalonada que aparece en la figura 9.20(b) sin introducir un error importante. Existe una variación similar en energía del borde de la banda de valencia. Por tanto, se puede calcular la probabilidad de reflexión para un electrón incidente sobre un solo "escalón" de la figura 9.20(b). Para hacer esto, el electrón incidente sobre un escalón de esta naturaleza, con una altura liec se representa mediante una función de onda de partícula libre con una cantidad de movimiento positiva de la forma (9.11-2) 11 E. Conwell y V. F. Weisskopf, Phys, Rev., 71, 388 (1950). 336 Semiconductores electrónicos uniformes en equilibrio ----- <e -x •• s.c (a) 1 <c_jr---------,__________J~:-----~--------1 1 ¡---T-x Ev-,L_________~---------¡________ Figura 9.20. (b) _r--------,L . . , _ La variación sinusoidal de las energías de l¡¡ banda de conducción y la de valenca en un cristal semiconductor, producida por fuerzas de compresión y t.xpansióc asociadas con una vibración térmica longitudinal. (b) Una variación "de onch cuadrada" que se aproxima a la ilustrada en (a) y que simplifica el cálculo de! tiempo de relajación. Como se ilustra en la figura 9.21, el electrón se puede "reflejar" o transmitir en el escalón. De aquí que pueda haber una componente de la función de onda asociada con una cantidad de movimiento negativa en la región (x < 0), representando al electrón reflejado que debe tener la forma (9.11-3) En la regwn que queda más allá de la barrera (x >O), la función de onda que representa a un electrón transmitido sobre dicha barrera es (9.11-4) Todas éstas son funciones de onda de partícula libre que satisfacen la ecuación de Schrodinger para un potencial constante. Puesto que la cantidad de movimiento liko para la componente reflejada se supone idéntica a la cantidad de movimiento de la partícula incidente, se supone que la interacción de colisión es perfectamente elás· tica. Sin embargo, puesto que la onda de la red representada por la barrera de energía, se desplaza con la velocidad del sonido, en realidad existe un efecto de Doppler que hace que la cantidad de movimiento reflejada sea diferente de la incidente. Dado que la velocidad del sonido es pequeña en comparación con la velocidad térmica promedio de la partícula, el cambio de cantidad de movimiento es sólo una fracción pequeña de la cantidad de movimiento de la partícula incidente y, por ende, se puede omitir sin riesgo alguno en estos cálculos. De acuerdo con (4.9-8). es obvio que si la energía de un electrón incidente es e0 y la de un electrón "transmitido" es e 1 , y (9.11-5) Transmitida= 'i3(xl- lncidente =.¡,, (x) - - - 1 ¡ Reflejad:< _=_.¡,2_(_x_l_ __ - _ _ _ __, ___sj~ _ x- 1 x=O Figura 9.21. La "reflexión" de un electrón desde una barrera de potencial cuya altura es liec. Mecanismos de dispersión y movilidad de los portadores de carga 337 de donde, (9.11-6) Puesto que la función de onda y su derivada deben ser continuas en x = O, se puede escribir (9.11-7) y 1/lí(O) + 1/12(0) = 1/13(0). Al substituir los valores dados en (9.11-2, 3 y 4) en estas ecuaciones, se puede demostrar que B k 0 - kt -=--A k 0 + kt y e -= A 2k0 k0 + k 1 · (9.11-8) Las probabilidades de transmisión y reflexión R y T están dadas por (9.11-9) (9.11-10) Si la altura del escalón liec es pequeña, lo que se supondrá en este caso, de acuerdo con (9.11-6) k 1 ===k0 , y (9.11-9) se puede expresar con la ayuda de esta aproximación y (9.11-6), como )2 ( m*& R ~ 2¡2k¡ . (9.11-11) La cantidad liec se puede relacionar con la deformación de compresión o expansión li V/V0 a una primera aproximación mediante una relación lineal de la forma - «5V - «5ec = .::.e • Vo ' (9.11-12) en donde la constante del potencial de deformación Zc representa el cambio en el borde de la banda de conducción por unidad de deformación de dilatación. Puesto que las distorsiones cortantes asociadas con los modos de vibración transversales no producen ningún cambio de primer orden en el volumen, estas vibraciones no originan ningún cambio en Ec y su efecto de dispersión en los portadores de carga es despreciable. El paso de una onda elástica longitudinal por el cristal va acompañado, no obstante, de regiones coherentes de compresión y expansión que son del orden de 1/2 en extensión lineal, en donde l es la longitud de onda de la perturbación. Si un elemento de volumen V0 de esa extensión lineal se 338 Semiconductores electrónicos uniformes en equilibrio somete a un esfuerzo de dilatación produciendo una presión maxnna {)p y un cambio de volumen {j V, se ve claramente que la energía de deformación almacenada :-s --tDP {j V, y si la fuente de la energía de deformación es térmica, su magnitud de~ ser proporcional a kT; en otras palabras, oe = -!op oV= ckT (9.11-131 en donde e es una constante.l 2 Sin embargo, puesto que la compresibilidad (3 se define como (9.11-141 se puede expresar en función de (3 gracias a esta ecuación, y substituir el resu1tado en (9.11-13) con el fin de obtener {)p 1 (oV) 2 Oe=---=ckT 2 {JV0 (9.11-15. de donde, (oV) 2 V~ 2cf:JkT =-y;- (9.11-161 Si se substituye este resultado en (9 .11-12) y se usa la expresión resultan te para oe~ en (9.11-11), R se puede escribir como (9.11-171 Ahora, en una distancia ox, la probabilidad de dispersión (reflexión) es ox/"An. en donde An es la trayectoria libre media. Para una distancia l/2 (la dimensión lineal del volumen V0 ), la probabilidad de reflexión es aproximadamente el valor dadc como R en la expresión anterior. Entonces, l/2"An se puede igualar a R y resolverse para An, a fin de obtener (9.11-181 La segunda expreswn procede de la primera, ya que V0 = P /8 y k 0 = 21rjl Suponiendo que An es independiente de la velocidad cuya validez aproximada se vio ya en la sección 7.5, An y el tiempo libre medio se relacionan mediante la expresión (7.3-18). Usando esta ecuación y la expresión (5.4-20), :¡= n se puede expresar en la forma (9.11-19) 12 Esta constante se relaciona principalmente con la fracción de todos los modos normales posibles de vibración que contribuyen a una deformación de dilatación del tipo que se vio aquí. Es evidentemente independiente de la temperatura, la masa efectiva y la constante del potencial de deformación. Mecanismos de dispersión y movilidad de los portadores de carga 339 Este cálculo es evidentemente aproximado. Sobre todo, se observa que no se ha intentado evaluar c. No obstante, ilustra con claridad los principios comprendidos y también muestra la dependencia de Tn y, por tanto, de la movilidad con respecto a la temperatura, la masa efectiva y la constante del potencial de deformación. Un planteamiento completo de acuerdo con la mecánica cuántica 13 da el resultado (9.11-20} en donde c11 es la constante de elasticidad para una expansión longitudinal en la dirección [110]. La movilidad correspondiente es Jsn: ei eli 4 c11 J.l.n = m: = -3- m:312(kT)3f2E;. (9.11-21) Si las superficies de energía constante son elipsoidales más bien esféricas, [de acuerdo con (9.11-5)], es obvio, que la masa efectiva m:; en (9.11-17, 19 y 20) debe reemplazarse con la masa efectiva de densidad de estados (9 .1 0-1 O). El factor adicional de m~ que aparece en (9.11-21), debe ser en este caso, la masa efectiva de conductividad (9.1 0-25), de tal modo que el factor m:;s 12 del denominador de (9.11-21), se convertirá en m~ 9 3 1 2 m~. Los cálculos anteriores se refieren específicamente a electrones en la banda de conducción; pero el procedimiento para huecos en la banda de valencia es prácticamente el mismo, y los resultados son idénticos a los que se acaban de dar, substituyendo las masas electrónicas y la constante del potencial de deformación de la banda de conducción por sus equivalentes respectivos de la banda de valencia. De acuerdo con (9.11-20) y (9.11-21), la movilidad debe variar como T- 3 12 y m~- 5 12 cuando la dispersión de la red en modo acústico es la interacción dominante. Si se calcula la relación de la movilidad de electrones a la de huecos, como lo expresa (9.11-21) y su equivalencia para los huecos, se puede demostrar que J.l.n -_ ( mn*/ mp*)- 5/2("::' /"::' )- 2 . -e-., J.l.p (9.11-22) Puesto que Zc y Zv son casi siempre más o menos idénticas, con frecuencia se toma como regla práctica que la relación de las movilidades es la relación inversa de las masas efectivas a la potencia f. Desafortunadamente los resultados experimentales concuerdan sólo en parte con las predicciones de (9.11-21). La variación de la movilidad con respecto a la temperatura en el rango de las temperaturas en donde predomina la dispersión de la red, en particular, casi siempre es más fuerte que la variación T- 3 / 2 que se encontró con este análisis. En la tabla 9.4 se indican los valores promedio de la movilidad medida a 300°K (en donde la dispersión de red es la dominante en todas las muestras, excepto las muy impuras) y la variación de la movilidad con relación a la temperatura para huecos y electrones en el germanio y el silicio. En materiales con superficies de energía que son esencialmente esféricas, por ejemplo, Si y Ge tipo p, el efecto de dispersión por vibraciones de la red de modo óptico es importante, sobre todo a temperaturas más altas. 14 13 Véase, por ejemplo, W. Shockley, Electrons and Holes in Semiconductors. Nueva York: D. van Nostrand Inc., (195 Nostrand Inc., (1950) página 539. 14 H. Ehrenerich y A. W. Overhauser, Phys. Rev. 104, 649 (1956). 340 Semiconductores electrónicos uniformes en equilibrio TABLA 9.4. Datos de la movilidad medida para el silicio y el germanio P.• Si Ge Variación de JJ.n en función de la temperatura 1600 3800 T-z-5 p., Variación de llp en función de la temperatura 500 1900 T-1·66 T-1·3 T-1 3 Cuando las superficies de energía son elipsoidales, por ejemplo, en Ge y Si tipo n, los efectos que se originan en la dispersión de electrones de una elipsoide a otra (dispersión entre valles), que no se ha tomado en cuenta en el cálculo anterior, también tiene gran importancia. En este proceso, cuando un electrón se transfiere de una elipsoide a otra, la conservación de la cantidad de movimiento requiere la generación o la absorción de un fonón cuya energía es del mismo orden que la del electrón mismo. Por tanto, estos eventos de dispersión no se pueden considerar como aproximadamente elásticos. Un estudio detallado de este tipo de dispersión. realizado por Herring, 15 demostró que la dependencia de la movilidad que se observó en relación con la temperatura, en Ge y Si tipo n, se puede explicar basándose en la dispersión entre valles aunque, por supuesto, la contribución de modo óptico es importante sin lugar a dudas. Además, el efecto de los modos transversales de vibración es mucho mayor cuando la estructura de la banda es de la forma de "muchos valles",l 6 y, por ende, no se puede omitir por completo para el Ge y el Si tipo n. Se recomienda consultar los excelentes artículos de Herring 15 y Blatt 17 para hacer un estudio más detallado de estas cuestiones. El cálculo del tiempo de relajación para la dispersión de impurezas se basa en la teoría de la dispersión de partículas cargadas mediante el potencial de Coulomb de los núcleos, que originariamente fue desarrrollada por Rutherford para explicar la dispersión de partículas o:. 18 • 19 En un cristal semiconductor que contiene impurezas de substitución y el potencial de Coulomb debido a los iones cargados, donadores y receptores, sirven para desviar las trayectorias de electrones y huecos, al igual que lo hace el potencial de un núcleo pesado que desvía una partícula o: en el experimento de dispersión de Rutherford. Si la sección transversal diferencial a(O) se define en tal forma que a(O) dll, es el área diferencial del haz incidente de partículas que se dispersa a través de un ángulo 9 en un elemento con un ángulo sólido dll, se puede demostrar mediante la mecánica clásica o la cuántica,t9 que a( O) dO. = ( 15 C. Herring, Bell Syst. zé* ) 2 --dO. 1 2 2Km v0 4 (J (9.11-23) sen 2 Tech. J. 34, 237 (1955). lli C. S. Smith, Phys. Rev., 94, 42 (1954). J 7 F. J. Blatt, Theory of Mobility of Electrons in So lid State Physics, Advances in Research and Applications. Nueva York: Academic Press (1957), Vol. 4. página 199. Véase particuldrmente la página 332 ff. 18 E. Rutherford, Phil. Mag., 21, 669 (1911). 19 R. B. Leighton, Principies of Modem Physics, Nueva York: McGraw-Hill (1959), página 485 ff. Mecanismos de dispersión y movilidad de los portadores de carga 341 y que o Ze 2 tan-=----. 2 Kam*v~ (9.11-24) La geometría de dispersión se ilustra en la figura 9.22 para una interacción de Coulomb de repulsión (hueco ion donador) y en la figura 9.23, para una interacción de Coulomb de atracción (electrón e ion donador); las ecuaciones anteriores se aplican a ambos casos. La cantidad K es la constante dieléctrica de la substancia, v0 es la velocidad inicial (y final), y a es el "parámetro de impacto" o la distancia perpendicular entre el centro de dispersión y la proyección de la línea inicial de acercamiento de la partícula. Para una sola partícula incidente, el número de colisiones que puede sufrir por unidad de tiempo en un ángulo sólido dn, claramente es Nv 0 a(O) dQ, en donde N es el número de impurezas de dispersión por unidad de volumen. Puesto que la energía se conserva en la interacción de dispersión, las magnitudes de las cantidades de movimiento inicial y final de la partícula dispersada son las mismas; sin embargo, puesto que la dirección cambia por acción del ángulo de dispersión (), existe un cambio consecuente en la cantidad de movimiento de la componente x en sentido directo de e flpx = Po(l - COS 0). (9.11-25) Ahora, según (9.11-23), es evidente que casi todas las colisiones producen sólo un pequeño ángulo de deflexión. No obstante, el tiempo de relajación es el lapso que se requiere en promedio para que la velocidad directa de la partícula se reduzca a cero y éste es, obviamente, mucho mayor que el tiempo promedio entre tales eventos de dispersión. En efecto, de acuerdo con (9.11-25), se puede observar que el número efectivo de colisiones que destruyen la velocidad es menor que el número total real de dispersiones, por un factor (1,- cos 0). El número equivalentes de colisiones que destruyen la velocidad por unidad de tiempo, comprendiendo un ángulo de deflexión O en un ángulo sólido dQ no es, por ende, Nv 0 a{O) dQ sino más bien, dnerr = Nv 0 u(O)(l - cosO) dO. = d(l/r). (9.11-26) Estado final Trayectoria del hueco Estado inicial Po Px =Po Ion de impureza, carga +Ze Figura 9.22. La trayectoria de un hueco que se dispersa mediante la interacción de Coulomb con un centro de dispersión fijo de carga + Ze. 342 Semiconductores electrónicos uniformes en equilibrio a Figura 9.23. Trayectoria de un electrón dispersado por un centro fijo de dispersión de carga +Ze. Esta cantidad es precisamente la recíproca del tiempo de relajación para partículas con esta velocidad inicial específica que sufren colisiones relacionadas con este ángulo de dispersión en particular. El tiempo total de relajación se puede calcular integrando sobre el ángulo sólido y promediando sobre las velocidades. Puesto que la dispersión es independiente del ángulo azimutal <P alrededor del eje polar, dQ = 21T sen e de, e integrando (9 .11-26) sobre el ángulo sólido, se puede obtener -1) = 2nNv0 -r(vo f" Bo ( 2 o-(0)(1- cosO) sen OdO= 2nNv 0 2 Ze* 2 ) Km Vo = -16nNv0 (2 ze* 2 ) 2 Km v0 2 2 f" Bo (1- cosO)esen e dO 4 sen 2 2 2 2 (} 0 ) ] In sen-= 8nNv 0 ( Ze* 2 ) In [ 1 + ( 2 Km*v~ • 2 N 1 ,3 2 2Km v0 Ze (9.11-27) Al efectuar la integración, es mejor expresar todas las funciones trigonométricas de acuerdo con el argumento e12. El límite superior de la integral debe ser e=-¡;_ que corresponde a un "choque directo" que refleja a la partícula incidente de nuevo hacia su trayectoria original. Para una colisión de esta naturaleza, el parámetro de impacto a es cero. El límite inferior sería G = O para un centro de dispersión aislado (que daría origen a una sección tranversal para la dispersión infinita); pero dentro del cristal, la influencia de un centro de dispersión individual se extiende hacia afuera sólo a una distancia del orden del espaciamiento medio entre los iones de dispersión Por tanto, conviene "cortar" la dispersión de un ion en particular cuando el parámetro de impacto a es igual a d/2, en donde d = N- 1 / 3 es la distancia media entre los átomos de impureza. Entonces, el límite inferior de la integral se encuentra en 1 (9.11-28) a= 2N1/3 que, de acuerdo con (9.11-24), corresponde a (9.11-29) Mecanismos de dispersión y movilidad de los portadore~ de carga 343 Los cálculos anteriores permiten expresar a -r(v 0) en la forma (9.11-30) Ahora es necesario calcular T por medio del proceso acostumbrado de los promedios, de acuerdo con el cual, (9.11-31) Esta integral no se puede evaluar con prec1s10n por medios analíticos; pero si se observa que el término logarítnúco del denominador sólo varía muy lentamente con respecto a v0 , en comparación con el factor de multiplicación vóe-m*vo 2 12 kT, se puede obtener un valor aproximado suponiendo que el término logarítmico tiene un valor constante que es igual al valor que alcanza cuando el factor de multiplicación es máximo. Se puede asegurar que este valor máximo se obtiene para Vo = .J7kT/m*. Haciendo que v0 sea igual a esta cantidad en el término logarítmico, eliminándolo de la integral y evaluando las integrales restantes de acuerdo con la tabla 5.1, se puede obtener (9.11-32) por lo cual, la movilidad estará dada por (9.11-33) Conwell y Weisskopf11 , 20 desarrollaron originalmente este método de cálculo y (9.11-33) se cita a menudo como la fórmula Conwell-Weisskopf. Brooks y Herring 21 desarrollaron el mismo cálculo de un modo algo más refinado y su resultado es similar, excepto que el término logarítmico que varía con lentitud es algo distinto. Las dependencias en relación con la temperatura y la concentración son idénticas en ambos casos. En el cálculo anterior, el promedio se sacó suponiendo que las superficies de energía eran esféricas. El cálculo para superficies elipsoidales es mucho más complejo y no se efectuará aquí; la magnitud del tiempo de relajación se verá afectada, pero no así las dependencias de la temperatura y la concentración. En 20 Este parece un error en el artículo original de Conwell-Weisskopf que ha persistido en casi todos los estudios de este tema realizados por otros autores. Conwell-Weisskopf indican en su artículo original [su ecuación (18)] que el máximo de la función que multiplica el término logarítmico del integrando en el numerador de (9.11-31) ocurre en v2 =6kT/m, en tanto que basta un simple cálculo para demostrar que en realidad se produce en 7 kT/m. Esto explica el factor 7/2 en el argumento del término logarítmico de (9.11-33) que va en lugar del factor 3, que es el que aparece en la fórmula original de Conwell-Weisskopf. La corrección aplicable al resultado original es obviamente m u y pequeña y no afecta su validez general. 21 H. Brooks, Phys. Rev. 89, 879 (1951). 344 Semiconductores electrónicos uniformes en equilibrio todo el desarrollo se supuso que los átomos de impurezas estaban completamente ionizados; a temperaturas muy bajas¡ esto no es exacto. En estas circunstancias, se debe considerar que la cantidad N de las ecuaciones anteriores representa la concentración exclusiva de los centros de impureza ionizados, como lo indican (9.5-4) o (9.5-8). Esto introduce una dependencia adicional en relación con la temperatura. pero es importante sólo a temperaturas muy bajas. De acuerdo con la ecuación (9.11-33), cuando domina la dispersión de impurezas ionizadas, se debe encontrar que la movilidad es proporcional a T3 12 y que presenta una dependencia inversa en relación con la concentración de impurezas. Aunque es difícil obtener especímenes en los que la dispersión de impurezas determine solamente la movilidad, estas predicciones se han verificado por la experiencia. cuando menos de un modo aproximado. En la figura 9.24 se ilustra una gráfica de la movilidad en función de la concentración de impureza para el germanio. En concentraciones reducidas de impurezas, la interacción de dispelSión dominante es la de la red, es independiente del contenido de impureza, y por tanto la movilidad [como se da, por ejemplo, en (9.11-21)], también es independiente de la densidad de impurezas. A altas concentraciones de átomos de impurezas, la dispersión de impurezas ionizadas se convierte. en el proceso de dispersión más importante y la movilidad decrece al incrementarse la densidad de impurezas, como lo predice la fórmula Conwell-Weisskopf, (9.11-33). En el rango intermedio las interacciones de dispersión de ambos tipos son importantes y la movilidad 1J. debe expresarse como IJ- 1 = IJ.11 + IJ/1 en donde IJ.¡ es la movilidad que puede atribuirse sólo a la dispersión de impurezas ionizadas y IJ.¡ la que se puede encontrar en los casos en que la dispersión de la red es el único proceso importante. Además de la dispersión de la red y la de impurezas, hay otras interacciones de dispersión que tienen una importancia ocasional. Los centros de impurezas neutras, al igual que los ionizados, pueden producir una dispersión apreciable, si existen en cantidades suficientes. Erginsoy 2 2 realizó un estudio de este tema. Se ha descubierto que la dispersión de impurezas neutras es independiente de la temperatura y. por tanto, puede tener importancia a temperaturas muy bajas cuando la dispersión de la red es despreciable y la mayoría de las impurezas no están ionizadas. Es más. las vacantes, átomos intersticiales, dislocaciones, fronteras de grano y las superficies de la muestra pueden dispersar huecos y electrones aunque, en muchos casos, la ¡.<¡ 4000 ------------ 3000 2000 1000 10 20 IC 19 1018 10 17 10 16 10 1 ~ 10 14 10 13 Densidad de donadores Nd (Germanio tipo n, 300°K) Figura 9.24. Efecto de la concentración de impurezas en la movilidad de los electrones, a la temperatura ambiente, en el germanio tipo n, de acuerdo con la teoría ConwellWeisskopf de la dispersión de impurezas. [Tomado de E. M. Conwell, Proc. I.R.E., 40: 1327 (1952).] 22 C. Erginsoy, Phys. Rev., 79, 1013 (1950). Mecanismos de dispersión y movilidad de los portadores de carga 345 dispersión atribuible a estos medios se desecha en comparación con la dispersión de red o impurezas. La exposición del comportamiento volumétrico de semiconductores dada en este capítulo de ningún modo es completa. En realidad, no se han tratado las propiedades térmicas y ópticas en absoluto y, por falta de espacio, ha sido necesario omitir una explicación de los efectos sumamente interesantes que se pueden observar en semiconductores sometidos a esfuerzos hidrostáticos o uniaxiales. 23 No obstante, se espera que este estudio haya aclarado los campos muy básicos e importantes y haya desarrollado métodos de utilidad general en la investigación de algunos de los temas que no se han visto en detalle. EJERCICIOS l. En papel semilogarítmico, haga las gráficas de la concentración de los portadores intrínsecos n¡ en función de 1/T para (a) germanio, (b) silicio, (e) InSb (LlE=0.22 eV, m;!; =0.013 m 0 , mp = 0.18 mo), (d) GaAs (Á€= 1.5 eV, m~= 0.1 m 0 , mp = 0.4 m 0 ). Asegúrese de que las gráficas indiquen con claridad la variación de n¡ en función de T sobre el rango comprendido entre 10° y 500°K. 2. Estudie un semiconductor intrínseco bidimensional en el que, al igual que en los sistemas metálicos bidimensionales, las funciones de densidad de estados son e> ec g(e) =O e.< e< ec g.(e) de= (41Tm: /h 2 ) de e< e. Demuestre, utilizando sólo la estadística de Fermi y sin recurrir a la aproximación de Boltzmann, que para el caso en que mp/m~ = 2, la posición del nivel de Fermi se puede expresar como 1 kT 8 ~ ec- ef = 2 !le- -zln 3 + kTin cos 3' en donde ~ = 32 ]1/2 tan- 1 [ 27 (r"''n)- 1 3. Haga las gráficas de la conductividad para el germanio tii?o p y n en función de la concentración neta de impurezas J/'!.d- Ngl para valores de INd- N0 1 que van de O a 10 1 'cm- 3 a las siguientes temperaturas: 80 K, 300 K, 500°K. Suponga que J.l.n varía como r- 1 •65 Y f.lp como r- 3 ·2 . Haga estas gráficas en papel logarítmico. 4. ¿Para qué valores de concentración de portadores n 0 , Po es mínima la conductividad de un semiconductor? ¿Cuál es el valor del contemdo neto de impurezas ¡Nd- N 0 i que esto implica? 5. Para un semiconductor con superficies de energía esféricas tanto en la banda de conducción como en la de valencia, pero con dos especies de huecos, demuestre que el coeficiente de Hall de campo pequeño se puede escribir como sigue 23 R. W. Keyes, "The Effects of Elast1c Deformation on the Electrical Conductivity of Semiconductors." en Salid State Physics, Advances in Research and Applications. Nueva-York: Academic Press (1960), Vol. 11, página 149. 346 Semiconductores electrónicos uniformes en equilibrio en .do~de Pot. p 02 son las .concentraciones, 1Jp 1 , 1Jp2 las movilidades y Tp 1, Tp 2 los tiempos de relajac!On para las dos especies de huecos. 6. Para cada una de las superficies de energía constante del germanio, encuentre los tensores individuales de conductividad a~'J relacionados con los ejes cúbicos como ejes de coordenadas. En el germanio, las superficies de energía constante son cuatro elipsoides cuyos ejes principales caen a lo largo de las cuatro direcciones (111). Demuestre que el resultado (9.10-23) se obtiene sumando totalmente las elipsoides. 7. Demuestre que si el campo estático está en la dirección [100]. sólo se observará un pico de resonl!-ncia de ciclotr~n a la frecuencia w = ~eJ!/c)[(mf¡ +?ml>!}mfiml2 1I¡2 en el germanio. ~Qué resonancias Se observanan COn el campo estat!CO en fa dueCCIOn r111 l7 8. Con las leyes de la mecánica clásica, derive la fórmula de dispersión de Rutherford (9.11-23) y la relación asociada (9.11-24). 9. Se ha determinado que un espécim de semiconductor tiene una resistividad de 12.5 ohm-cm. El espécimen tiene 1 cm de longitud, por 5 mm de ancho y 1 mm de grosor. Se hace fluir una corriente de 1 mA a lo largo de la dimensión más larga de la muestra y se mide un voltaje de Hall de 5 m V en la anchura de 5 mm de la muestra, cuando se usa un campo magnético de 2000 gauss. ¿Cuál es la concentración de portadores y la movilidad de Hall de los portadores en la muestra? Se puede suponer que la muestra es extrínseca, que las superficies de .:nergías son esféricas y que la dispersión acústica de modo acústico es el proceso de dispersión dominante. 10. Escriba los detalles relacionados con la maximización de la expresión (9.5-2) por el método de los multiplicadores lagrangeanos, completando así la derivación en (9.5-3). 11. Demuestre que (9.3-6) y (9.3-15) se pueden transformar de tal modo que indiquen 12. Explique físicamente las características principales de las curvas experimentales ilustradas en la figura 9.13, y analice las relaciones entre las tres gráficas separadas. LECTURAS RECOMENDADAS A. C. Beer, "Galvanomagnetic Effects in Semiconductors"; suplemento 4 en So/id State Physics. Advances in Research and Applications, Academic Press., Inc., Nueva York (1963). F. J. Blatt, "Theory of Mobility of Electrons in Solids," en So/id State Physics, Advances in Research and App/ications, Vol. 4, Academic Press., Inc., Nueva York (1957). H. Brooks, "Theory of the Electrical Properties of Germanium and Silicon," en Advances in Electronics and Electron Physics, Vol. 7, Academic Press, Inc., Nueva York (1955). E. Burstein y P. H. Egli, "The Physics of Semiconductor Materials," en Advances in Electronics and Electron Physics, Vol. 7, Academic Press., Inc., Nueva York (1955). H. Y. Fan, "Valence Semiconductors, Germanium and Silicon," en So/id State Physics, Advances in Research and Applications, Vol. 1, Academic Press., Inc., Nueva York (1955). R. W. Keyes, "The Effect of Elastic Deformation on the Electrical Conductivity of Semiconductors," en Salid State Physics, Advances in Research and Applications, Vol. 11, Academic Press, Inc., Nueva York (1960). W. Shockley, Electrons and Hales in Semiconductors, D. van Nostrand Co., lnc., Nueva York (1950). R. A. Smith, Semiconductors, Cambridge University Press, Nueva York (1961). cAPITuwlO Exceso de portadores en semiconductores 10.1 INTRODUCCION En un metal prácticamente es imposible alterar la concentración volumétrica de los portadores de carga libres. Se puede introducir un exceso de portadores; pero sólo induciendo una carga eléctrica en el espécimen. En estas condiciones, la densidad de carga en exceso reside esencialmente en la superficie del metal y no se afecta la concentración volumétrica de los portadores de carga. En esta situación no se observa ningún cambio en las propiedades volumétricas de transporte. Sin embargo, en un semiconductor se puede alterar profundamente la concentración de portadores de carga en el material sin introducir ninguna densidad de carga eléctnca importante. Esto se logra gracias a que pueden tenerse simultáneamente dos tipos de portadores de carga, huecos y electrones; si los huecos y los electrones en exceso se introducen en pares, se pueden crear grandes desviaciones de los valores de equilibrio térmico de la concentración volumétrica de portadores sin que se forme ninguna densidad de carga neta. La formación de estas densidades de portadores en exceso del nivel de equilibrio va acompañada de una modulación notable de la conductividad volumétrica del material, como lo establece {9.7-6). Esta posibilidad es la que permite el uso de elementos semiconductores como dispositivos electrónicos tales como rectificadores, transistores y unidades de conmutm:ión. Si se extraen huecos y electrones en pares, se pueden obtener concentraciones volumétricas de portadores inferiores a los valores de equilibrio, con la misma facilidad con que se crean concentraciones en exceso mediante la introducción o inyección de pares de portadores de carga. 11, absorbe. Por tanto, el espectro de absorción de un semiconductor se caracteriza siempre por un cambio muy rápido Los portadores excedentes se pueden crear en los semiconductores iluminando el material con una frecuencia tal que la energía del fotón hwo sea igual o sobrepase a la energía de la banda prohibida ~€. En estas condiciones, los fotones incidentes tienen la suficiente energía para romper los enlaces covalentes de la red de pares de electrones, liberando electrones libres y dejando los huecos en los sitios de excitación. Los electrones y los huecos en exceso que se crean de esta manera en pares, contribuyen a la conductividad del cristal, que luego se incrementa bajo la iluminación, siendo el aumento proporcional a la intensidad de la luz. Este fenómeno se denomina fotoconductividad y es muy característico de todos los semiconductores. Puesto que en la creación de cada par electrón-hueco se absorbe un fotón, la luz con una longitud de onda lo suficientemente corta para que la energía del fotón sobrepase ~€, se absorberá con mucha fuerza dentro del cristal. Por otra 347 348 Exceso de portadores en semiconductores Coeficiente de absorción <T (t) Borde de absorción (hw 0 : Ó<) a ~~x, Opaco 1 Transparente ~----------~.r¡------•X Tiempo 1-- Luz ---l Obscuro (o) Figura 10.1. Obscuro (w>w 0 ) (b) (a) Espectro de absorción de un semiconductor típico cerca del borde de absorción fundamental. (b) Respuesta fotoconductiva de un cristal semiconductor a una luz con una longitud de onda lo suficientemente corta para excitar pares electrónhueco en exceso. parte, la luz con una longitud de onda mayor, cuya energía de fotón es inferior a ~e, no puede crear pares electrón-hueco y raramente se absorbe. Por tanto, el espectro de absorción de un semiconductor se caracteriza siempre por un cambio muy rápido en el coeficiente de absorción, a una longitud de onda que corresponde a la energía del fotón ~e, teniendo el cristal una mayor fuerza de absorción para longitudes de onda más corta y siendo casi transparente para longitudes de onda más largas, como se ilustra en la figura lO.l(a). La región de transición brusca de la opacidad a la transparencia se denomina borde de absorción. En el germanio, el borde de absorción se produce en el infrarrojo cercano a aproximadamente X = 1.75 Jl., correspondiendo a ~€ = 0.7 eV, y en el silicio, a alrededor de 1.13 Jl., correspondiendo a ~e= 1.12 eV. La banda de energía prohibida ~e se puede determinar con precisión en el espectro de absorción, midiendo la longitud de onda a la que se produce el borde de absorción. En la figura 1O.l(b) se muestra la respuesta fotoconductiva de un semiconductor a la luz con una longitud de onda lo suficientemente corta para crear pares electrón-hueco. Los portadores excedentes también se pueden crear en cristales semiconductores por medio de haces de partículas de alta energía (electrones, protones, partículas a), rayos X, radiación 'Y y mediante contactos metal-semiconductor debidamente polarizados o uniones p-n. Volveremos sobre estos conceptos más adelante. 10.2 COMPORTAMIENTO DEL TRANSPORTE DE LOS PORTADORES EXCEDENTES; LAS ECUACIONES DE CONTINUIDAD En cualquier cristal semiconductor, continuamente se generan pares electrón· hueco por medios térmicos o de otra índole, y se están recombinando de un modo continuo. En equilibrio térmico, el único proceso de generación es el térmico. La velocidad a la que se generan los pares y a la que se recombinan debe ser idéntica: de otra manera, la concentración de electrones. y huecos crecería o declinaría como una función del tiempo. La velocidad de generación térmica de equilibrio g 0 ( cm- 3 seg- 1 ) es el número de pares electrón-hueco generados por unidad de volumen en unidad de tiempo, mediante la ruptura térmica de enlaces covalentes. Esta Comportamiento del transporte 349 cantidad es una función de la temperatura y ciertos parámetros del cristal; pero es independiente de la concentración de electrones y huecos. La velocidad de recombinación se relaciona con el tiempo medio que transcurre entre la generación de un electrón o un hueco y su recombinación subsecuente. Esta cantidad se conoce como tiempo medio de vida del portador. Si sólo se tuviera un portador de una especie dada por unidad de volumen del cristal, en cualquier tiempo en particular, el número de sucesos de recombinación por unidad de volumen por segundo de este tipo de portador sería 1/r, en donde T es el tiempo de vida de dicha especie de portadores.1 Cuando se tienen n portadores por unidad de volumen, la velocidad de recombinación (número de eventos de recombinación por unidad de volumen por unidad de tiempo) es n veces mayor, es decir, n/r. En las condiciones de equilibrio térmico, la concentración de electrones es n 0 y la concentración de huecos es p 0 y, puesto que las velocidades de generación y recombinación de huecos y electrones deben ser iguales en estas circunstancias, es obvio que y (10.2-1) en donde g 0 n y g 0 P son las velocidades de generac10n térmica en equilibrio para electrones y huecos, respectivamente, y en donde T no y T po son los tiempos de vida promedio para las especies de portadores respectivas en la situación de equilibrio. Además, puesto que la generación térmica siempre da como resultado la producción de pares electrón-hueco, se está generando un hueco por cada electrón y g0 n y g0 p deben ser iguales, de donde, (10.2-2) La igualdad de las velocidades de generación y recombinación se aplica a todos los sistemas de estado estacionario, aun los que no están en equilibrio térmico. La igualdad de las velocidades de generación de electrones y huecos, así como la igualdad de las velocidades de recombinación de electrones y huecos, deben conservarse también en sistemas que no se encuentran en la situación del estado estacionario, ya que la generación (o recombinación) de un electrón va acompafíada inevitablemente de una generación (o recombinación) de un hueco. No obstante, en sistemas que no tienen un estado estaeionario, las velocidades de generación y recombinación para electrones (o huecos) pueden ser diferentes. En todo caso, es necesario escribir siempre y (10.2-3) en donde gn y gP son las velocidades reales de generación, n y p las concentraciones locales y ·r n y T P el tiempo de vida de electrones y huecos, respectivamente. En 1 Hasta ahora se han usado los símbolos T n• T P y T para representar los tiempos de relajación asociados con procesos de dispersión. Sin embargo, los mi;;mos símbolos se usan universalmente en las obras impresas para representar también los tiempos de vida de recombinación. Puesto que esta práctica ha quedado justificada por los numerosos años de uso y, dado que no se desea adoptar una notación muy compleja, se usarán los mismos símbolos para los dos grupos de cantidades. No obstante, de aquí en adelante se dará por sentado que T, Tn y T P se refieren siempre a los tiempos de vida de recombinación, a menos que se especifique otra cosa. 350 Exceso de portadores en semiconductores X Figura 10.2. x+dx Flujo de portadores que entran y salen de un pequeño elemento de volumen del cristal. estas ecuaciones, las velocidades de generac10n gn y gP, al igual que las concentraciones n y p, y los tiempos de vida r n y T P, deben considerarse generalmente como funciones de las coordenadas de espacio y tiempo, dentro del cristal. Ahora se verá una región del cristal cuyas dimensiones son dx, dy, dz, como se indica en la figura 10.2. Supóngase que hay unas densidades de flujo de partículas JP y Jn de huecos y electrones, respectivamente, que fluyen dentro y fuera de esta región. La componente x de J P en x + dx se puede expresar en función de J P en x, haciendo una expansión de Taylor de lpx(x + dx); en el límite en donde dx se hace pequeña, sólo los dos primeros términos son importantes, de donde, ()Jpx JPix + dx) = JPx(x) + ox dx. (10.2-4) El incremento neto en el número de huecos dentro de la región, por unidad de tiempo, originados en una diferencia en las componentes x de JP en las dos caras ABCD y EFGH, entonces es [Jpix)- Jpx(x + dx)] dy dz = a: oJ dx dy dz. (10.2-5) También se tendrán términos similares que se originan en la diferencia de las componentes y de JP en las caras ACGE y BDHF, y en la diferencia de las componentes z de JP en ABFE y CDHG. El incremento neto total por unidad de tiempo en el número de huecos dentro de la región, que se origina debido a estos términos es - V • JP dx dy dz. Si los procesos de generación y recombinación son activos dentro del volumen, habrá gp dx dy dz huecos generados y (pjr P) dx dy dz que se pierden por recombinación por unidad de tiempo dentro de la región de interés. La suma algebraica de todas estas cantidades representa el incremento neto total del número de huecos dentro del volumen dx dy dz por unidad de tiempo que es, evidentemente, (opjot) dx dy dz. Si se saca la suma algebraica de las diferentes contribuciones, se iguala a (opfot) dx dy dz y se anula el elemento de volumen en ambos lados de la ecuación, se puede demostrar que P op -V·J P +g p - =Ot -' t" p (10.2-6) Comportamiento del transporte 351 mientras que con un cálculo similar para los electrones dentro del mismo elemento de volumen, se obtendrá n on 'n t -V ' Jn + Un - - = -0 • (10.2-7) Las expresiones ( 10.2-6) y ( 10.2-7) se citan como las ecuaciones de continuidad para los electrones y los huecos. En condiciones apropiadas de frontera, las soluciones de estas ecuaciones describen la distribución de la concentración de electrones y huecos en función de las coordenadas del espacio y el tiempo, y proporcionan una descripción completa del comportamiento de transporte de electrones y huecos dentro del semiconductor en condiciones que no sean las de equilibrio. Para llegar a soluciones explícitas de las ecuaciones de continuidad, es necesario expresar la corriente en función de la concentración. Esto se logra escribiendo la densidad del flujo de partículas como la suma de una densidad de flujo de difusión y una densidad de corriente de arrastre producida por cualquier campo eléctrico que pueda estar presente. En consecuencia, se puede escribir (10.2-8) y (10.2-9) El origen de la componente de corriente debida al campo, en las ecuaciones anteriores, queda perfectamente en claro. 2 El término de difusión establece que siempre que exista un gradiente de concentración Vp, se tendrá un flujo neto de corriente de partículas de las regiones de alta concentración a las de baja concentración, proporcional al gradiente de la concentración en cualquier punto. Este flujo de difusión es análogo al flujo de calor en presencia de un gradiente de temperatura. La constante de proporcionalidad se denomina coeficiente de difusión o difusibilidad. Se puede demostrar rigurosamente que la componente de difusión de la corriente debe tener esta forma, aplicando los métodos desarrollados en el capítulo 7, principiando con la ecuación de Boltzmann y suponiendo la aproximación del tiempo de relajación (7.24). No se incluirá aquí la reproducción de los detalles de esta demostración, sino que se asignarán como un ejercicio para el lector, lo cual constituye una buena práctica en el uso de la teoría del transporte que se vio con anterioridad. Cuando la trayectoria libre media es independiente de la velocidad, que es una aproximación aceptable en los semiconductores, en donde la dispersión de red es el proceso dominante, resulta que los coeficientes de difusión de los electrones y los huecos se pueden expresar como y (10.2-10) en donde "-n y Ap son las trayectorias libres medias del electrón y el hueco, y en y cP son las velocidades térmicas medias de los electrones y los huecos, respectivamente. En las circunstancias en que ( 10.2-10) es válida, las trayectorias libres medias 2 En (10.2-8) y (10.2-9) se supone que no hay campos magnéticos presentes o cuando menos, que, su efecto en los portadores es pequeño en comparación con el del campo eléctrico. Los símbolos ln y Jp se usarán para representar la densidad de flujo de partícula en tanto que In(=- eJn) y lp(= eJp) se usarán para la densidad de la corriente eléctrica. 352 Exceso de portadores en semiconductores y los tiempos de relajación de electrones y huecos están relacionados por medio de (7 .3-18). Si las ecuaciones (10.2-10) se expresan en función de los tiempos de relajación, y si las velocidades térmicas se representan por (5.4-20), con el uso de las masas efectivas apropiadas, se puede demostrar fácilmente, utilizando (7.3-13), que los coeficientes de difusión se pueden representar de acuerdo con las movilidades como sigue y p.PkT D =--. e P (10.2-1!) Estas relaciones entre los coeficientes de difusión y las movilidades se conocen como relaciones de Einstein. Aunque se derivaron antes basándose en suposiciones muy restrictivas, se puede demostrar que se aplican a todos los sistemas que obedecen a la estadística de Boltzmann. En realidad, si se incluye una constante numérica apropiada, se puede demostrar que se aplican también a los sistemas de Fermi. Si las ecuaciones de la corriente ( 10.2-8) y ( 10.2-9) se substituyen en las ecuaciones de continuidad (10.2-6) y (10.2-7), esta última se puede escribir como p iJp DpV2 p - p. pV • (pE) + g p - 't- p = -iJt (10.2-l2J y n iJn DnV 2 n + p.n V· (nE) + gn - =.., ot . (10.2-13) Los términos de divergencia en las ecuaciones anteriores se pueden transformar a una forma más manejable utilizando la identidad vectorial V· (</JA) =A· V</J + </JV ·A (10.2-14) que es aplicable a cualquier vector A y cualquier función escalar 1/J. De igual manera, conviene expresar las velocidades de generación como la suma de la velocidad de generación térmica, más la velocidad a la que se generan los portadores en exceso de la velocidad de generación térmica, de donde, g, = gon + g~ y gp = gOp + g~, (10.2-15) en donde g~ y g~ son las velocidades de generación del exceso. Las velocidades de generación térmica pueden expresarse ahora en función de las concentraciones en equilibrio y los tiempos de vida por medio de (10.2-l). Después de efectuar estas transformaciones, las ecuaciones de continuidad (10.2-12) y (10.2-13) toman la forma (10.2-16) n n0 ) iJn D,V 2 n + p.,(E • Vn + nV • E) + g~ - ( - - = -. -r,. -r,.o iJt (10.2-17) El campo E se puede expresar como la suma del campo aplicado y el campo interno que se origina por el hecho de que las partículas en difusión están cargadas, por lo cual, E = E;nt + Eap. (10.2-18) Comportamiento del transporte 353 Concentración - Etnt t=o l>o -x (e) (a) Figura 10.3. Etapas sucesivas en la dispersión difusiva de una distribución de pru:es electrónhueco en exceso, que inicialmente tiene la forma de una función 8 en un semiconductor intrínseco. El campo interno tiene su origen en el hecho de que las trayectorias libres :nedias (y, por ende, los coeficientes de difusión) de los electrones y los huecos pueden ser diferentes. Si los electrones y los huecos pudieran moverse por completo de un modo independiente entre sí, las especies de difusión más rápida tenderían a adelantarse a las especies de difusión más lenta, dejando a estas últimas totalmente detrás. Sin embargo, ya que las partículas de difusión están cargadas, cuando esto sucede en realidad, comienza a producirse una separación de las cargas positivas y negativas, se establece un campo eléctrico interno que tiende a retardar a las partículas de difusión rápida y a impulsar a las más lentas. Este es el campo Eint de la ecuación (10.2-7). Finalmente, este campo se hace lo suficientemente fuerte para contrarrestar por completo cualquier tendencia de las distribuciones de carga positivas y negativas a separarse más todavía; entonces, las distribuciones de partículas positivas y negativas se difunden juntas y el coeficiente de difusión efectiva es mayor que el de las especies de difusión más lenta, pero menor que el del tipo de difusión más rápido. Este fenómeno, denominado difusión ambipolar, se ilustra en la figura 10.3. Como se verá en seguida, un efecto similar altera el carácter del movimiento de arrastre que se produce cuando existe un campo eléctrico aplicado. En las ecuaciones (10.2-16) y (10.2-17), es evidente, de acuerdo con la exposición anterior, que en realidad contienen tres cantidades desconocidas, n, p y E. Para encontrar estas cantidades, es necesario recurrir a otra ecuación. El conjunto de ecuaciones se puede completar escribiendo la expresión de Poisson que relaciona el campo eléctrico y la densidad neta de carga e(p - n + Nd -Na+ Pa - nd ). De acuerdo con esto, V. E= 4np = 4ne(p- n + N 4 - Na+ Pa- n4) K K (10.2-19) en donde K es la constante dieléctrica. Debe hacerse notar que, puesto que el campo aplicado Eap no tiene fuentes o pozos internos, su divergencia es cero, por lo cual, de acuerdo con (10.2-18) V· E= V· E;nt· (10.2-20) Las ecuaciones (10.2-16), (10.2-17) y (10.2-19) forman ahora un conjunto de tres ecuaciones que en principio, pueden resolverse para las tres incógnitas n, p y Eint· Desafortunadamente parece no existir un medio para llegar a una solución de estas tres ecuaciones de una manera analítica directa. Por tanto, es necesario hacer 354 Exceso de portadores en semiconductores una aproximación física razonable que permita llegar a una solución que, aunque no sea exacta, sea adecuada para la mayoría de los casos de importancia práctica. La aproximación que se utilizará con este fin es la condición de neutralidad eléctrica o la suposición de balance de carga. Se supondrá en (10.2-16) y (10.2-17) que la densidad de electrones en exceso ón = n- n 0 se equilibra mediante una densidad de huecos en exceso óp = p- Po. Es evidente que esto no es del todo cont:cto, porque entonces, jamás se podría establecer un campo interno, y es este campo interno, originado en la disparidad básica de las trayectorias libres medias de electrones y huecos, el que tiende a conservar unidas las distribuciones de densidad de electrones y huecos de difusión. N o obstante, esta pequeña diferencia entre la densidad de electrones y huecos (en comparación con las densidades de excesos de portadores propiamente dichas) es lo que se requiere normalmente para crear este campo interno. La aproximación del equilibrio de carga es casi siempre apropiada en lo que respecta a las densidades de portadores de las ecuaciones ( l 0.2-16) y (1 0.2-17). Sin embargo, no es de esperarse que se use la suposición de neutralidad de carga en (10.2-19). Al contrario, se puede calcular el campo Eint a partir de (10.2-16) y (1 0.2-17) empleando la suposición de neutralidad de carga, ya que entonces se tendrán sólo dos incógnitas, óp y E¡n t' en estas ecuaciones. Este valor calculado de Eint se puede utilizar en (10.2-19) para determinar la densidad de la fuente (y, por tanto, la disparidad en las densidades de electrones y huecos) requerida para mantener el campo. Si la densidad de la fuente calculada es sólo una fracción pequeña de las densidades de electrones y huecos en exceso calculadas en (1 0.2-16) y (1 0.2-17), se puede tener la seguridad de la consistencia de los cálculos y la validez de las suposiciones en las que se basan; de otra manera, será necesario llegar a la conclusión de que los resultados no concuerdan con las hipótesis originales y los cálculos están equivocados. Más tarde se verá que el primer caso es el que se encuentra casi siempre en la práctica real. 3 Por tanto, siguiendo esta línea de razonamiento, se supondrá inicialmente que (10.2-21) bn = n- n 0 = p- Po= bp. Este estudio se limitará a muestras homogéneas, en donde la densidad de impurezas es uniforme en todo el material. Para tales muestras, n 0 y p 0 son constantes y los gradientes y las derivadas del tiempo para n y p son iguales a los gradientes y a las derivadas del tiempo de ón y óp, respectivamente. De igual manera, de acuerdo con (10.2-3), se ve claramente que los términos de generación y recombinación de (10.2-12) son iguales a los de (10.2-13). Los términos de generación y recombinación de (10.2-16), que se originan directamente de los términos correspondientes de (10.2-12) son iguales a los términos de generación y recombinación de (10.2-17) que se originan en la misma forma que los términos de (10.2-13). Si se emplean estos resultados en (10.2-16) y (10.2-17), se puede demostrar que DPV 2 (bp)- J.lp(E. V(bp) + pV. E)+ g'- o(bp) (Po+'P bp - Po) - = - - (10.2-22) O( !Po 2 • D"V (bp) + J.ln(E • V(i5p) + nV ·E) +.g'- (Po +bp - Po) o(bp) - = - (10.2-23) Tp !Po O( 3 W. van Roosbroeck fue el primero en adoptar esta línea de planteamiento para el caso del semiconductor [Phys. Rev., 91, 282 (1953)]; pero mucho antes se utilizaron métodos similares para resolver problemas relacionados con el transporte de electrones e iones en descarga~ gdseosas, que son muy similares. Comportamiento del transporte 355 en donde (10.2-24) El término que comprende V • E se puede eliminar multiplicando (1 0.2-22) por nJJ.n, (1 0.2-23) por PJJ.p y sumando las dos ecuaciones (observando en (1 0.2-21) que n - p = n 0 - Po) para obtener npnDp + PJ1pDn V2(bp) _ llnJ1p{no- Po) E. V(bp) + g' _(Po+ bp _Po)= iJ(bp). nJln + PJlp nJ1n - Pllp 7: p 7: PO iJt (10.2-25) Ahora, en el coeficiente del primer término anterior, las movilidades se pueden expresar en función de los coeficientes de difusión mediante las relaciones de Einstein (10.2-11). Por tanto, la ecuación (10.2-25) se puede escribir como sigue bp iJ(bp) D*V 2 (bp)- 11*E • V(bp) + g' - - = - r iJt (10.2-26) D* = ( n + p )D .D P = -,---(_n-'-0-=-+~P_o_+_2.,-b_p_)D_n-::-D~P:-=nDn + pDP (no+ bp)Dn +(Po+ bp)Dp (10.2-27) en donde (10.2-28) y en donde T es un "tiempo de vida del portador en exceso" definido por bp Po + bp Po n 0 + bp n0 (10.2-29) 7: La concentración en exceso de las otras especies de portadores, on, es por supuesto igual a op de acuerdo con la suposición del balance de carga (10.2-21). La expresión ( 10.2-26) es la ecuación de transporte ambipolar que obedecen la densidad de electrones y huecos en exceso. 4 El coeficiente de difusión ambipolar D* y la movilidad ambipolar p*, de acuerdo con (1 0.2-27) y (10.2-28) en general, son dependientes de la concentración op de portadores en exceso. Es imposible resolver (10.2-26) en estas circunstancias y casi siempre se debe proceder a partir de este punto, a usar métodos numéricos o de aproximación. No obstante, si la densidad de portadores en exceso op es mucho menor que la mayor de las dos cantidades (n 0 , p 0 ), D* y p* son substancialmente constantes y se pueden obtener fácilmente soluciones analíticas para (10.2-26). Este estudio se restringirá al análisis de situaciones en que se satisface esta condición y ésta se denominará el caso de nivel bajo. 4 Esta ecuación se parece a la de \:Ontinuidad para partículas que se difunden de un modo mdependiente, que tendría la forma (10.2-13); pero no es exactamente la misma, ya que el término E· \1p substituye a \1 ·(pE). Si el campo es constante, los términos son iguales; pero, de otra manera, las ecuaciones y sus soluciones serán diferentes. 356 Exceso de portadores en semiconductores Ahora se verá el caso de un material fuertemente extrínseco tipo n, en donde n 0 >Po o 6p. Por ejemplo, supóngase que se tienen 10 15 electrones y 1011 huecos por cm 3 en equilibrio. Se tendrá un tiempo de vida de electrones en equilibrio T no y un tiempo de vida de huecos en equilibrio T po que estarán relacionados por (10.2-2) ó (10.2-3). Es obvio que T po es mucho más pequeño (por un factor de 1O" en este caso) que T n 0 • Supóngase ahora que se crea una densidad uniforme de pares electrón-hueco en exceso de tal modo que 6p = 6n = 10 11 cm- 3 • La caneentracción de electrones ahora es n0 + 6n = 1.0001 x 10 15 cm- 3 , con un .incremento del 0.01 por ciento sobre la densidad de equilibrio, en tanto que la concentración de los huecos es 2 x 10 11 , que es el doble de la densidad de equilibrio. Puesto que la densidad de electrones relativa a la densidad de equilibrio prácticamente no se altera la probabilidad por unidad de tiempo de que un hueco dado se encontrará con un electrón casi no varía tampoco. En consecuencia, el tiempo de vida del hueco no se afecta y será prácticamente independiente de 6p para valores pequeños como estos de 6p. Por otra parte, puesto que la densidad de los huecos se ha duplicado, la probabilidad de que cualquier electrón dado se encuentre con un hueco se ha duplicado también, y el tiempo de vida del electrón se reducirá más o menos a la mitad de lo que era en el estado de equilibrio. De donde, el tiempo de vida de electrones debe variar rápidamente con 6p aun a pesar de, que dicha cantidad sea muy pequeña. Evidentemente, la situación será justamente la opuesta en un material tipo p sumamente extrínseco. En general, se observa que el tiempo de vida de los portadores minoritarios es fundamentalmente independiente de 6p para valores pequeños de 6p, en tanto que el tiempo de vida de los portadores mayoritarios no lo es. En un semiconductor de fuerte tipo n, T P = r P para 6p <no, y el tiempo de vida de los portadores en exceso r, como lo define (~0.2-29) se reduce a (10.2-30) (material de fuerte tipo-n) De la misma manera, para un cristal tipo p fuertemente extrínseco, se ve claramente que ( 10.2-29) se reduce a (10.2-31) (matenat de fuerte tipo-p) Luego para el caso de nivel bajo, el tiempo de vida de los portadores en exceso T se reduce simplemente al tiempo de vida de los portadores minoritarios. Los términos tiempo de vida de portadores en exceso y tiempo de vida de portadores minoritarios se usan con frecuencia indiferentemente, a pesar de que no siempre son iguales. En especial, cuando las condiciones del caso de nivel bajo no se satisfacen o cuando el cristal es casi intrínseco, el tiempo de vida de los portadores en exceso T difiere del tiempo de vida de los portadores minoritarios. Este tiempo de vida de los portadores en exceso es el que se mide casi siempre en los experimentos diseñados para detectar la fotoconductividad de los portadores en exceso. En las condiciones de nivel bajo, (1 0.2-27) y ( 10.2-28) muestran que en el caso de un semiconductor tipo n fuertemente extrínseco, D* y p* se reducen a Dp y llp y que, para un material tipo p fuertemente extrínseco, D* y p* se reducen a Dn Y lln· Si se combinan estos resultados con los expresados en (10.2-30) y (10.2-31), se puede escribir la siguiente expresión para las muestras extrínsecas tipo n bp c(t5p) O( D V 2(t5p)- p. E· V(bp) + g ' - - = - P p T Po (no~ p0 ,t5p) (10.2-32) Comportamiento del transporte 3S7 y para muestras extrínsecas tipo p (p 0 ~ n0 ,<5n). (10.2-33) En cualquier caso, la concentración de la otra especie se obtiene de la relación 8p = 8n. Estas ecuaciones son muy parecidas a las de continuidad para el flujo de portadores minoritarios. Los parámetros de transporte y recombinación, en todos los casos, son los de los portadores minoritarios. A menudo se dice que en la situación anterior, se escribe y resuelve la ecuación para los portadores minoritarios de flujo de difusión, aunque esto no es cierto en realidad: las t::cuaciones (10.2-32) y (10.2-33) además contienen una suposición implícita relacionada con el comportamiento de los portadores mayoritarios. En una muestra para la que n 0 y Po no son muy diferentes y en donde 8p es mucho menor que el valor más pequeño de (n 0 , p 0 ), los coeficientes de transporte ambipolar, (10.2-27) y (10.2-28), son constantes y se puede expresar como D* =(no + Po)DnDp = (p~ + nf)DnDp n 0 Dn + p0 DP nfDn + p~DP (10.2-34) y (10.2-35) El coeficiente de difusión ambipolar se acerca a Dp para p 0 ~ n¡ y a Dn para p 0 ~ n¡. Para valores intermedios de Po, D* queda en algún punto entre estos dos valores extremos. De igual manera, para p 0 ~ n¡, p.* tiende a Jl.p y, para p 0 ~ n¡, p.* tiende a - P.n, quedando entre estos límites para valores intermedios de p 0 . Para un material que es precisamente intrínseco, Po = n¡ y las ecuaciones anteriores se reducen a y p.~= o, (10.2-36) de donde, la ecuación de continuidad (10.2-26) se convierte en (10.2-37) En realidad, para un material precisamente intrínseco, se observa en (10.2-27) y ( 10.2-28), que esta es la ecuación de continuidad correcta para 8p sin importar lo grande que sea 8p en comparación con n 0 o p 0 • De la misma manera, se puede ver que esta ecuación de continuidad es aproximadamente correcta para los materiales casi intrínsecos, siempre y cuando la densidad de portadores en exceso 8p tenga un exceso muy notable en relación ecn h1 densidad de los portadores mayoritarios en equilibrio, ya que en es'te caso, p.* se hace siempre muy pequeño. Como se verá en un capítulo posterior, este hecho sunplifica enormemente el análisis de las estructuras de dispositivos semiconductores en condiciones de corriente elevada. El hecho de que p.* tienda a cero en muestras intrínsecas, no significa que los electrones y los 358 Exceso de portadores en semiconductores huecos no adquieran una velocidad de arrastre cuando se aplica un campo eléctrico, sino solamente que una distribución de la concentración de portadores en exceso no tiene arrastre en estas circunstancias. Los electrones y los huecos entran y salen de una distribución semejante aunque la distribución propiamente dicha pueda permanecer estacionaria o casi estacionaria. Se debe tener cuidado de observar que el campo eléctrico E de las ecuaciones (10.2-26), (10.2-32) y (10.2-33), se relaciona con el campo eléctrico total como lo defme (10.2-18), que incluye el campo interno originado por la difusión ambipolar y el arrastre de las partículas cargadas del sistema. Se puede derivar una expresión para este campo haciendo notar que la densidad total de la corriente eléctrica 1 se puede escribir, con la ayuda de (10.2-8), (10.2-9) y (10.2-21}, como 1 = e(J,- Jn) = uE + e(Dn- D,)V(bp), (10.2-38) en donde a es la conductividad según la da (9.7-5). Resolviendo para el campo, utilizando las relaciones de Einstein para expresar las constantes de difusión en los términos de las movilidades e introduciendo la relación de movilidad b, se puede obtener 1 kT b- 1 E = - - - -b-- V(bp) = Eap.+ E;n 1• q e n +p (10.2-39) El primer término anterior es el campo que se crea al aplicar una fuente de potencial externo y el segundo representa el campo interno. Es evidente que el campo interno, como se expresa en el segundo término, se desvanece cuando no existe un gradiente de concentraCión de portadores y también, si las movilidades de huecos y electrones son idénticas (b = 1). En el último caso, (10.2-27) y (10.2-28) dan D* = D y p.*= [(n 0 - p 0 )/(n + p))p., en donde D y p. son el coeficiente de difusión de huecos y electrones y la movilidad. Utilizando estos valores, se puede proceder a resolver (10.2-26) usando para E el valor del campo aplicado y sin dar mayor interés al campo interno. Para materiales en los que las movilidades de los electrones y los huecos son distintas, es evidente que el campo interno contribuirá al campo total E de (10.2-26). Sin embargo, se verá que en la gran mayoría de los casos, se puede hacer caso omiso de esta contribución. La razón es que, además de los efectos que se han incorporado en los coeficientes de transporte modificados D* y p.*, el campo interno ejerce ordinariamente sólo una pequeña influencia directa en la distribución espacial de los portadores en exceso, en comparación con la de la difusión y los campos aplicados. Esto se puede demostrar comparando las soluciones de (10.2-26) en donde existe una difusión, pero no hay campo, y cuando se tiene un campo; pero esencialmente ninguna difusión. En el primer caso (suponiendo una geometría unidimensional en la que 8p varía en la dirección x, en que la velocidad de generación volumétrica en exceso g' es cero y que prevalecen las condiciones de estado estacionario de tal modo que a(8p )jat = 0), la ecuación (1 0.2-26) se reduce a (10.2-40) Si sólo se buscan soluciones que tiendan a cero conforme x aumenta, se debe escribir (10.2-41) Comportamiento del transporte 359 como la solución de (10.240). Por otro lado, si existe un campo constante E y si el transporte de difusión puede omitirse, (10.2-26) se puede escribir aproximadamente como d(~p) ~p dx = - p*E-r' (10.2-42) cuya solución es (10.2-43) De acuerdo con estas ecuaciones, es obvio que existe una longitud característica (D*r ) 1 / 2 asociada con el transporte puramente difusivo en el estado estacionario, y otra longitud característica p.*Er en este caso, en donde el efecto del campo es predominante. Si el campo es cero, la segunda longitud será también cero. Queda claro, de acuerdo con los resultados anteriores, que la distribución de portadores en exceso resultante del transporte puramente difusivo, no se verá muy afectado por la presencia de un campo eléctrico, a menos que dicho campo sea tan grande que p*Er sea comparable en magnitud con la longitud característica de difusión (D*r ) 1 / 2 . En otras palabras, si (10.2-44) ó entonces, el efecto del campo eléctrico en la distribución de la concentración de portadores en exceso será despreciable. Al incluir los valores de D* y p.* de (10.2-27) y ( 10.2-28) y el valor del campo interno dado en (10.2-39), en esta expresión, se puede obtener como condición para el gradiente de concentración que IV(~p)l ~ 1 (n + p)(nb + p) .JD*t (b - 1)(no - Po) (10.2-45) para que el efecto del campo interno pueda omitirse en (10.2-26). En la práctica se puede proceder inicialmente omitiendo el campo interno y calculando rrp a partir de (10.2-26), utilizando el campo aplicado en el lugar de E. El gradiente de op se calcula entonces basándose en la solución resultante y se comprueba con (10.245) para asegurarse que la solución satisfaga esta condición en todos los puntos dentro de la región de interés. Si se violara (10.245), la solución tendría que rechazarse y sería necesario elaborar un nuevo cálculo en el que se incorporara el campo interno desde el principio. En sistemas puramente difusivos, se verá que la solución tiene a menudo la forma op = (const) e-xfL en donde L es aproximadamente (si no con precisión) igual a (D*r ) 1 12 • En tales casos, el gradiente de op está dado por - opfL. Se ve claramente en la forma de ( 10.245), que la condición que expresa esta ecuación nunca se viola seriamente, sean cuales fueran los valores que puedan tener n 0 , p 0 , op y b. Se pueden obtener valores mayores de V(~p) si hay un campo aplicado presente; pero en estas circunstancias, aunque la condición ( 10.245) ya no se satisfaga, se encontrará por lo general que el campo interno que se genera ahora es pequeño, en comparación con el campo aplicado que se requiere para mantener este estado. De donde, se puede llegar a la conclusión de que generalmente es buena aproximación considerar que el campo E de la ecuación (10.2-26) es el campo aplicado, sólo haciendo caso omiso del efecto explícito del campo interno. No obstante, se debe notar que el efecto del campo interno está implícitamente comprendido en los coeficientes de transporte modificados D* y p*. 360 Exceso de portadores en semiconductores Las ecuaciones de continuidad (10.2-16) y (10.2-17) conducen directamente a la ecuación diferencial ( 10.2-26) para fJp, cuando se hace la suposición de la neutralidad eléctrica. Cuando una expresión de fJp se ha obtenido como solución a (10.2-26), la validez de la suposición de neutralidad eléctrica se puede corroborar fácilmente computando la desviación de la neutralidad de carga para producir el campo interno dado por ( 10.2-39) y comparando la diferencia en las densidades de carga obtenidas de esta manera, con la densidad total de portadores excedentes que se obtuvo en la solución (Hl.2-26). Usando (9.5-12), se puede escribir la ecuación de Poisson (10.2-19) en función de las densidades de exceso fJn y fJp; si se usa (10.2-20) y (10.2-39) para expresar el campo eléctrico, se obtiene = 4ne(bp- bn) = kT ~ V 2 (bp). V. E. IRI e nb + p K (10.2-46) La razón de la diferencia de densidades fJp - fJn requerida para establecer el campo interno a una densidad real, fJp se puede escribir como sigue (10.2-47) La expresión del lado derecho de esta ecuación debe ser mucho menor que la unidad para que sea válida la suposición del balance de carga ( 10.2-21 ). Esta condición se puede expresar de un modo algo diferente m•lltiplicando el numerador y el denominador anteriores por n¡. Por tanto, la condición para la validez de la suposición del balance de carga se convierte en l)ni V (8p) 1 -lbp-bponl = L (bnb + p op ~-=--- 2 2 D, ~ (10.2-48) en donde (10.2-49) ¡:s un parámetro con las dimensiones de longitud, que se conoce como "longitud intrísenca de Debye" asociada con el material. A 300°K, la longitud intrínseca de Debye es aproximadamente 34¡.t para el silicio y 0.96¡.t para el germanio. Si, como sucede con mucha frecuencia, la densidad de concentración en exceso tiene la forma fJp = (const)e±xJL en donde L es una distancia característica de decaimiento que en sistemas puramente difusivos tiene el valor (D*T) 1 12 , entonces, V2(f>p)fop = 1fL2 y (10.243) se puede expresar como bp - bnl = L~, (b - l)n; ~ l. bp L2 nb + p (10.2-50) ' Esto deja en claro que la suposición de la neutralidad eléctrica debe ser aceptable cuando la distancia característica L es mucho mayor que la longitud intrínseca de Debye y cuando nb + p es mucho mayor que (b - l),li' Estas condiciones se satisfacen casi siempre en muestras intrínsecas o extrínsecas de silicio y germanio, a menos que el tiempo medio de vida de los portadores en exceso, T, sea extremadamente Algunas soluciones particulares de la ecuación de continuidad 361 corto. En los semiconductores compuestos de tipo III-V, como inSb y GaAs, los tiempos de vida de los portadores, por lo general son muy cortos; para estos materiales, la condición (10.2-50) se satisface con frecuencia, aunque no siempre. Las substancias semiaisladoras en las que nb + p, al igual que L pueden ser muy pequeñas, la condición ( 10.2-50) se viola la mayor parte de las veces y es necesario aplicar otros métodos para analizar los problemas de los portadores agregados. En consecuencia, la situación es por lo general muy compleja, aunque Roosbroeck 5 desarrolló una teoría muy general para el análisis de problemas de esta índole. Puesto que la suposición del balance de carga es válida para la gran mayoria de los casos relacionados con los materiales semiconductores más conocidos, no se tomarán en cuenta explícitamente las situaciones en que se viola. 10.3 ALGUNAS SOLUCIONES PARTICULARES DE LA ECUACION DE CONTINUIDAD A continuación convendrá examinar la forma que adquiere la solución de la ecuación de continuidad en ciertos casos especialmente sencillos e importantes. En primer lugar, se examinará lo que sucede en un cristal uniforme muy grande cuyas fronteras, para fines prácticos, pueden suponerse en el infinito, en cuyo caso no se tiene un campo aplicado ni una generación volumétrica de los pares electrón-hueco en exceso. En el tiempo t = O se supondrá que de alguna manera se ha creado una distribución espacial uniforme de densidad de portadores excedentes. En estas circunstancias V (op) = V 2 (lJp) =O, y, dado que el efecto de difusión es siempre reducir más que crear gradientes de concentración, estas cantidades seguirán siendo cero en todos los tiempos posteriores. En consecuencia, la ecuación (1 0.2-26) toma la formd d(Jp) Jp ----¡¡-= -"7. (10.3-l) Si T es independiente de op, esto se puede resolver fácilmente y se obtiene Jp = p- Po= Ae-rtr (10.3-2) en donde A es una constante arbitraria que aquí es igual al valor de op en t = O. En este caso, la densidad de portadores en exceso se pierde en todos los puntos de un modo exponencial en función de una constante de tiempo T igual al tiempo de vida de los portadores en exceso. Otro caso de gran importancia es la solución de estado estacionario para una muestra infinita en la que los portadores en exceso se crean a través de una fuente uniforme plana de generación que, para mayor facilidad, se supondrá que coincide con el plano yz. En este caso tampoco se tiene un campo aplicado o cualquier generación de portadores en exceso en la muestra. En estas condiciones, la densidad de portadores en exceso variará sólo a lo largo de la dirección x. Para simplificar las cosas, se estudiará el caso de una muestra tipo n fuertemente extrínseca en la que la densidad de portadores en exceso, en todas partes es mucho menor que la concentración de los portadores mayoritarios. En estas circunstancias, los coeficientes de transporte D*, JJ*, y T se reducen a los coeficientes constantes Dp, Jl.p y T P relacionados con los portadores minoritarios, y (10.2-26) se convierte en s W. van Roosbroeck, Phys. Rev., 123 474 (1961). 362 Exceso de portadores en semiconductores {10.3-3) en donde {10.3-4) LP = JDPtP. Las soluciones de {10.3-3) deben tener en todas partes la forma general op = p(x)- Po= Ae"/Lp + Be-x/Lp (10.3-5) en donde A y B son constantes arbitrarias. Puesto que existe una fuente plana de portadores ubicada en x =O en el plano yz, se tendrá cierto tipo de singularidad en la solución en este punto, y es mejor considerar la solución de 8p en la regiór. x <O (que se denominará 8p_(x)), y la solución en la región x >O {que se llamará 8p+(x)) independientemente. Por tanto, de acuerdo con esto y con (10.3-5), éstas deben tener la forma (x >0) {10.3-6) (x < 0). (10.3-7) y op_(x) = p_(x)- Po= A_ex/Lp + B_e-x/Lp Puesto que existe una velocidad de recombinación volumétrica diferente a cero. las densidades de los portadores en exceso debe tender a cero al alejarse de la fuente. Estas condiciones de frontera requieren que A+= B_ =O. Además, de acuerdo con la simetría geométrica de la situación, es evidente que 8p(x) debe ser una función par de x, por lo cual, A_= B+ = A 0 y op+(x) = P+(x)- Po = A 0 e-xfLp (x > 0) (10.3-8) op_(x) = p_(x)- Po = Aoe"/Lp (x < 0). (10.3-9) y La concentración de electrones en exceso, de acuerdo con (10.2-21), es igual a la concentración de huecos en exceso. En la figura 10.4 se muestran los perfiles de concentración resultantes. La concentración de portadores en exceso se pierde exponencialmente en ambos lados de la fuente, plana con una distancia característica de decaimiento de Lp. La corriente de difusión de los portadores minoritarios asociada con la distribución de portadores en exceso, se puede calcular a partir de {10.2-8) y es J (x) = -D d(op+) = AoDp e-x/Lp P dx Lp (x > O) (10.3-10) (x) = -D d(op_) = - AoDp e"'Lp P dx L p (x < 0). (10.3-11) p+ J p- Conforme x tiende a cero a través de valores positivos, Jp+ se acerca a AoDp(Lp, en tanto que conforme x se acerca a cero a través de valores negativos, Jp- tiende a Algunas soluciones particulares de lo ecuación de continuidad 363 -x Figura 10.4. Concentraciones de electrones y huecos en estado estacionario dentro de un cristal infinito en el que existe, en x =O, una fuente plana para la generación de portadores en exceso. -AoDp/Lp. La diferencia entre estas cantidades es el flujo total de la fuente o el número de portadores minoritarios por cm 2 por segundo, emitidos por la fuente. En otras palabras, (10.3-12) en donde F 0 es el flujo de la fuente. Esta ecuación permite expresar el coeficiente A 0 de ( 10.3-8) y ( 10.3-9) en términos del flujo F 0 cuando la fuente se describe en función del flujo inicial emitido. Para una muestra que no es fuertemente extrínseca, sino en la qae la densidad de portadores en exceso, en todos sus puntos es lo suti.cientemente pequeña, las soluciones a (10.3-8) y (10.3-9) por supuesto son correctas todavía a condición de que Lp se substituya por medio deL*= (D*r) 1 12 • Para comprender la naturaleza física del transporte ambipolar, conviene examinar en detalle los flujos de electrones .y huecos. que estan presentes en esta muestra en particular. Con este fin se verá una muestra en la que la densidad de equilibrio de los portadores es arbitraria, en lugar de ver un material extrínseco tipo n. En general, habrá flujos de huecos y electrones que se originan de la difusión y, al mismo tiempo, flujos de las dos especies de portadores, que se deben a la presencia del campo interno como lo da (10.2-39). Si se observa que en la región (x >O) op+ = A 0 e-xfL •, de donde, d(op+)fdx = - op+fL*, y utilizando las relaciones de Einstein (10.2-11), los flujos de huecos y electrones debidos a la difusión se pueden escribir como sigue J d p+ dp+ d(()p+) p.,kT ()p+ =-D-=-D--=---P dx P dx e L* (10.3-13) y Jd n+ = -D dn+ = -D d(()p+) = P.nkT ()p+ " dx " dx· e L* . (10.3-14) Los flujos de huecos y electrones que se crean debido al campo interno (10.2-39) son (10.3-15) 364 Exceso de portadores en semiconductores y (10.3-1~ Los flujos totales de electrones y huecos se pueden encontrar ahora sumando la componentes de la difusión y el campo interno. El resultado es Jl.pkT b(n+ + P+) ~P+ Jp+ =Jn+ = - b r* • e n+ + P+ LJ {10.3-17) De acuerdo con estas ecuaciones, la fracción del flujo total de las dos especies de portadores que se debe a la difusión y a la presencia del campo interno se puede calcular con suma facilidad. Se encontrará que J~+ n+b + P+ -= Jn+ n+ + P+ J~+ n+b + P+ Jp+ = b(n+ + P+) J~+ {10.3-18) P+(b- 1) Jp+ = b(n+ + P+) Es muy interesante examinar estas expresiones en los tres casos específicos: materiales extrínsecos tipo n, en donde n+ ~ P+, materiales extrínsecos tipo p, en donde P+ ~ n+ y el material intrínseco, en donde n+ = P+· En estos tres casos, las ecuaciones (10.2-18) se convierten en intrínseco (n+ = P+) b+l 1. ' 2b 1 b' O; 1--. b; 1. ' 1- b; o·' b-l 2b b+l (10.3-19) 2 l-b 2 De acuerdo con estos resultados, es obvio que en las muestras extrínsecas, el flujo de portadores minoritarios debidos al campo interno es insignificante en comparación con el flujo de difusión. Sin embargo, el flujo de portadores mayoritarios debido al campo es importante. En efecto, este flujo debe ser tan grande que asegure la casi neutralidad en todos los puntos. Por tanto, debe compensar el desequilibrio entre los flujos de difusión de portadores minoritarios y los mayoritarios originados por la desigualdad de los coeficientes de difusión de los electrones y los huecos. Esta situación se puede comprender mejor observando en (10.2-39) que, en muestras extrínsecas, la magnitud del campo externo se hace muy pequeña debido al factor nb+P del denominador que se hace muy grande en muestras extrínsecas. No Algunas soluciones particulares de la ecUJJción de continuidad 365 obstante, el flujo de portadores mayoritarios que se produce debido al campo interno sigue siendo apreciable, ya que es proporcional al producto del campo interno muy pequefio y la gran densidad de portadores mayoritarios. Por supuesto, el flujo de portadores minoritarios debido al campo interno es extremadamente pequefio, puesto que tanto el campo interno como la densidad de portadores minoritarios son pequefios. Por otra parte, los flujos de difusión de los portadores mayoritarios y minoritarios dependen sólo de los gradientes de concentración y los coeficientes de difusión inherentes, tanto de electrones como de huecos, y, puesto que los gradientes de concentración de electrones y huecos son los mismos, deben ser comparables en magnitud y difieren sólo en una cantidad proporcional a la diferencia entre las difusibilidades inherentes de los dos portadores. El estudio de esta situación puede llevar a explicar por qué en las muestras extrínsecas, el coeficiente de difusión ambipolar es el coeficiente inherente de difusión de los portadores minoritarios. En estas condiciones, el campo interno es pequefio y puede crear flujos relativamente grandes de portadores mayoritarios; pero se desecha su influencia en el flujo de portadores minoritarios. En consecuencia, el flujo de portadores minoritarios se debe exclusivamente a la difusión de los portadores minoritarios y en esencia no se lo afecta el campo interno. El flujo de portadores minoritarios observado, por ende es el que producen independientemente los portadores minoritarios en difusión. Para que se satisfaga la situación de casi neutralidad, el flujo de portadores mayoritarios debe ser el mismo. Parte de este flujo se debe a la difusión de los portadores mayoritarios; pero, puesto que las difusibilidades inherentes de las dos especies de portadores son desiguales, se tendrá un déficit (o exceso) inevitable. Este déficit o exceso puede deberse al flujo de portadores mayoritarios cuya fuente es el campo interno. El efecto neto es que los flujos de electrones y huecos son iguales entre sí y al flujo que produciría una distribución de portadores minoritarios difundiéndose imdependientemente; es así como se relaciona el -::oeficiente de difusión de la distribución de portadores en exceso con los portadores minoritarios. Por tanto, en sistemas extrínsecos casi siempre se requiere considerar explícitamente sólo el comportamiento de los portadores minoritarios. Por supuesto, en muestras que son intrínsecas o casi intrínsecas, es importante el efecto del campo interno en los dos tipos de portadores. Este caso se ilustra en la expresión (10.3-19) y a través de la dependencia de los coeficientes de transporte ambipolar en relación con la difusibilidad o movilidad de electrones y huecos. Aunque estos resultados se vieron en conexión con una muestra específica más restringida, es evidente que los principios físicos implícitos son los mismos en todos los sistemas y que las conclusiones obtenidas tienen una aplicación general. Ahora se puede constatar que los flujos de difusión de los portadores minoritarios (10.3-10) y (10.3-11) son los flujos totales de los portadores minoritarios en el caso de una muestra extrínseca tipo n. En un cristal que no es extrínseco, los flujos totales de electrones y huecos se pueden obtener de (10.3-17), escribiendo b = JJ.n/JJ.p y usando las relaciones de Einstein, en la forma (10.3-20) Por supuesto, dado que en esta muestra no se tiene un campo aplicado, la corriente eléctrica total 1 = e(JP + - J n +) es cero. A continuación se estudiará la extensión de la solución precedente para el caso en que existe un campo constante aplicado E 0 en la dirección positiva n. La ecuación diferencial (10.2-26) se puede escribir para el material extrínseco tipo n como 366 Exceso de portadores en semiconductores d_2 (bp) d(bp) _ 0 _2_ _ f.1pEo ___ _ _ _bp __ dx DP dx LP o (10.3-21' Esta ecuacton se puede resolver utilizando las técnicas normales aplicables ¡ ecuaciones diferenciales lineales con coeficientes constantes, lo que da i5p(x) = p(x)- Po= AeYp+xfLp + BeYp-x/Lp (10.3-22) en donde (10.3-23, y (10.3-24) Esta solución es la misma que (1 0.3-5) excepto que los argumentos de lO!i factores exponenciales se multiphcan por los factores 'Yp+ Y - 'Yp-, que depender; del campo eléctrico. De acuerdo con la definición dada antes, se ve claramente que. sea cual fuere el valor que pueda tener E 0 , 'Yp+ debe ser siempre positivo, mientras que 'Yp- debe ser siempre negativo; cuando 'Yp+ y 'Yp- se grafican en función del campo, las dos cantidades se representan por medio de dos ramas de una hipérbola_ como se ilustra en la figura 10.5. Para 'YP = O, a un campo cero, ( 10.3-14) se reduce f (Yp) 3 -3 Figura 10.5. Gráfica de las funciones 'Yp+ y 'Yp-· a la ecuación de la sección anterior. Para valores positivos grandes de 'Yp (y, por ende, para campos tales que E 0 ;p 2kTfeLp), se puede demostrar con la ayuda de la expansión binómica y (10.24) que LP --= ---- (10.3-25) mientras que es obvio que, en estas circunstancias, (10.3-26) Algunas soluciones particulares de la ecuación de continuidad Se puede ver claramente en (10.3-15) que siempre por medio de 'Yp+ y 'Yp- 'l'p+'l'p- =-l. 367 están relacionados (10.3-27) Ahora se puede repetir el desarrollo del caso del campo cero que se da en las ecuaciones (10.3-6) (10.3-12), suponiendo, como antes, que hay dos expresiones separadas para l>p+(x) en la región x >O y l>p_ (x) en la región x <O, con los coeficientes A+, B+, A_ y B_, y demostrando en Ia misma forma que A+ y B_ deben tomarse como cero para asegurar el comportamiento apropiado en ± oo. El resultado se puede escribir como sigue (x > O) (10.3-28) (x < O) (10.3-29) en donde A 0 es una constante arbitraria que expresa la intensidad de la fuente de generación. La concentración de electrones en exceso será igual a la concentración de huecos en exceso. En la figura 10.6 se ilustran los perfl.les de concentración para un valor positivo de E 0 . Puesto que las características de transporte de la distribución de portadores en exceso son prácticamente las de los portadores minoritarios, tenemos que el transporte de los portadores en exceso hacia la derecha (en dirección del movimiento de los huecos bajo un campo aplicado) se ve favorecido por la acción del campo, en tanto que se retrasa el transporte de portadores en dirección opuesta. De acuerdo con ( 10.3-25), se puede verificar que (1 0.3-28) tiende al resultado que se obtuvo antes, (10.2-43), para campos grandes aplicados, como sería de esperarse. Al igual que antes, los flujos de partículas portadoras minoritarias Jp+(x) y Jp_(x) pueden calcularse a partir de (10.2-8); las contribuciones se obtienen ahora tanto del término de difusión como del término del campo eléctrico. Parte del flujo de partículas resultante se deberá al arrastre de los huecos que están presentes en equilibrio térmico cuando, el campo está aplicado, y otra se deberá a la difusión p(x), n(x) - - - --------~ -------------Figura 10.6. Concentraciones de electrones y huecos en un estado estacionario, dentro de un cristal en el que existe, en x =O, una fuente plana de portadores en exceso y estando presente un campo eléctrico constante en la dirección x. 368 Exceso de portadores en semiconductores y al arrastre de la distribución de portadores en exceso. El flujo producido por este último efecto, evaluado en el plano de la fuente, es (10.3-30} Esta ecuac10n es análoga a (10.3-12), que relaciona al coeficiente de amplitud Ao con el número total de portadores por unidad de área por unidad d~ tiempo, Fop. generados en el plano de la fuente. Cuando la muestra no es fuertemente extrínseca y cuando la densidad de los portadores agregados es lo suficientemente pequefia, las soluciones anteriores seguirán siendo válidas a condición de que Dp, JJ.p, Lp y r P se substituyan respectivamente por D*, JJ.*, L * y r. Las mismas observaciones que se hicieron sobre la relación de los flujos debidos a la difusión y a los campos internos en conexión con el caso libre de campo. también se aplican en esta situación; por ejemplo, en una muestra extrínseca, el flujo de portadores minoritarios producido por el campo interno es despreciable en comparación con el flujo de difusión correspondiente, mientras que los flujos de los portadores mayoritarios atribuibles a cualquiera de las dos fuentes tienen una magnitud comparable. Sin embargo, ahora se cuenta además con flujos grandes de los dos tipos de portadores, comprendiendo tanto a los portadores en exceso como a los de equilibrio, debido al campo aplicado. Estos flujos se superponen a los flujos producidos por la difusión y los campos internos; como resultado, la densidad total de la corriente eléctrica ya no se desvanece, sino que por el contrario se representa por medio de aEapl· En relación a esto, se debe observar que el ejemplo que se está estudiando comprende sólo una situación en la que 8p es, en todos sus puntos, mucho menor que la densidad de portadores mayoritarios en equilibrio. Puesto que la densidad total de corriente eléctrica debe ser la misma en todas partes, una situación en la que Dp es lo suficientemente grande para modular apreciablemente la conductividad, implicaría un campo que no puede ser constante; pero que es grande cuando Dp es pequeño y viceversa. Para valores pequeños de Dp, subsiste la misma dificultad, pero las variaciones correspondientes del campo son tan pequeñas que el planteamiento del campo constante constituye una aproximación aceptable. Por supuesto, existen muchas otras dificultades que se presentan cuando [)p se hace comparable a la densidad de portadores en equilibrio. Como ejemplo final, se verá un sistema uniforme unidimensional en el que se generan simultáneamente N pares de electrón-hueco en un punto x = x' al tiempo t = t'. Se supondrá que la muestra se extiende al infinito en ambas direcciones a lo largo de eje x y que se aplica un campo eléctrico constante E 0 . Por tanto, para una muestra extrínseca tipo n, la ecuación ( 10.2-26) se convierte en (10.3-31) Una solución de esta ecuacwn, válida para todos los valores t > t' que satisfaga todos los requisitos del problema es _( )_ op x,t - t- t'] (10.3-32) N _ __ exp [ - {(x- x')- JJ.pE 0 (t- t')} 2 - - - . ../4rrDp(t- t') 4Dp(t- t') <p _ Algunas soluciones particulares de la ecuación de continuidad 369 El hecho de que (10.3-32) satisface la ecuación diferencial (10.3-31), se puede establecer por substitución directa. 6 Se puede demostrar fácilmente que el valor inicial op(x, O) es cero en todos los puntos excepto cuando x = x', punto en el que se hace infmito. La distribución inicial de concentración, entonces corresponde a una función o de Dirac. Para tiempos posteriores, la distribución tiene una forma gaussiana, cuya anchura media aumenta con respecto al tiempo y cuya amplitud máxima decrece con relación al tiempo. El punto de concentración máxima se desplaza también a lo largo de la dirección del campo, a una velocidad JJ.pEo. La expresión (10.3-32) se puede integrar sobre x entre los límites - oo y + oo (haciendo que u= (x- x')- JJ.pE 0 (t- t'), de donde, du = dx, y t se considera constante) para obten~r el número total de huecos en exceso oP en la distribución como una función del tiempo. El resultado es i5P(t) = J~oo bp(x,t) dt =N e -(1-t')/rp. (10.3-33) Por tanto, el número total de portadores, que es N originalmente, desciende de un modo exponencial con la .::onstante de tiempo T P, como podría esperarse. En la figura 10.7 se ilustra el comportamiento de la concentración de portadores en exceso en función de x y t. 8P(x,t) 8P (x,t) t=O t=O -x (al Figura 1O. 7. -X (b) (a) Dispersión difusiva de portadores en exceso inyectados inicialmente como una distribución en x =O, sin tener un campo eléctrico aplicado. (b) Dispersión difusiva Y arrastre de la distribución en (a) aplicando un campo eléctrico constante en la dirección x. En ambos casos O <t 1 <t2 <t3 <t4 . o Si ahora se revisa la definición de N, la intensidad inicial de la fuente, tomando a N(x', t') dx' d t' como el número de huecos o electrones en exceso generados en un intervalo d t' alrededor de t = t', dentro del elemento de espacio dx alrededor de x = x', entonces, la concentración subsecuente debida a este elemento de generación en función de x y t se obtendrá substituyendo N de (10.3-32) con N(x', t') dx' dt'; la distribución de concentración resultante debe marcarse como una función de x' y t', al igual que de x y t, es decir, se debe escribir como sigue: 6 La solución de (10.3-32) se puede obtener por medio de las técnicas de transformación de Laplace o por la integral de Fourier. 370 Exceso de portadores en semiconductores óp(x,t;x',t'). La concentración óp(x,t) que se ongma de una distribución arbitraria conocida de generación cuya intensidad puede variar con las coordenadas del espacio y el tiempo x', y t' se puede calcular superponiendo soluciones de esta forma, cada una de las cuales se caracteriza por la intensidad de generación local N(x', t') dx' dt'. Esta superposición de elementos infinitesimales, cada uno con su propia intensidad de fuente local, lleva a una integral sobre dx' y dt' de la forma bp(x,t) = I r foo -oo N(x',t') [ {(x - x')- J1 E 0 (t- t')} 2 t - t'] , , exp P - -dx dt . -oo .j4nDp(t- t') 4Dp(t- t') rP (1 0.3-34) Por supuesto, la integral se desarrolla sólo hasta t' = t, debido a que la generación futura no contribuye a la concentración observada al tiempo t. Naturalmente, la solución anterior se aplica sólo a una muestra infmita en que la distribución de concentración satisface la condición de frontera de que la concentración debe tender a cero lejos de la fuente. Para muestras finitas, primero se deberá encontrar una solución para una función ó de distribución de fuente inicial, por ejemplo, (10.3-32): pero satisfaciendo además las condiciones de frontera apropiadas en las superficies de la muestra. 7 Entonces se podría usar el mismo procedimiento de superposición para obtener la solución de una distribución arbitraria de ~eneración con respecto a las coordenadas del espacio y el tiempo para muestras de esta clase. Este procedimiento se puede generalizar con cierta facilidad a sistemas tridimensionales. La solución para una generación instantánea de N(r', t') dv' dt' dentro del elemento de volumen dv' alrededor del punto r = r' al tiempo t = t', describiendo la distribución de concentración subsecuente que se origina de este elemento de generación inicial dentro de una muestra infmita, es . , , _ N(r',t') du'dt' ex [- {(r- r')- J1pE 0 (t- t')} 2 _ t- t'] bp(r,t,r,t)-[4nDp(t-t')]f p 4Dp(t-t') rP · (10.3-351 En este caso se puede verificar también que (10.3-35) es una solución para la ecuación tridimensional de difusión correspondiente a {10.3-31) por medio de una substitución directa. La superposición de soluciones de la forma (10.3-35) ahora se puede hacer en la misma forma que antes, dando como resultado una integral sobre la distribución de la fuente de generación de la forma . op(x,t) = J' f -oc N(r',t') [ {(r- r')- J1pE 0 (t- t')} 2 t- t'] 'd, , t exp , - - - dv t . v[4nDP(t-t)] 4Dp(t-t) rP Se descubrirá que casi todas las soluciones particulares de la ecuación de continuidad que se han descrito en esta sección, son útiles para estudiar trabajos experimentales relacionados con distribuciones de portadores en exceso o estructuras de dispositivos semiconductores de importancia tecnológica. 7 Por lo general, la solución para una distribución inicial de fuente de una función ó se cita como la función de Creen apropiada para un sistema dado y un conjunto particular de condiciones de frontera. Movilidad de arrastre y el experimento de Haynes-Shockley 10.4 371 MOVILIDAD DE ARRASTRE Y EL EXPERIMENTO DE HAYNES-SHOCKLEY El experimento de Haynes-Shockley se realizó originalmente para medir con precisión y de un modo directo, la movilidad de arrastre de huecos y electrones en cristales semiconductores. 8 Aunque tiene un gran interés debido a que fue la primera medición directa 9 de la velocidad de arrastre de los portadores de carga, que se realizó con verdadero éxito, también es muy instructivo para dilucidar el comportamiento de transporte de electrones y huecos en exceso en semiconductores, y también para demostrar las características básicas del funcionamiento del transistor, ya que el circuito Haynes-Shockley es, en efecto, un tipo de transistor. - ,,,,1-+----. +o-+-------. Generador de pulsos Batería del colector Señal Sincro· .-+--+-o Osciloscopio ~~~~~~~~~----,~~~,~~~~ 1 x=O 1 x=d 1111111-------1 L...---'llfl'.~-----1+ Batería de barrido Figura 10.8. Diagrama esquemático del experimento de Haynes-Shockley. Como se ilustra en la figura 10.8, en el experimento de Haynes-Shockley se inyecta un exceso de portadores minoritarios al cristal y se recogen de éste mediante un contacto de puntas de prueba metálicas. Aunque se debe posponer una descrip· ción detallada de lo que sucede en un contacto rectificador de puntas de metal, en la figura 10.9 se capta una idea general de su comportamiento. En esta ilustración se describe una muestra de semiconductor en el que se ha establecido un contacto de puntas de prueba y se ha formado una gran zona de contacto. El área grande de contacto, que se puede haber fabricado apropiadamente por soldadura, una región de aleación o por un contacto a presión, actúa como un contacto óhmico de la muestra y no afecta considerablemente a la distribución de portadores en la muestra. Sin embargo, la punta de prueba actúa como un contacto rectificador; cuando se polariza de tal manera que atraiga hacia ella a los portadores minoritarios, actuará como un colector de portadores minoritarios vaciando la región del cristal adyacente a ella de estos portadores, hasta que se llega a un estado estacionario en que los portadores minoritarios se difunden desde el interior del cristal con la suficiente rapidez para satisfacer el déficit causado por su desaparición en las puntas de prueba. En estas condiciones J. R. Haynes y W. Shockley, Phys. Rev., 81, 835 (1951). En contraste con el efecto de Hall que sólo admite la determinación indirecta de la movilidad. 8 9 372 Exceso de portadores en semiconductores --+--- +----=n-type = + Colecta huecos corriente pequeña Inyecta huecos corriente grande Colecta electrones corriente pequeña 1nyecta electrones corriente grande (o) (b) (e) (d) 1 1 ==;;;:¡;of---v DiaQramas de cornente·voltaje Figura 10.9. tipo·n tipa-p (e) ( f) Rectificador semiconductor con contactos de puntas (a) tipo n. con polarización inversa, (b) tipo n con polarización directa, (e) tipo p con polarización inversa, (d) tipo p con polarización directa, (e) característica corriente-voltaje del rectificador tipo p de contacto de puntas. (que se conoce como polarización inversa), esta corriente de portadores minoritarios es la única que puede fluir por la punta de prueba y, puesto que es muy pequeño el abastecimiento de portadores minoritarios del cristal, el flujo de la corriente se reduce mucho y es relativamente independiente del voltaje de polarización, ya que al suministro de portadores minoritarios no le afecta el cambio del voltaje de polariza. ción inversa. Esta situación se ilustra en la figura 10.9(a) y (e) para materialeJ semiconductores tipo n y p. Cuando el voltaje de polarización se invierte para atraer a portadores mayoritarios a la punta de prueba, se encuentra que, además del flujo de éstos hacia ella, se inyecta un exceso de portadores minoritarios a la muestra en el contacto de puntas. En esta forma de operación, la corriente fluye con facilidad y se pueden alcanzar flujos de corriente relativamente grandes con pequeños voltajes de polarización. Se ha encontrado que la corriente aumenta de un modo más o menos exponencial conforme se incrementa el voltaje de polarización, y no es difícil producir un número suficiente de portadores inyectados para modular con gran fuerza la conductividad del semiconductor. 10 En la figura 10.9(b) y (d) se muestra el caso de esta polarización directa. Las relaciones corriente-voltaje para cristales tipo n y tipo p se ilustran en el mismo conjunto de diagramas en (e) y (f), respectivamente. El efecto de rectificación por contacto de puntas, como se presenta en (e) y (f), en efecto proporciona una prueba muy sencilla para distinguir los cristales semiconductores tipo n de los tipo p. lO Debe recordarse que un exceso de concentración de los portadores mayoritarios siempre debe ir acompañado de una distribución de portadores minoritarios en exceso. Los portadores mayoritarios necesarios para conservar la neutralidad eléctrica abundan en el volumen dd cristal de donde se extraen atraídos mientras se forma la distribución de portadores minoritarios en exceso. Cualquier déficit resultante en la concentración de portadores mayoritarios en d volumen se contrarresta inmediatamente con los portadores mayoritarios obtenidos por el contacto metálico óhmico. Movilidad de arrastre y el experimento de Haynes-Shockley 373 En el experimento de Haynes-Shockley se inyectan portadores minoritarios en el emisor e de la f:tgura 10.8. La muestra tiene la forma de una barra larga y delgada, y se establece un campo eléctrico mediante una batería externa que, por supuesto, hace que fluya una corriente ls por la muestra. Este campo eléctrico barre los portadores minoritarios inyectados dentro de la muestra, pasando por un segundo electrodo ubicado a una distancia conocida d del primero, que se polariza de un modo inverso, de tal manera que actúa como colector de portadores minoritarios. Cuando no se tienen portadores en exceso en el colector, la única corriente que fluye en dicho electrodo es una pequefia corriente de saturación que se debe a la recolección de portadores minoritarios de equilibrio que realiza la punta de pruebas. Conforme la distribución de portadores minoritarios inyectados pasa por el colector, la concentración de éstos en su cercanía va en aumento y el número de ellos que se recoge allí por unidad de tiempo asciende proporcionalmente. Si el trazo del osciloscopio se inicia en el momento en que se inyecta originalmente el impulso de portadores, no se observará nada en la pantalla hasta que la distribución de portadores en exceso haya llegado al colector, tiempo en el que la corriente de colector se incrementará y se observará un impulso de sefial en el osciloscopio. Puesto que la concentración de portadores en exceso es una función de la distancia x en la dirección de la muestra, es básicamente la que se da en (10.3-32) y que se ilustra de un modo gráfico en la figura 10.7(b), es evidente que el máximo de la distribución de concentración se desplaza también, con una velocidad igual a JL*E0 , en donde JL* es la movilidad ambipolar y E 0 es el campo aplicado. (En (10.3-32) se supone que las condiciones son tales que D* y JL* son iguales a Dp y Jlp; pero es posible que esto no pueda aplicarse a todos los casos.) Parece que el tiempo t 0 requerido para que el máximo del impulso de concentración atraviese la distancia conocida d entre el emisor y el colector es d d 1 ----0 - v- Jl*Eo (10.4-1) Jl * =dtoEo (10.4-2) lo cual da Si las condiciones son tales que JL* es igual a - Jln o Jlp (es decir, si la muestra es fuertemente extrínseca), este experimento permite medir con precisión la movilidad de arrastre de los portadores minoritarios. Desafortunadamente el impulso que llega al colector no es perfectamente agudo, sino que más bien es ancho debido a la difusión, como se ve en la figura 10.7(b). Esto no causa dificultades en las mediciones; pero origina ciertos errores en la interpretación de los datos, a menos que se tenga un cuidado extremo. Pues lo que realmente se ve en la pantalla del osciloscopio no es una gráfica de la concentración en función de la distancia en un tiempo fijo dado, sino una gráfica de la concentración en un punto específico en función del tiempo, 8p(d,t). Una medición del máximo de esta curva no representa exactamente el tiempo de arrastre, a menos que se arreglen las condiciones del experimento de tal suerte que se produzca un mínimo de dispersión por difusión, conforme la distribución sufre un arrastre entre ~ el emisor y el colector. Por ejemplo, supóngase que el campo aplicado es cero. Entonces, la distribución de portadores en exceso se difundirá como se indica en la figura 10.7(a). Sin embargo, aunque no haya un campo aplicado en este caso, se ve claramente en la figura que se observará un máximo de la concentración como función del tiempo, en un punto x = d. En el ejemplo presentado en esa figura, el máximo se produce más o menos en t = t 3 • Este máximo se observa simplemente porque el transporte por difusión por sí solo basta para mover el exceso de porta- 374 Exceso de portadores en semiconductores dores perteneciente a la distribución, del emisor al colector y luego más allá. Este efecto conduce a la observación de un tiempo de arrastre finito en ausencia de UD campo que, de acuerdo con (10.4-2) corresponderá a una movilidad infinita. Evidentemente, si lo que significa tiempo de arrastre t 0 es el lapso que transcurre entre la inyección y la observación del valor máximo obtenido por op(d,t), según lo cla ( 10.3-32) (y que es lo que en realidad se mide en el trazo del osciloscopio), entonces, la ecuación ( 10.4-2) no puede ser correcta tal y como está expresada. En realidad, la ecuación (10.4-2) es más o menos correcta siempre que l2 dispersión por difusión de la distribución de portadores sea razonablemente pequeña durante el tránsito del emisor al colector. Estas condiciones se pueden efectuar experimentalmente mediante el uso de campos aplicados muy grandes que, no obstante, producen efectos de calentamiento graves a menos que se recurra a técnicas de pulsos muy laboriosas. Una alternativa es derivar una expresión correcta para el tiempo de tránsito a partir de (10.4-2) que toma totalmente en cuenta la difusión para llegar a una expresión modificada 11 de la forma (10.4-31 en donde x = 2kT (~ + ~). eE 0 d r 2 (10.4-41 Por supuesto, es necesario conocer el tiempo de vida de los portadores en exceso T para utilizar esta fórmula; sin embargo, como se verá más adelante, esta cantidad se puede determinar fácilmente mediante una simple medición independiente. Los detalles del cálculo de (10.4-3) quedan asignados como ejercicio para el lector. En el capítulo 13 se demostrará cómo el funcionamiento del transistor se puede explicar y comprender basándose en el experimento de Haynes-Shockley. Si se mide tanto la dispersión de la difusión, como el tiempo de tránsito, se puede determinar el coeficiente de difusión D* al igual que la movilidad de arrastre, aplicando la técnica Haynes-Shockley. Esta posibilidad se ha utilizado 12 para verificar experimentalmente la relación de Einstein en muestras de germanio muy extrínsecas. 10.5 RECOMBINACION SUPERFICIAL Y CONDICIONES DE FRONTERA SUPERFICIALES Si el efecto de las superficies de un cristal fmito tuviera como único fin confmar a los portadores de carga al interior de la muestra, entonces la condición de frontera que la distribución de portadores de carga en exceso tendría que satisfacer en las superficies de la muestra sería simplemente que las corrientes de electrones y huecos deben desvanecerse en las superficies. Sin embargo, la situación no es tan sencilla, ya que los portadores de carga pueden recombinarse err la superficie por medio de mecanismos que son muy independientes de los que regulan las velocidades 11 J. P. McKelvey, J. Appl. Phys., 27, 341 (1956). Transistor Teachers Summer Schooll (Bell Telephone Laboratories), Phys. Rev., 88. 1368 (1952). 12 Recombinación superficial y condiciones de frontera superficiales 375 de recombinación de los portadores de carga en el interior de la muestra. En estas circunstancias, la superficie actúa como un absorbedor parcial de electrones y huecos, y puede haber una corriente neta que fluye hacia las superficies de la muestra. A primera vista, se podría pensar que, puesto que los electrones y los huecos pueden recombinarse en la superficie de un cristal, debe haber una deficiencia en la concentración de portadores de carga cerca de la superficie, que produciría una corriente difusiva de portadores hacia la superficie, aun en el estado de equilibrio térmico. No obstante, esto no sucede debido a que, además de la recombinación, la generación térmica de pares electrón-hueco se produce también en la superficie y, en condiciones de equilibrio térmico, la velocidad de generación es idéntica a la velocidad con la que los pares de portadores se recombinan en la superficie. Por tanto, no existe un flujo neto hacia la superficie ni se produce cambio alguno en las concentraciones de la regtón de la superficie en condiciones de equilibrio térmico. 13 Esta situación es un ejemplo específico de un principio muy general de la mecánica estadística, denominado el principio del balance detallado o el de la reversibilidad microscópica. Este principio establece que en la condición de equilibrio térmico, cualquier proceso microscópico dado y su proceso inverso debe producirse a la misma velocidad. Ya se encontró antes un ejemplo de la validez de este principio cuando se comprobó que la velocidad de recombinación volumétrica en equilibrio de pares electrón-hueco y la velocidad de generación térmica volumétrica son iguales. La situación actual, en que la velocidad de recombinación superficial y la de generación térmica superficial son iguales en la condición de equilibrio, sirve sólo para ilustrar la misma ley general. Por supuesto, debe hacerse notar que el principio del balance detallado se aplica sólo al estado de equilibrio térmico. En el ejemplo que se estudia, la velocidad de generación térmica superficial es una función exclusiva de la temperatura y es muy independiente de las concentraciones locales de portadores de carga, en tanto que la velocidad de recombinación depende clara y directamente de las concentraciones locales de portadores. Si la concentración local de los portadores de carga excede el valor del equilibrio térmico, la velocidad de recombinación superficial sobrepasará la velocidad de generación superficial y como resultado se tendrá una absorción neta de portadores en la superficie que, a su vez, establecerá un flujo por difusión de portadores hacia ella. Si se tiene una deficiencia de concentración de portadores en exceso en la cercanía de la superficie, también se producirá un flujo por difusión de portadores en exceso térmicamente generados que se aleja de la superficie. Por supuesto, se pueden hacer observaciones similares en relación al flujo de portadores en el volumen, que se originan por excesos o deficiencias locales en las concentraciones volumétricas de portadores. Es importante comprender que estas conclusiones generales son válidas independientemente de los mecanismos en particular implicados en los procesos de generación y recombinación. El efecto de la recombinación superficial sobre la distribución de portadores de carga dentro de la muestra se puede investigar ahora, considerando el intercambio de flujo entre la superficie y la región interior de la muestra, como se ilustra en la figura 10.10. Se principiará definiendo el coeficiente de reflexión superficial R 0 como la probabilidad de que un solo portador, en una sola colisión con la superficie, sea devuelto al interior del volumen en lugar de ser absorbido por recombinación. La probabilidad correspondiente de recombinación, por tanto es 1 -- R 0 • De igual manera, el coefi13 Este enunciado se aplica al modelo simple de la superficie que se está viendo. Existen cambios en la concentración de portadores en equilibrio cerca de la superficie asociados con una capa de carga espacial superficial, originada por la presencia de estados superficiales, en la superficie física real de la muestra como se verá más adelante. El punto de vista sencillo aquí adoptado casi siempre es adecuado para un estudio fenomenológico de la recombinación superficial. 376 Exceso de portadores en semiconductores Flujo incidente neto Flujo que se desarrolla debido a la generación térmica superficial A F,8 -X Concentración local de portadores en la región de la superficie: P, interior: coeficiente de reflexión B Figura 10.10. Superficie: coeficiente de reflexión Ro Diagrama de flujo que ilustra el intercambio de flujos entre el interior y la superficie. dente de reflexión volumétrica B se define como la probabilidad de que un portador, al entrar al interior del cristal, proveniente de la superficie, reaparecerá en ésta en el curso de su desplazamiento aleatorio a través del material antes de recombinarse en el interior. Se supone que estos coeficientes son independientes de los flujos o las concentraciones de portadores. Entonces, se puede considerar el sistema de flujos establecido entre la superficie y el interior, como se ilustra en la figura 10.10. Se supone que hay un flujo neto de partículas de magnitud A, que se origina en el interior, y el flujo de generación superficial gs está dirigido de la superficie al interior del cristal. La superficie del cristal de la figura 10.1 O se muestra separada del interior para ilustrar con claridad el intercambio de flujos entre estas dos; pero. por supuesto, las dos regiones son físicamente contiguas en realidad. El flujo total F 1 , que va del interior a la superficie, y el flujo inverso total F ~ se pueden obtener observando que F 1 se compone del flujo incidente A más la parte de F; que es reflejado por el volumen, de donde, (10.5-1) De igual manera, (10.5-2) Estas dos ecuaciones se pueden resolver para F 1 y F;, y dan F _A+ Bg, 1 - l-R 0 B (10.5-3) y , _ g, + AR 0 F¡ 1- R 0 B (10.5-4) Ahora se puede demostrar fácilmente que, para una distribución de partículas libres que obedece a la estadística de Boltzmann, el número de partículas por unidad de tiempo que cruza una superficie plana de área en cualquier dirección, es Recombi1lllción superficial y condiciones de frontera superficiales 377 pCJ4, en donde pes la concentración local de partículas. 14 En el estado de equilibrio térmico, la concentración de partículas es p 0 en todos los puntos y F 1 = F; = p 0 c/4. (10.5-5) Estos valores de F 1 y F; se puede substituir en (10.5-3) y (10.5-4) y el par de ecuaciones resultantes se resuelve para g8 y A 0 , que es el valor del flujo incidente A en condiciones de equilibrio térmico, lo cual da Po e g.= --¡-(1- R0 ) (10.5-6) Po e A 0 = --¡-(1- B). (10.5-7) y Ya se vio en el argumento anterior que, en el estado de equilibrio térmico, F 1 y F; tienen el valor común pc/4. Si existe una desviación del equilibrio térmico producida por un flujo por difusión establecido por un gradiente de concentración, y si esta desviación del estado de equilibrio es tan pequeña que la distribución de Boltzmann sigue siendo más o menos correcta en todos los puntos del sistema, entonces, F 1 y F 1' ya no serán iguales. En estas circunstancias, se debe tener en c"Uenta el flujo positivamente dirigido que llega al punto x 0 y que se originó, en promedio, a una distancia del orden de la trayectoria libre media "corriente arriba" y el flujo negativamente dirigido que llega al mismo punto y que se originó a una distancia promedio del orden de la trayectoria libre media "corriente abajo". Entonces, el flujo con dirección positiva F; se puede escribir como sigue [ ,(ap) ]:¡·e F¡ = p(xo)- ::XA ax xo (10.5-8) en donde a es una constante numenca del orden de la unidad, ya que la cantidad entre paréntesis angulares representa, aproximadamente la concentración local en el punto en que se originó el flujo que llega a x 0 • De igual manera, el flujo con dirección negativa F 1' se puede escribir como (10.5-9) Es obvio que la ~urna de los flujos debe ser, entonces, (10.5-10) en donde p es la concentración local, independiente del gradiente de concentración, con tal que la función de distribución no se perturbe seriamente de su forma en equilibrio. Si se usa (10.5-10) para expresar la suma de los flujos F 1 y F; en la región de la superficie y, si se usan las expresiones (10.5-3), (10.5-4) y (10.5-6) para representar F 1 , F; y g8 , se obtiene 14 Por ejemplo, véase el ejercicio 7 que aparece al final del capítulo 5. 378 Exceso de portadores en semiconductores p.c _ F T - 1 + F' _ A(1 + R 0 ) p0 c (1 - R 0 )(1 + B) 1 1 - R0 B + 4 1 - R0 B ' (10.5-11) en donde Ps representa la concentración en la cercanía de la superficie. Por supuesto, se debe recordar que, aunque g8 tiene el mismo valor que en el estado de equilibrio térmico, esto no se aplica a A, cuya magnitud depende de la naturaleza de la distribución de portadores en exceso que pueda estar presente en el volumen. En efecto, la ecuación (10.5-11) debe resolverse para A, de tal modo que dé p.c 1 - R 0 B A=---2 1 + R0 Poc (1 - R0 )(1 + B) 4 1 + R0 (10.5-12) F: es el flujo neto de portadores que, si no se tiene La diferencia entre F 1 y un campo eléctrico, como se supondrá, es igual a la corriente neta de difusión -Dp(o(fJp)/ox) evaluada en las superficies. Si se escribe la expresión para F 1 - F 1'. usando (10.5-3) y (10.54) para representar los flujos y a (10.5-6) y (10.5-12) para representar los valores de g8 y A, se puede obtener, después de numerosas operaciones algebraicas complejas, pero directas, F 1 _ F~ = A(l - R 0 ) _ g.(l - B) =(p.- p 0 )c 1 - R 0 = -DP(i!(bp)). 1 - R0 B 1 - R0 B 1 + R0 2 ox (10.5-13) s En realidad, esta ecuación es un enunciado de la condición de frontera superficial que se debe aplicar a la ecuación de continuidad. Esto se puede expresar convenientemente en la forma -Dp ( iJ(bp)) ---a;- S= S. (bp). (10.5-14) en donde e 1- R 0 S=----. 21 + R 0 (10.5-15) Los subíndices s indican que las cantidades implicadas se evalúan en la superficie. Por lo general, la constante s se denomina la velocidad de recombinación superficial; su relación con el coeficiente de reflexión más fundamental está dada por (10.5-15). La condición superficial de frontera (10.5-14) se puede expresar en forma vectorial más general como sigue -DP[n • V(bp)]. = s · (bp)., (10.5-16) en donde n es un vector unitario saliente, normal a la superficie. Si no existe una recombinación superficial, R 0 = 1 y s =O, de acuerdo con (10.5-5). En este caso, (10.5-14) da o(óp)/ox =O, correspondiente a la condición en que no se tiene un flujo neto difusivo hacia la superficie. Si los portadores se recombinan inevitablemente al llegar a la superficie, Ro =O y s =e /2; evidentemente, este valor es un límite superior para la velocidad de recombinación superficial. No obstante, en este caso restrictivo es muy común hacer que s = oo en (10.5-14), que equivale a hacer que la concentración de portadores en exceso de la superficie (óp)8 sea cero. Se puede demostrar que esta aproximación, que facilita enormemente los cálculos, es apropiada, a condición de que Dp/Lp ~ C/2. Para el germanio a 300°K, DP ~SO cm 2 /seg, e~ 107 cm/seg, y Lp es casi siempre mayor que 10- 3 cm; Fotoconductividad de estado estacionario 319 por tanto, la condición queda perfectamente satisfecha y este constituye un ejemplo típico. A decir verdad, las circunstancias en las que se viola el requisito se presentan muy raramente y, por tanto, casi siempre se justifica adoptar la condición de frontera s = oo ó (8p )8 = O en el límite superior de la recombinación superficial. Se asignará como ejercicio para el lector, un ejemplo que demuestre con claridad el origen de la condición que se acaba de ver. En todos los casos intermedios en los que la probabilidad de recombinación no es ni cero ni la unidad, se debe usar la condición de frontera de la forma (10.5-14). Todos los cálculos anteriores se desarrollaron en relación con un exceso de huecos en un material tipo n; pero, por supuesto, se pueden aplicar observaciones exactamente iguales a los electrones en exceso en un semiconductor tipo p. En el germanio se pueden obtener coeficientes de reflexión muy elevados (-0.99999) correspondientes a velocidades de recombinación superficial del orden de 100 cm/seg, en muestras cuyas superficies se han preparado mediante un cuidadoso proceso de ataque químico. En muestras cuyas superficies han quedado muy dañadas por pulimento u otra acción abrasiva, existen muchas dislocaciones y otras imperfecciones de red en la superficie que pueden actuar como centros de recombinación. En tal caso, la velocidad de recombinación superficial puede sobrepasar a 105 cm/seg, correspondiendo esto a un valor de menos de 0.99 para el coeficiente de reflexión.15 En el silicio, la velocidad de recombinación superficial es casi siempre mucho mayor en superficies atacadas químicamente, por ejemplo un valor típico sería más o menos 2000 cm¡ seg. 10.6 FOTOCONDUCTIVIDAD DE ESTADO ESTACIONARIO Para ilustrar la aplicación de algunos de los principiOs que se vieron en las secciones anteriores, se procederá a calcular la respuesta de fotoconductividad en estado estacionario, de una muestra uniforme de semiconductor que se ilumina con una radiación de una longitud de onda lo suficientemente larga que permita ser absorbida sólo ligeramente al pasar por el cristal; pero, al mismo tiempo, lo suficientemente corta para crear una concentración medible de pares electrón-hueco. Por tanto, una longitud de onda apropiada quedará justamente en el lado de las longitudes de onda largas del borde de absorción en la posición A. 1 de la figura 10.l(a). Se supondrá que esta muestra tiene la forma de un sólido rectangular cuyas dimensiones son x 0 , Yo, z 0 , y cuyo espesor x 0 es mucho menor que las otras dimensiones Yo y z0 , y que la iluminación es incidente a lo largo de la dirección x, como se ilustra en la figura 10.11. Las dos superficies grandes de la muestra se han preparado en la misma forma para producir la misma velocidad de recombinación superficial s en ambos lados. Si el coeficiente de absorción es relativamente pequeño, se puede considerar que la intensidad de la luz es más o menos uniforme en todo el cristal. Esto llevará a una velocidad de generación de portadores en exceso g, que es constante y proporcional a la intensidad de la luz. En una muestra larga y delgada del tipo que se ilustra, la concentración de portadores en exceso varía esencialmente sólo en la dirección x, lo cual permite utilizar la fórmula unidimensional de la ecuación de continuidad. Puesto 15 El coeficiente de reflexión Ro casi siempre está muy cerca de la unidad en el caso del germanio y el silicio, incluso en muestras cuyas superficies están muy raspadas. Sin embargo, en muchos casos el efecto de una velocidad de recombinación de lOS cm/seg correspondiente a R 0 = 0.99, se podrá distinguir apenas de la condición en que s = c/L. y R =O. 380 Exceso de portadores en semiconductores Iluminación jjJ 1 ~z/ í0T'' ============~:::::JI \Con~uctor de t:' ,, 1 1 1 '""''"" Iluminación Figura 10.11. Geometría del experimento de fotoconductividad que se analizó en la sección 10.6. que no existen campos en la dirección x y, dado que en la condición de estado estacionario o(f>p )fot = O, la ecuación ( 10.2-26) toma la fonna (10.6-1) en donde g' es constante. Al escribir la ecuación de esta forma, se está suponiendo que se trata de un material extrínseco tipo n y que f>p es pequeña en todas partes en comparación con la densidad de portadores mayoritarios. La solución de esta ecuación se puede expresar como la solución general de la ecuación homogénea (10.3-3) más una solución particular de (10.6-l). Es evidente que f>p =g'L~/Dp =g'rp es justamente una solución particular de (10.6-1) y que la solución general de (10.6-1) se puede escribir como sigue X X LP LP bp(x) =A cosh- + B senh- + g'rP. (10.6-2) Debido a la geometría simétrica de la muestra que se ilustra en la figura 10.11, f>p(x) debe ser una función par de x, en donde B =O y (10.6-2) se convierte en bp(x) =A cosh ~ + g'rr (10.6-3) Lp Si a esta ecuación se aplica la condición superficial de frontera (10.5-16) en cualquier superficie ( x = ±;o) se puede evaluar la constante y se obtiene A A= -sg'rP x0 D x0 2LP 2LP s cosh - + ..J!. senh LP (10.6-4) Fotoconductividad de estado estacionario y op(x) = g'tp 1 [ l scosh L . Xp x0 DP x0 s cosh- +- senh2LP LP 2LP 381 (10.6-5) El perftl de concentración op(x) se ilustra en la figura 10.12(a) para diferentes valores de s. Sp(x) Lp Lp 2 (a) Figura 10.12. (b) (<t) Perfiles de concentración dentro de la muestra ilustrada en la f~gura 10.11 para s =O, s =oo y varios valores intermedios de s. (b) Respuesta de fotoconductividad OC/C 0 en función del espesor x 0 graficada para varios valores de s. El cambio en la conductancia debido a la presencia de portadores en exceso será proporcional al número total de portadores en exceso que están presentes en la muestra. Si se usa oP para representar el número total de huecos en exceso y oN para la cantidad total de electrones en exceso, entonces, f xo/2 oP = oN = y 0 z 0 (10.6-6) op(x) dx, -xo/2 en donde y 0 z 0 es el área superficial de la cara iluminada de la muestra. Si se emplea (10.6-5) para representar op(x) en (10.6-6), la integral se puede evaluar fácilmente de tal modo que dé oP = oN = 2yozog'tp [ Xo- l sLPsenh 2L Xo D p • Xo P Xo s cosh- + - senh2LP LP 2LP (10.6-7) El elemento diferencial de conductancia entre los electrodos extremos asociados con. una hoja delgada del material, con un espesor dx, está dado por 382 Exceso de portadores en semiconductores de = u(x) da = z0 u(x) dx . Yo Yo (10.6-8) u(x) = u 0 + bu(x) = u 0 + e¡J.Pbp(x)(b + 1), (10.6-9) de= Zo [u0 + e¡J.p(b + 1)<5p(x)] dx. Vo (10.6-10) Sin embargo, de donde, Al integrar esta ecuación entre los límites x = ± x 0 /2 se obtiene Z X Z e=~ U o + ~ e¡J.p(b + 1) Yo Yo fxo/2 bp(x) dx. (10.6-11) -xo/2 No obstante, el primer término anterior es la conductancia de equilibrio área/longitud) en tanto que en el segundo, la integral se puede expresar en función de óP mediante (10.6-6). Haciendo esta substitución en (10.6-11) se puede escribir como (= a0 • e= eo + epp(b ~ l)bP = Co + i)C. Yo (10.6-12) Entonces, el cambio relativo de conductancia se puede expresar como óCfe0 • en donde e0 = uozoxo/Yo, en donde, be e¡J.p(b + l)(jP -= u0 V (10.6-12) en donde óP está dada por ( 10.6-7) v V = x 0 y 0 z 0 es el volumen de la muestra. En la tigura 10.12(b) se ilustra la fotoconductancia óC/e0 graficada en tunción del espesor de la muestra para diferentes valores de s. Por supuesto, para s =O, la cantidad óP y, por ende, óe es independiente del espesor de la muestra x 0 . Para s >O, la fotoconductancia es muy pequeña en muestras delgadas, ya que en este caso, los portadores se pueden difundir con gran rapidez hasta la superficie y recom· binarse allí. Para muestras más gruesas, los portadores del interior llegan a la superficie sólo después de una gran difusión y la recombinación superficial tiene mucho menos efecto en la conductancia general. En el límite x 0 --+ oo el efecto de la superficie se vuelve insignificante. Es evidente que si las dimensiones de la muestra, Dp, la velocidad de generación g' y una de las cantidades (s, Lp) son factores conocidos, s o Lp, cualquiera que se desconozca, se puede medir en este experimento. Si se usan dos muestras diferentes, idénticas en todo excepto el espesor, se pueden determinar tl'•itO s como LP. La principal dificultad en el uso del efecto de fotoconductividad ..te estado estacionario, como técnica para determinar s o Lp, consiste en conocer la velocidad absoluta de generación g', la cual es difícil determinar en cualquier experimento. Esta dificultad se elimina si, por el contrario, se mide la fotoconductividad transitoria. En la siguiente sección se hace un análisis de este efecto. Fotoconductividad transitoria 10.7 383 FOTOCONDUCTNIDAD TRANSITORIA; TIEMPO DE VIDA DE LOS PORTADORES EXCEDENTES En esta sección se estudiará el decaimiento transitorio de la fotoconductividad producida por una radiación penetrante en la muestra, exactamente como la que se vio en la sección anterior. Se supondrá que la fuente de luz ha generado una densidad de portadores p 1 (>p 0 ) que es uniforme en todos los puntos dentro de la muestra en el tiempo t = O, instante en que la radiación de excitación se corta bruscamente. Entonces, ( 10.2-26) describe el decaimiento subsecuente de la distribución de portadores en exceso hasta el estado de equilibrio, descrito por (10.2-26) que, para este caso toma forma o2 (bp) bp(x,t) o(bp) D -------P ox 2 rp ot . (10.7-1) Las condiciones de frontera 16 superficiales son o(bp)) -DP ( = sbp(x 0 /2,t) OX xo/2 y a(op)) DP (- OX = sbp( -x 0 /2,t), (10. 7-2) -xo/2 además también se requiere que, bp(x,O) = p 1 = const (10. 7-3) lim bp(x,t) =O. (10.7-4) bp(x,t) = e-' 1'Pu(x,t) (10.7-5) y Al hacer la substitución la ecuación (10.7-1) se puede transformar en una ecuación diferencial para u(x, t) de la forma (10. 7-6) en tanto que las condiciones de frontera se transforman en - DP(:~) X = su(x 0 /2,t); xo/2 DP(~u) uX =su( -x /2,t) 0 -xo/2 (10.7-7) y u(x,O) = p 1 = const (- X 0 /2 < X < X 0 /2). (10. 7-8) 16 Aunque para llegar a la forma (1 0.5-16) se supuso una condición de estado estacionario en la condición de frontera, es evidente que esta condición de frontera se puede usar también en situaciones dependientes del tiempo, a condición de que la concentración de portadores de carga en la superficie no cambie mucho en el tiempo requerido para que se establezca el flujo de equilibrio entre la superficie y el volumen. Siempre se supondrá que esta condición se satisface. 384 Exceso de portadores er¡ semiconductores A continuación se buscarán soluciones producto de la forma u(x,t) = X(x)T(t). {10.7-9) Al substituir esta forma para la solución en {10.7-6) se observa que 1 d2X 1 dT - - - -2 = - - - -- = -a 2 = const. X(x) dx DPT(t) dt (10.7-10) Los dos lados de la ecuación anterior deben ser iguales a una constante, pcr separado, ya que sólo en esta forma puede una sola ecuación de x y una sola ecuación de t ser iguales para todos los valores posibles de x y t. La constante se escribe como -a:2 , de manera que, para cualquier a: real, será negativa; esto es necesario (como se comprobará en breve) para tener la seguridad de que (10.7-4) quede satisfecha. Para la dependencia del tiempo de la ecuación anterior, es obvio que (10.7-11) de donde {10.7-12) Para la dependencia espacial, se tiene (10.7-13) por lo cual X(x) = A cos ax + B sen ax. (10.7-14) Por la simetría del problema, está claro que la dependencia espacial de la concentración de portadores en exceso debe ser siempre una función par de x. Sin embargo, una función sinusoidal o cualquier superposición de funciones sinusoidales, es invariablemente impar en tanto que un coseno o cualquier superposición de cosenos es par. Evidentemente, este requisito físico se puede satisfacer sólo mediante una función coseno o por una superposición de funciones coseno. Por tanto B debe hacerse igual a cero en (10.7-14). De acuerdo con (10.7-9), (10.7-12) y (10.7-14), es obvio que una solución apropiada debe tener la forma u(x,t) =X(x)T(t) = Ae-tz 2 Dpt cos ax. {10.7-15) Esta solución por sí sola satisface la ecuación diferencial (10.7-6); pero no satisface las condiciones de frontera (10.7-7) y (10.7-8). No obstante, se puede desarrollar _una superposición lineal de soluciones de esta forma tales que (10.7-16) n n que sigue satisfaciendo la ecuacton diferencial, y se está en libertad de seleccionar los valores An y an de tal modo que la superposición satisfaga las condiciones de fron- Fotoconductividad transitoria 385 tera. En cada ténnino de la suma de (10.7-16), se requiere que se satisfaga la condición de frontera superficial (10.7-17) entonces, por supuesto, las condiciones de frontera superficiales (1 O. 7-7) quedarán satisfechas automáticamente por dicha superposición. 1 7 Substituyendo una solución de la forma (10.7-15) en lugar de un en (10.7-17), se encuentra que para satisfacer (10.7-17), se debe tener (10.7-18) de donde, cxn debe escogerse en tal forma que se satisfaga la ecuación ctn CXnXo - - = rxnDp - - = (J.nXo - - (2D 1sx 0 ) 2 S 2 (10.7-19) P Las raíces de esta ecuación se pueden obtener numérica o gráficamente como la intersección de las curvas f(cxx 0 )=ctn(+cxxo) y f(cxxo)=(fcxxoX2Dp/sxo), como se oiJustra en la figura 10.13. Ahora se tratará de satisfacer la condición de frontera (10.7-8). Se intentará lograrlo seleccionando valores de An de tal suerte que, en t =O, la suma de todos los valores de Un(X, O) se sumen para formar una representación tipo Fourier del perfil de concentración inicial requerido. Para lograr esto, supóngase que u(x, O) es una función par arbitraria 18 f(x), de tal modo que 00 u(x,O) = L A" cos cx"x = f(x). (10.7-20) n=O f (ax 0 1 ,. a 1x0 -2- Figura 10.13. Diagrama que ilustra la determinación de las raíces de (10.7-19) mediante la solución gráfica de la ecuación trascendental. 17 Obsérvese que si u(x, t) es una función par de x, si se da una de las condiciones de frontera, (10.7-7), se da la otra. 18 Si f(x) no fuera par, sería necesario admitir soluciones de la forma Bnexp(- ai,Dpt) sen a,.x en la superposición, junto con la función coseno que se está usando. 386 Exceso de portadores en semiconductores Si los dos lados de esta ecuación se multiplican por cos OtmX y se integran sobre e! intervalo ( -x0 /2 < x < x 0 /2), el resultado es Lf n xo/2 An COS OCnX COS OCmX dx = -xo/2 fxo/2 j(x) COS OCmX dx. (10.7-21) -xo/2 Si el conjunto de funciones cos OtnX es ortogonal en el intervalo (- x o /2 < x < x 0 /2), todas las integrales del lado izqUierdo de esta ecuación se desvanecen excepto aquella para la que n = m, que se evalúa con facilidad. En estas circunstancias, al resolver para A m, se puede demostrar que (10. 7-22) Esto deja ver que, puesto que se trata de un caso especial del problema de Sturm-Liouville, las funciones {cos ocna} deben formar un conjunto ortogonal. 19 En cualquier caso, no es difícil demostrar directamente que, a condición de que los valores de Otn se escojan de tal manera que satisfagan ( 10.7 -19), las funciones {cos ocna} son ortogonales. Los detalles de esta demostración quedan como ejercicio para el lector. Para el caso presente, se debe escoger f(x) = p 1 =constante y, con esta selección, la integral de (10.7-22) se puede evaluar fácilmente y se obtiene OCnXo 4p 1 sen - 2- A =----n OCnXo +Sen OCnXo (10.7-23) de donde, f(x) = p 1 = 4p 1 (10.7-24) Ahora se puede encontrar u(x, t) substituyendo el valor anterior para An en (10.7-16) y luego se puede obtener óp(x, t) a partir de (10.7-5). El resultado final es (10.7-25) Cuando s--* O, la pendiente de la línea recta que aparece en la figura 10.13 se hace extremadamente grande y los valores propios {ocna} tienden a (O, 2rr, 4rr, 6rr ••• Para este conjunto de valores, sen (Otna/2) =O para todos los valores de Otn y todos los términos de la suma de (10.7-25) se desvanecen con la excepción del primero. En el caso del primer término, tanto el numerador como el denominador desaparecen dando origen a una forma indeterminada. Utilizando la regla de L'Hopital se puede demostrar que r 19 R. V. Churchill, Fourier Series and Boundary Value Problems. Nueva York: McGrawHill (1941), páginas 46-5 2. Fotoconductividad transitoria 1 ct 0 x 0 sen - 2- lim ct x 2cos - 02-0 aoxo~O IXoXo +Sen IXoXo = 387 lim aoxo~O 1 + COS IXoXo 1 (10.7-26) = -, 4 por lo cual, (10.7-27) (s = 0). En la figura 10.14(a) se muestra el perftl de concentración para este caso, graficado para varios valores de t. Es obvio que la concentración sigue siendo la misma en cualquier tiempo dado, en todos los puntos de la muestra. Si s-+ oo, la pendiente de la línea re.:ta de la figura 10.13 tiende a cero y los valores propios {1X"a} tienden a (7T,37T,S7T,77T, ... ) en el límite. En este caso, (10.7-25) se convierte en (2n + 1)rrx oo bp(x,t) = 4p 1 e-' 1'P L ( -1)" cos x0 (2n + 1)1! n=O [ (2 n + 1)2 rr zv Pt ] exp • (10.7-28) 2 Xo que es una serie ordinaria de Fourier. En este caso, cuando x = ± x 0 /2, op es cero ya que cos (n + )11 = O. El perfil de concentración para este caso aparece graficado en la figura 10.14(c). Para valores intermedios de s, los valores {a"} deben determinarse numérica o gráficamente y cuando se grafican los resultados, deben producir perftles de concentración como los que se presentan en la figura 10.14(b). La fotoconductancia real se puede obtener a partir de op(x,t) por medio de (10.6-12) y (10.6-6), de acuerdo con lo cual, + bC(t) ef.J.p(b + 1) fxo/ 2 -- = V · y0 z 0 bp(x,t) dx, Co -~ 2 (10.7-29) -xo/2 1=0 1 =O 1=0 ,, t, t, /z lz 13 13 /4 14 o S=O (a) Figura 10.14. ao ~ 2 xo -2 o S>O (b) xo 2 Xo -2 o S=oo Xo 2 (e) Perfiles de concentración dentro de la muestra para diferentes valores de t, (a) pata s =O, (b) para s>O, (e) paras= o..>. En todos los casos O< t 1 < tz <r3 <14· 388 Exceso de portadores en semiconductores o bien utilizando (10.7-25) y evaluando la integral Esta expreswn es una suma de los términos, cada uno de los cuales tiene su propia amplitud característica y cada uno de los cuales decae exponencialmente con respecto al tiempo con una constante de tiempo distinta. Esto se puede escribir en la forma (lO. 7-31) en donde Cm es la amplitud del mésimo modo de decaimiento 20 definido por (10.7-30) y en donde cada constante de tiempo exponencial se puede expresar como (10.7-321 Puesto que ao es el miembro más pequeño del conjunto{IX.}, la constante de tiempo T 0 debe ser mayor que cualquiera de las otras; es más, la forma del factor de amplitud Cm que multiplica a cada término es tal que las amplitudes de los términos más altos son más pequeñas que la del primero. m resultado es que los modos de orden más alto desaparecen con mayor rapidez que el de orden cero y. después de un tiempo lo suficientemente largo, el decaimiento se puede representar como una simple exponencial con la única constante de decaimiento del modo principal r 0 , como se ilustra en la figura 10.15. Evidentemente, si el logaritmo de la respuesta fotoconductiva se grafica en función del tiempo, se obtiene una línea recta después que los efectos de los términos de modo más alto de (10.7-30) han desaparecido. La pendiente de esta línea es 1/r 0 , en donde In .!f. Co .. 1 Figura 10.15. Logaritmo de la respuesta fotoconductiva transitoria en ·ión del tiempo. 20 El subíndice m se adopta aquí para evitar cualquier confusión posible con el tiempo de vida del electrón, T n· Fotoconductividad transitoria 389 (10.7-33) Existen dos términos en el lado derecho de esta ecuación; el primero de ellos representa al efecto de la recombinación volumétrica sobre la constante de tiempo del modo principal observado, y el segundo, el efecto de la recombinación superficial. El tiempo de vida observado r 0 es más breve que el tiempo de vida volumétrico real r P a menos que la velocidad de recombinación superficial sea. cero •. en cuyo caso, como ya se indicó antes, a 0 = O. Aunque por lo general es nnpoSible reducir s a cero, de un modo experimental, se puede producir el mismo efecto, como se señala en la figura 10.13, acomodando las condiciones del experimento de tal modo que 2Dp/sx 0 sea mucho menor que la unidad. Esto se puede lograr utilizando una muestra muy gruesa. En estas condiciones, los portadores generados en el interior deben difundirse una distancia mayor hasta la superficie, cuyo papel es mucho menos importante que en una muestra delgada, y el tiempo de vida observado r 0 se aproxima al tiempo de vida volumétrico rea! r P. Si se conocen los tiempos de vida volumétrico real r P y el de vida observado, la velocidad de recombinación en la superficie se puede evaluar resolviendo (1 O. 7-33) para a 0 , insertando el valor obtenido en (10.7-19) y despejando s. El resultado es (10.7-34) Esta fórmula también se puede usar para obtener el tiempo de vida volumétrico real, si se conocen el tiempo de vida observado y la velocidad de recombinación superficial. Si se desconocen inicialmente tanto r P como s, se pueden determinar trabajando primero con una muestra gruesa cuya superficie se trata en tal forma que se minimice la recombinación superficial; el decaimiento fotoconductivo transitorio asociado con este tipo de muestra se aproximará a rP. A continuación, la muestra gruesa se puede cortar en otras más delgadas y las superficies de éstas se deben tratar a fin de obtener las condiciones apropiadas para medir la velocidad de recombinación superficial. La constante de decaimiento r 0 se mide entonces, y s se saca directamente de ( 10.7-34) empleando el valor de r P obtenido previamente. Otra posibilidad es cortar dos muestras de diferentes espesores de un material con un tiempo de vida uniforme. Las superficies de las dos muestras se tratan de tal modo que se obtengan las condiciones en las que se desea hacer la medición de s, y se determine el tiempo de vida observado relacionado con cada muestra. Después, la ecuación (10.7-34) se puede escribir para cada muestra y las dos ecuaciones se resuelven numéricamente para las dos cantidades desconocidas r P y s. Un tercer método consiste en utilizar sólo una muestra y ajustar los valores de r P y s en ( 10.7-30) de tal manera que se reproduzca no sólo la constante de tiempo del modo principal observado r 0 (que, después de todo se puede obtener en otras combinaciones diferentes de r P y s), sino también el patrón de decaimiento inicial del modo más alto que se observó. Aunque el análisis matemático requerido es complejo, este método tiene la ventaja de que emplea una sola muestra y con esto se minimizan las dificultades que producen las heterogeneidades en el tiempo de vida volumétrico y las velocidades de recombinación superficial. 390 Exceso de portadores en semiconductores 10.8 MECANISMOS DE RECOMBINACION; LA TEORIA DE RECOMBINACION DE SHOCKLEY-READ En esta sección se investigarán brevemente los aspectos físicos de la recombinación electrón-hueco. Es importante comprender los procesos físicos asociados con !a recombinación directa de electrón-hueco, así como en la recombinación por atrapamiento, aunque se ha descubierto que esta última es el mecanismo dominante en la mayoría de las situaciones relacionadas con semiconductores covalentes o intermetálicos lii- V. En la recombinación directa, un electrón de la banda de conducción y un hueco de la de valencia se recombinan sin la participación de ningún estado intermedio. Si las bandas de conducción y valencia tienen separación mínima de energía en k = O, entonces es posible que se produzcan transiciones verticales en las que un electrón cercano a la parte superior de la banda de valencia puede recombinarse con un hueco que está cerca de la base de la banda de conducción. Puesto que en d~cha transición se debe conservar la cantidad de movimiento, sólo los electrones y los huecos cuyos vectores k satisfacen la relación (10.8-1) pueden interactuar de esta manera. En el proceso se emite 21 un fotón cuya frecuencia w está dada por (10.8-21 En la figura 10.16(a) se ilustra este proceso de transición directa. La absorción de un fotón acompañada de la producción de un par electrón-hueco, se puede llevar a cabo mediante un proceso que es precisamente la inversa de éste. En substancias tales como el germanio y el silicio, en donde el mínimo de la banda de conducción ocurre a un valor de la cantidad de movimiento del cristal k 0 que no es cero, la recombinación de un electrón en el mínimo de la banda de conducción y un hueco en la parte superior de la banda de valencia, requiere (además de la producción de un fotón) la emisión de un fonón con una constante de propagación k'= k 0 o la absorción de un fonón ya presente con una constante de propagación k' = -k 0 , para que pueda conservarse la cantidad de movimiento del cristal. Este es el proceso que se conoce con el nombre de transición indirecta. La energía que hubiera portado el fotón en una transición directa, es ahora el fonón el que la lleva (o la proporciona). La frecuencia de la radiación asociada con este tipo de transiciones está dada por (10.8-31 en donde e' (k0 ) es la energía asociada con un fonón cuyo número de onda es k 0 • según se obtuvo de la relación de dispersión w(k) para las vibraciones de red, como sigue, s'(k 0 ) = hw(k 0 ). (10.8-4) 21 En (10.8-1), la cantidad de movimiento que se lleva el fotón emitido se ha desechado Esto se justifica debido a que la longitud de onda del electrón (para una energía promedio kn. como lo señala la expresión (8.4-1), es mucho menor que la longitud de onda del fotón para w ~ .t.E/h. Por supuesto, las cantidades de movimiento están asociadas con la longitud de onda respectiva por medio de la relación de De Broglie, (4.9-7). Mecanismos de recombinación; la teoría de Shockley-Read 391 -k -k (a) Figura 10.16. (b) Recombinación electrón-hueco a través de (a} una transición directa y (b} una transición indirecta. Aunque la energía e'(k0 ), es pequeña en comparac10n con la energía de la banda prohibida, !!.e, es perceptible a través de su influencia en la forma de la curva de absorción, en función de la longitud de onda cerca del borde de absorción. También en este caso, la absorción de un fonón para producir un par electrón-hueco se puede considerar como la inversa de este proceso. En realidad, puesto que el fonón emitido o absorbido puede pertenecer a la rama acústica o a la óptica y también puede ser de una vibración transversal o longitudinal, existen cuatro fonones separados que pueden participar en dicho proceso, cada uno de los cuales poset> una frecuencia diferente y, por ende, una energía e' distinta para k= k 0 . Los efectos de los cuatro fonones se pueden observar en los espectros de absorción de esta naturaleza del semiconductor, cerca del borde fundamental de absorción. Por supuesto, las transiciones directas también se pueden producir en materiales en donde el mínimo de la banda de conducción no está en k = O; pero sí es apreciable la diferencia de energía en el borde de la banda de conducción, entre el punto de energía mínima y k = O, la población de electrones para energías correspondientes a k = O será normalmente tan pequeña que tales transiciones son muy poco frecuentes. Del mismo modo, las transiciones directas de absorción requerirán energías del fotón incidente que sean mucho mayores que las que se necesitan para promover las transiciones indirectas. En condiciones normales, las transiciones indirectas son predominantes en todo los semiconductores elementales covalentes y los semiconductores de compuesto de los grupos III y V con la sola excepción de InSb, en el que el mínimo y el máximo de las bandas de conducción y valencia, están en k = O. En cualquier caso, se puede calcular la velocidad a la que se producen las transiciones del espectro óptico de absorción observado del material22 y, por tanto, inferir la velocidad de recombinación y el tiempo de vida de los portadores en 22 En el estado estacionario, las velocidades de generación y recombinación de los pares electrón-hueco deben ser iguales; por esta razón, el cálculo de la velocidad de generación deberá dar también la velocidad de recombinación. Sin embargo, para los pares electrón-hueco producidos por una excitación óptica directa, la velocidad de generación para cualquier longitud de onda de fotón incidente debe ser proporcional al coeficiente de absorción para dicha longitud de onda. La curva de absorción óptica y la velocidad de recombinación originadas en procesos de recombinación directa, entonces están íntimamente relacionadas. 392 Exceso de portadores en semiconductores exceso, basándose en el espectro de absorción. Van Roosbroeck y Shockley23 fueron los primeros en efectuar este cálculo y encontraron que, por ejemplo, en el germanio, el tiempo de vida de los portadores en exceso a la temperatura ambiente, debe ser aproximadamente 0.75 seg, independienten1ente de la densidad de impurezas donadoras y receptoras. Las evidencias experimentales contradijeron este resultado; los tiempos de vida observados de los portadores en exceso raramente excedieron 1o- 3 seg, y se encontró que eran muy sensibles a la concentración de impurezas don'ldoras o receptoras. También quedó bien establecido en la práctica, que los tiempos de vida de los portadores en exceso en el germanio y el silicio se podían reducir drásticamente introduciendo ciertas impurezas, por ejemplo, el cobre, en concentraciones muy pequeñas y mediante la introducción de ciertas imperfecciones estructurales, por ejemplo, dislocaciones. Además, el cálculo de Van Roosbroeck-Shockley predijo la dependencia del tiempo de vida de los portadores en exceso en función de la temperatura, lo cual no se observó experimentalmente. Se demostró que en casi todos los materiales, los tiempos de vida de los portadores en exceso no se veían limitados por las transiciones radiactivas del tipo que se vio antes, sino más bien por algún otro proceso íntimamente relacionado con la presencia de ciertos tipos especiales de átomos de impurezas e imperfecciones estructurales en pequeñas concentraciones. Estos resultados hicieron que se estudiara la recombinación por el atrapamiento de electrones y huecos a través de niveles de energía localizados que se ubican en la parte profunda dentro de la banda de energía prohibida y que se pensó estaban asociados con ciertas impurezas y defectos estructurales "de atraparniento ··. Shockley y Read 24 fueron los primeros en investigar este mecanismo. La teoría Shockley-Read de la recombinación incluye un estudio de las estadísticas de ocupación de dichos niveles de atrapamiento. Aquí se verá detalladamente el comportamiento de un nivel de energía a una energía er dentro de la región de energía prohibida, que es neutra cuando está vacía y que puede ocuparla cualquier electrón, adquiriendo con ello una carga negativa. Estas trampas pueden promover la recombinación electrón-hueco, capturando electrones de la banda de conducción y transfiriéndolos subsecuentemente a la de valencia, siempre que aparezca un hueco cerca de la trampa para recombinarse con el electrón atrapado. El efecto neto es desaparecer el par electrón-hueco con lo que el nivel de atrapamiento vuelve finalmente a su estado original. Puesto que el centro de atrapamiento está casi siempre acoplado de un modo firme a la red, la energía y la cantidad de movimiento que pertenecieron inicialmente al electrón y al hueco pueden convertirse en vibraciones de red. En este proceso se emite muy poca o ninguna energía electromagnética. Existen cuatro pro- ::T T _l_ T Ev (o) Figura 10.17. 23 24 ( b) + + (e) (d) Cuatro procesos fundamentales comprendidos en la recombinación por medio de trampas; (a) la capt,ua de un electrón de conducción hecha por una trampa vacía, (b) la emisión de un electrón desde la trampa hasta la banda de conducción, (e) la captura de un hueco de la banda de valencia efectuada por una trampa que contiene un electrón y (d) la promoción de un electrón de valenc~a a una trampa inicialmente vacía. W. van Roosbroeck y W. Shockley, Phys. Rev., 94, 1558 (1954). W. Shockley y W. T. Read, Jr., Phys. Rev.• 87, 835 (1952). Mecanismos de recombinación; la teoría de Shockley-Read 393 cesos básicos comprendidos en la recombinación electrón-hueco a través de los centros de atrapamiento, como se ilustra en la figura 10.17: (a) la captura de un electrón de la banda de conducción que realiza una trampa vacía inicialmente neutra, (b) la inversa de (a), incluyendo la emisión de un electrón que ocupaba en un principio un nivel de atrapamiento, a la banda de conducción, (e) la captura de un hueco en la banda de valencia realizada por una trampa que contiene un electrón y (d) la inversa de (e)_ en donde se promueve un electrón de valencia hacia una trampa inicialmente vacía (esto también puede considerarse como la emisión de un hueco desde la trampa hasta la banda de valencia). En estas circunstancias, la velocidad a la que los electrones de la banda de conducción son capturados por las trampas, es claramente proporcional al número de electrones de la banda de conducción y a la cantidad de trampas vacías disponibles para recibirlos. Esto se puede escribir como sigue (10.8-5) en donde Cn es una constante y Nt representa la concentración total de centros de atrapamiento en el cristal. Del mismo modo, la velocidad a la que los electrones se emiten desde trampas llenas hasta la banda de conducción, será proporcional al número de trampas llenas y, por tanto, se puede expresar como (10.8-6) en donde En es otra constante de proporcionalidad. De acuerdo con el principio del balance detallado, en el estado de equilibrio estas dos velocidades deben ser iguales, de donde, (10.8-7) Al substituir en esta expresión el valor explícito de la función de Fermi fo de (5.5-20), se obtiene la relación muy simple (10.8-8) Si se substituye el valor dado por (9.3-6) para n 0 , (10.8-8) se puede escribir, finalmente, como (10.8-9) en donde (10.8-10) Al escribir (10.8-9) y (10.8-10), se está suponiendo que la distribución de electrones en la banda de conducción es de tipo maxwelliano. La cantidad n 1 es la concentración de electrones que estaría presente en la banda de conducción, si el nivel de Fermi coincidiera con el nivel de atrapamiento €t. La velocidad neta a la que se capturan los electrones de la banda de conducción es sólo la diferencia entre (10.8-5) y (10.8-6) que, usando (10.8-9) para expresar En en función de Cn, es (10.8-11) 394 Exceso de portadores en semiconductores Así también, la velocidad a la que se capturan los huecos de la banda de valencia debe ser proporcional a la concentración de huecos y al número de trampas que pueden recibir huecos (y, por ende, la cantidad que está ocupada por electrones) entonces (10.8-12) La velocidad a la que los huecos se emiten a la banda de valencia desde los centros de atrapamiento [proceso ( d) de la figura 10.17] es proporcional a la cantidad de trampas ocupadas por huecos (es decir, vacías), de acuerdo con lo cual (10.8-13) Igual que antes, en el estado de equilibrio, Rcp debe ser igual a Rep y razonar1do de un modo análogo a como se hizo al derivar (10.8-9), se puede demostrar que (10.8-14) en donde, (10.8-15) Nuevamente, p 1 puede considerarse como la concentración de huecos que se encontraría en la banda de valencia si el nivel de Fermi se localizara en la energía del nivel de atrapamiento. La velocidad neta a la que los huecos se capturan desde la banda de valencia se puede expresar como (10.8-16) Cuando hay centros de atrapamiento presentes, ya no es posible normalmente suponer que 8n = 8p, a pesar de que se mantiene la neutralidad eléctrica general. debido a que algunos electrones, que de otra manera estarían presentes en la banda de conducción como parte de 8n, ahora pueden estar inmovilizados en las trampas. incapaces de funcionar como electrones de conducción. Esta situación origina ciertas dificultades cuando la densidad de los centros de atrapamiento es grande, y Shockley y Read analizaron esta situación detalladamente. No obstante, si NP es muy pequeño, la aproximación 8n = 8p sigue siendo aceptable. 25 Se supondrá que este es el caso, y en la mayoría de las condiciones de interés práctico en semiconductores covalentes este requisito se satisface. En una muestra en la que los portadores en exceso se recombinan en estas condiciones, se debe tener Rp = Rn, ya que cada recombinación de electrón va acompañada de la recombinación de un hueco. La velocidad común de recombinación se relaciona con eJ tiempo de vida r por medio de (10.8-17) Si se iguala (10.8-11) a (10.8-16) y se resuelve para f(e 1 ), se obtiene (10.8-18) 25 Shockley y Read demostraron que 8n ~8p siempre que cualquiera de las cuatro cantidades, no, Po, n¡ y p¡ sea grande en comparación con N. Mecanismos de recombinación; la teoría de Shockley-Read 395 Al substituir este valor ya sea en (10.8-11) o en (10.8-16) y observando que niPI = nl, es evidente que (10.8-19) Si ahora se escriben = n 0 + 8p, p =Po + 8p, la ecuación anterior se puede exp1 en la forma 1 N,(Po + no + ~P) 1 -(no+ n¡ + ~p) +e (Po+ PI+ ~p) 1 ep ~ar (10.8-20) n En el límite en que n 0 ~8p, p 0 , ni, PI es evidente que (10.8-20) se reduce a 1 = tpo =e N . t p (10.8-21) t El tiempo de vida de los huecos en una muestra tipo n fuertemente extrínseca que tiene una concentración de centros de atrapamiento específica, es justamente el recíproco de epNt· De igual manera, en el límite en que Po ~ 8p, n0 , nI, pI, (10.8-20) se reduce a 1 t (10.8-22) = tno =en N t comprobando que en una muestra tipo p fuertemente extrínseca, el tiempo de vida del electrón es el recíproco de CnNt. Por tanto, (10.8-20) se puede escribir como sigue Po+ no+ ~p (10.8-23) en donde (rpo, Tno) representa el tiempo de vida del exceso (huecos electrones) en un material fuertemente extrínseco (tipo n o p) que tiene las características de atrapamiento particulares que se están tomando en cuenta. El tiempo de vida para materiales intermedios entre estos dos extremos está dado por (1 0.8-23). Para valores pequeños de 8p (10.8-23) puede escribirse como _ (no + n¡) +tno (Po +PI) . t-tpo Po+ no Po+ no (10.8-24) De acuerdo con esta ecuación, el tiempo de vida se puede graficar en función del nivel de Fermi y, por tanto, como una función de n 0 y p 0 • Se ha encontrado que el tiempo de vida es un máximo cuando el nivel de Fermi se encuentra en algún punto dentro de la banda prohibida, cuya ubicación exacta depende de los valores de Tpo, Tno y ni, como se muestra en la figura 10.18. Si Tno y Tpo son iguales, el máximo se producirá en la condición intrínseca. La variación del tiempo de vida con el nivel de inyección 8p se puede estudiar resolviendo (10.8-23) para r, escribiendo el resultado en la forma 396 Exceso de portadores en semiconductores lu J Tpo Ev E¡ Et Ee Ef- Figura 10.18. La dependencia del tiempo de vida en función de la energía de Fermi, como lo predice la teoría Shockley-Read. (10.8-25) en donde (10.8-26) De acuerdo con esto, se observa que si lip es lo suficientemente pequeña, el tiempo de vida tendrá el valor T 0 independiente de lip. Para valores más grandes de lip, el tiempo de vida depende de lip y puede aumentar o disminuir con valores crecientes de lip dependiendo de los valores relativos de T po. T n 0 , n 0 y n 1. Para valores grandes de lip, se puede ver que (10.8-25) da (10.8-27) Si T _ es diferente de To (como sucede casi siempre), existe una vanac10n monotónica del tiempo de vida entre los límites T 0 y T _ conforme aumenta lip. Es difícil establecer comparaciones precisas y significativas entre la teoría de Shockley- Read y el experimento, debido a la dificultad que representa obtener muestras con concentraciones controladas con precisión de un solo tipo de centros de atrapamiento y también debido al número de parámetros desconocidos cuyo valor se debe determinar (o ajustar para que sean apropiados) de los datos experimentales. 26 Sin embargo, la teoría parece coincidir con todos los resultados experimentales a los que puede esperarse sean aplicables hasta la fecha. 27 Explica las variaciones notables observadas del tiempo de vida de los portadores en función de la densidad de los donadores y los receptores, el nivel de inyección, la concentración de los centros de atrapamiento y la temperatura. También puede ampliarse para 26 La dificultad consiste no tanto en ajustar los datos experimentales, sino en que se cuenta con muchos parámetros ajustables que los datos pueden explicar mediante muchos conjuntos posibles de valores para estos parámetros. 27 Véase, por ejemplo, J. A. Burton y colaboradores, J. Phys. Chem., 57, 853 (1964). Mecanismos de recombinación; kl teoría de Shockley-Read 397 In 8C Co Fase normal Atrapamiento lento _, Figura 10.19. Respuec .otoconductiva transitoria de una muestra que contiene gran número de "centros de atrapamiento lento". ofrecer una teoría de la recombinación superficial basada en los niveles de atrapamiento asociados con la superficie; pero teniendo propiedades similares a las de los centros volumétricos que se vieron hasta ahora en lo que respecta a las estadísticas de captura y emisión. Desde el punto de vista físico, los centros volumétricos de atrapamiento de los cristales semiconductores se producen a menudo debido a la presencia de ciertas '"impurezas de atrapamiento". En semiconductores covalentes, tales como el silicio y el germanio, estas impurezas de atrapamiento con frecuencia son dobles receptores divalentes, por ejemplo, Cu y Ni, que proporcionan un nivel receptor ordinario muy cercano a la banda de valencia- y un segundo nivel profundo dentro de la región prohibida que se ioniza con mucha menos fa, tlidad y que funciona como un nivel de atrapamiento. Los niveles donador y receptor originados por la presencia de impurezas de substitución III y V se ionizan casi por completo a todas las temperaturas, excepto las muy bajas y, por ende, usualmente no desempeñan un papel importante en los procesos de recombinación. 28 La presencia de imperfecciones estructurales, sobre todo dislocaciones tipo de borde, han demostrado que también producen niveles receptores de atrapamiento dentro de la región prohibida que en muchos casos proporcionan una contribución importante a la recombinación electrón-hueco. A veces sucede que en una misma muestra estan presentes dos tipos distintos de centros de atrapamiento. Por lo general, uno de éstos es el centro normal de recombinación, como se vio antes; sin embargo, el segundo conjunto de centros de atrapamiento con frecuencia se asocia con una probabilidad de captura de huecos muy reducida cuando está lleno de electrones. Esto conduce a un valor muy grande de r P 0 para esos niveles. Aunque naturalmente se de be repetir el análisis de Schockley · Read, tomando en cuenta desde el principio los dos conjuntos de niveles de atrapa· miento, para describir los detalles de la situación resultante, se ve fácilmente de un modo intuitivo que lo que debe suceder en principio en una medición de fotoconductividad transitoria como la que se vio en la sección 1O. 7, es que algunos electrones se recombinan a través de los niveles normales de recombinación, en tanto que otros caen dentro del segundo grupo de trampas. No obstante, en muy poco tiempo, el proceso de recombinación normal termina con todo el exceso de electrones, excepto con los que quedaron en el segundo grupo lento de trampas que, a continuación, capturan con lentitud el exceso restante de huecos. El decaimiento de fotocon28 Excepto, por supuesto, en lo que pueden influir en la posición del nivel de Fermi. 398 Exceso de portadores en semiconductores ductividad resultante tiene dos secciones exponenciales separadas, con diferentes constantes de tiempo, como se puede ver en la figura 10.19. Existe una fase de recombinación inicial "normal" y una gran "cola de atrapamiento" debida a las trampas lentas. A veces se presenta una confusión en lo que respecta a la termin~ logia relacionada con este efecto, en el sentido de que la parte inicial "normal" del decaimiento se cita a menudo como "recombinación" y el decaimiento final lento se describe como "de atrapamiento". En realidad, las dos fases del proceso están gober· nadas por el fenómeno de atrapamiento y es más exacto citar al primero com: debido al atrapamiento normal y el segundo a efectos del atrapamiento lento. EJERCICIOS l. Principiando con la ecuación de Boltzmann y suponiendo que se aplica la aproximacié>:t del tiempo de relajación, demuestre que en un sistema de estado estacionario que contien: partículas libres en el que existe un gradiente de concentración en la dirección z, se establece w: flujo de difusión - D(fm/6x). Demuestre que el coeficiente de difusión D es igual a 'llc/3 en donlk 'A es la trayectoria libre media y es la velocidad térmica media. Puede suponerse que b. trayectoria libre media A es independiente de la velocidad y que el sistema obedece a la estadir tica de Maxwell-Boltzmann en equilibrio. Nota: suponga que la función de distribución /(r, v) ;.e puede escribir en la forma n(r).f(v); esto es razonable si la desviación del estado de equilibrio 1!-' es muy marcada. 2. Los resultados derivados de los cálculos del problema 1 se aplicaron en el texto a sistemas de estado no estacionario al igual que a sistemas que conservan dicho estado. Explique (cualitativamente) en qué circunstancias es permisible esta aplicación. 3. Demuestre que si f(x, t) satisface la ecuación diferencial e n a'J- [- g[ ax' T -a( entonces, .f(~. t)(~ = x - IJEot, en donde E o =constante) debe ser la solución de az¡ a¡ f D ax' - ¡LEo ax - ~ = a¡ a, . 4. Se crea una distribución de portadores en exceso de estado estacionario en una muestn extrínseca tipo n, por medio de una fuente plana de generación en el origen. La difuSIÓ• resultante y el arrastre de la distribución de los portadores se puede considerar de tipo unidr mensional a lo largo de la dirección x; la extensión de la muestra en la dirección x es esencialmente infinita. Se tiene también un campo eléctrico constante E 0 en la dirección +x. u densidad de portadores en exceso se mide determinando la corriente inversa de saturación en dOi puntas de prueba en lugares diferentes, x =a y x = b(b >a). Se desea calcular la longitud de difusión Lp a partir de la relación de estas dos densidades medidas de los portadores en exceso. Demuestre que J ( d eE d) 0 In Ko In Ko + kT en donde Ko =8p(a)/8p(b) y d =b- a. 5. Principiando con la solución (10.3-32) de la ecuacton de continuidad y definiendo el tiempo de tránsito como el lapso en el que el trazo del osciloscopio llega a un máximo, derive los resultados indicados en (10.4-3) y (10.4-4). 6. Estudie un semiconductor uniforme semiinfinito cuya superficie coincide con el plano yz. El material posee un tiempo de vida volumétrico de portadores en exceso T y existe una velocidad de recombinación superficial s asociada con la superficie. También se tiene una velocidad de generación volumétrica uniforme y constante de portadores en exceso g' en todos los puntos de la muestra. Suponiendo que se ha llegado a un estado estacionario, calcule la densidad de portadores en exceso 8p(x) en todos los puntos dentro de la muestra. Lecturas recomendadas 399 7. De acuerdo con los resultados del problema 6, demuestre que, a condición de que D/L <;¡¡; /2 (D =coeficiente de difusión, L =(DT) 1 /2 =longitud de difusión) no se registra una gran diferencia en la concentración de portadores dentro del volumen o en el flujo difusivo de portadores hacia la superficie, ya sea que s se considere como C/2 o infinito. Demuestre que esta condición se puede representar también en la forma L ~-p 8. Demuestre explícitamente que el conjunto de funciones :cos a.a} con an según la define (10.7-19), es ortogonal. Encuentre la constante de normalización ya derivada (10.7-22). 9. La constante de decaimiento fotoconductiva observada, relacionada con una muestra muy gruesa de germanio tipo n(/)0 = 45 cm 2 /seg, f.4, = 1800 cm2 /V- seg) en 500 ¡Jseg. La muestra se corta en capas de 0.1 cm de espesor, las superficies se atacan químicamente y luego se observa que la constante de decaimiento fotoconductiva es 300 ¡Jseg. ¿Cuál es la velocidad de recombinación superficial asociada con las superficies atacadas químicamente de las muestras delgadas? 10. De acuerdo con los resultados de la teoría de Schockley-Read para un material con centros de atrapamiento para los que T no = T po demuestre que el máximo tiempo de vida posible se produce cuando e¡ está en el punto intrínseco y que, en estas circunstancias, el tiempo de vida está dado por . [ e-e,] T=T•o 1 +cosh~ en donde €¡ es la posición del nivel de Fermi para la condición intrínseca. 11. Explique la variación del tiempo de vida e-n función del nivel de inyección Dp para un material en el que TpO = T no y en donde €t = €v +~. de acuerdo con la teoría Shockley-Read 12. De acuerdo con los resultados y las técnicas desarrolladas en la sección 10.5, demuestre que la constante numérica a de las ecuaciones (10.5-8) y (10.5-9) debe tener el valor 3/2. 13. A veces se indica que, puesto que el flujo en equilibrio de partículas a través de un plano, en una distribución de Boltzmann, es pC/4, la máxima velocidad de recombinación superficial que puede obtenerse (asociada con una superficie de un coeficiente de reflexión igual a cero) debe ser s =C/4. La expresión (10.5-15) contradice esta conclusión y predice que el máximo valor que se puede obtener para s es c/2. Señale el error físico de este argumento Y demuestre que el valor C/2 dado por (10.5-15) es el realmente esperado desde el punto de vista físico. 14. Considete una barra de germanio extrínseco tipo n con una sección transversal constante, que se extiende a lo largo del eje x. Se hace fluir una corriente constante en la dirección x positiva conectando una batería a los extremos de la muestra. Se crea una densidad uniforme de pares electrón-hueco en exceso en t =O, dentro de la región 1 2 • Esta distribución de portadores en exceso sufre un arrastre con una velocidad J.LpE 0 en la dirección positiva de x, de acuerdo con los resultados de la sección 10.2. Utilice sólo argumentos físicos para explicar por qué la dist•ihución de portadores en exceso se desplaza a la derecha a lo largo del eje + x, a pesar de que los electrones en exceso dentro de la distribución deben estarse moviendo hacia la izquierda dentro del campo aplicado. Haga un diagrama que demuestre (esquemáticamente) el campo interno y la densidad de carga espacial que lo produce. Puede suponer que el tiempo de vida volumétrico de portadores en exceso es infinito, que la velocidad de recombinación superficial es cero y que la densidad de portadores en exceso es pequeña en comparación con la densidad de portadores mayoritarios en equilibrio. Nota: principie observando que, debido a la constancia de la densidad de corriente a lo largo de la muestra y la modulación de la conductividad por los portadores en exceso, el campo eléctrico debe ser más pequeño dentro del pulso de portadores en exceso que fuera de él. x <x <x LECTURAS RECOMENDADAS A. Many y R. Bray, "Lifetime of Excess Carriers in Semiconductors," in Progress in Semiconductors, Heywood and Co., Londres (1958), Vol 3, pp. 117-151. Allen Nussbaum, Semiconductor Device Physics, Prentice-Hall, Inc., Englewood Cliffs, N.J. (1962). W. Shockley, Electr0'1S and Hales in Semiconductors, D. Van Nostrand Company, Inc., Nueva York (1950) R. A. Smith, Semiconductors, Cambridge University Press, Londres (1961). E. Spenke, Electronic Semiconductors, McGraw-Hill Book Co., Inc., Nueva York (1958). CAPITUW 11 Tecnología de materiales y medición de propiedades volumétricas 11.1 PREPARACION DE LOS MATERIALES SEMICONDUCTORES DE ALTO GRADO DE PUREZA En los capítulos anteriores se dijo muy poco respecto a las técnicas químicas y metalúrgicas relacionadas con la preparación de las substancias semiconductoras de alto grado de pureza. De igual manera, aunque ya se examinaron con cierto detalle las propiedades eléctricas de los semiconductores, casi no se han analizado las técnicas experimentales que se utilizan para medir dichas propiedades. En este capítulo se intentará remediar estas deficiencias aunque, puesto que el propósito principal es comprender la física de los semic~mductores, será necesario limitarse a un estudio cualitativo, o cuando mucho, semicuantitativo de los aspectos químicos y metalúrgicos de la tecnología de materiales. Se ha demostrado que gran número de substancias presentan las propiedades características asociadas con los semiconductores, los elementos covalentes tales como el germanio y el silicio son los más conocidos, los que se comprenden más a fondo y los que se utilizan más profusamente en la tecnología de dispositivos. Porque entre todas las substancias semiconductoras, éstas son las que se preparan con mayor facilidad en forma de cristales únicos de ultra alta pureza, libres de dislocaciones, vacantes de red y otras imperfecciones estructurales. Los otros semiconductores cavalentes pertenecientes al grupo IV de la tabla periódica, el diamante y el estaño a (gris), son muy difíciles de obtener en forma de cristales únicos grandes de alta pureza y, por tanto, no se han estudiado tan minuciosamente desde el punto de vista fundamental, ni se han utilizado en absoluto en la tecnología de dispositivos electrónicos. Los compuestos intermetálicos que se forman entre los elementos del grupo Ili y el grupo V de la tabla pt:riódica, tales como InSb, GaAs, AIP, etc., cristalizan con la estructura de la zincblenda y forman una serie de materiales semiconductores cuyas propiedades físicas son muy semejantes, en muchos aspectos a las de los elementos covalentes del grupo IV. No obstante, estos semiconductores III-V tienen una naturaleza ligeramente fónica, lo que explica la mayoría de las diferencias en las propiedades de los compuestos Ili-V y las de los semiconductores covalentes del grupo IV. La masa efectiva de los electrones de conducción en los compuestos lli-V por lo general es muy pequeña en comparación con la masa gravitacional m0 , en tanto que la masa efectiva de huecos no es muy diferente de la gravitacional del electrón. Por esta razón, de acuerdo con (9.7-7) y (9.11-19), la movilidad de elec· trones en muestras puras de estos compuestos será muy alta, como también lo será la relación de movilidad b. En el InSb, en donde este fenómeno es más pronun 401 402 Tecnología de materiales y medición de propiedades volumétricas ciado, se observan valores de movilidad electrónica que sobrepasan a 50,000 cm2 /V-seg y relaciones de movilidad de casi 100, a la temperatura ambiente. Desafortunadamente, debido a la probabilidad relativamente alta de recombinación radiactiva y a la dificultad de producir cristales de tales substancias que estén libres de impurezas de atrapamiento e imperfecciones estructurales, los tiempos de vida de los portadores en exceso en estos materiales son muy cortos (I0- 7 seg o menos) y los efectos de los portadores en exceso se pueden observar con extrema dificultad. Las bandas de energía prohibidas asociadas con los diferentes compuestos intermetálicos III-V aumentan al reducirse las masas atómicas de los elementos constituyentes, en la misma forma en que las bandas de energía prohibida de los semiconductores del grupo IV aumentan al ir de Sn a pasando por Ge y Si hasta el diamante. En consecuencia, InSb, al igual que Sn a, tiene una banda de energía prohibida muy pequeña, en tanto que InAs, GaSb, GaAs, GaP y AlP tienen, sucesivamente, mayores anchuras en esa banda. En general, cualquier compuesto III-V tendrá cierta semejanza con el semiconductor del grupo IV ubicado en la tabla periódica a la mitad de la línea que une a los dos constit¡¡yentes del compuesto III-V. Las propiedades características de los compuestos III-V fueron analizadas por Seraphin 1 empleando un ingenioso modelo unidimensional (similar al que se usó en el cálculo de KronigPenney) que permite una solución exacta a la ecuación de Schrodinger. A pesar de las desventajas asociadas con los tiempos de vida muy reducidos de los portadores ~ las dificultades de la preparación de cristales únicos de alta pureza, los compuestos semiconductores III-V se han usado en gran variedad de aplicaciones técnicas, sobre todo cuando la alta movilidad electrónica constituye una ventaja. Además de estas substancias, el carburo de ~Ilicio (SiC), ciertos compuestos 11-VI tales como CdS, CdSe, CdTe, ZnS, PbS, PbSe, PbTe, ciertos óxidos metálicos ~ aun varias substancias orgánicas cristalinas tales como el antraceno, son semiconductores bien conocidos. Sin embargo, con la excepción del carburo de silicio y. quizás el sulfuro de cadmio, la importancia tecnológica de estos mllteriales ha sido muy pequeña, por lo que este estudio se referirá principalmente a los elementos cavalentes del grupo IV y a los compuestos intermetálicos III-V. El material inicial para la preparación de germanio de alta pureza es dióxido de germanio químicamente puro que se obtiene como un subproducto de la fundición y la refinación del zinc. Este material, que se presenta casi siempre en 1::. forma de un polvo blanco finamente dividido, se coloca en crisoles de grafito de alta pureza y se reduce a germanio calentándolo entre 600 y 900°C en una corriente de hidrógeno. La reacción se desarrolla de acuerdo con la ecuación Después de varias horas, el germanio se obtiene en la forma de un polvo negro finamente dividido que se funde en una barra larga y angosta de germanio policristalino, elevando la temperatura por encima del punto de fusión, que es 936°C. Por le general, se incluye un molde o canal con este fin, en la base del crisol de reducción. El lingote resultante tiene el aspecto metálico plateado que es característico del germanio. El lingote reduciclo se purifica más todavía mt:!diante la refinación por zonas. En este proceso, la barra reducida se coloca en un "bote" largo y angosto hecho de cuarzo o grafito y se desliza a través del horno en forma de tubo en el que se han creado varias zonas calientes angostas para fundir una parte angosta del lingote. Cuando se usan botes de cuarzo, estas zonas calientes se pueden crear por medio de anillos de grafito calentados por inducción de radiofrecuencia o por co1 B. Seraphin, Z. Naturforsch, 9a, 5 (1 954). Preparación de los materiales semiconductores 403 Bobinas de ,..-inducción de rf"'-.... 00000 \ 00000 00000 00000 1 ub o externo del horno Figura 11.1. Zonas fundidas Diagrama esquemático del proceso de refinación por zonas para purificar materiales semiconductores. rriente directa; cuando se usan botes de grafito, una parte del mismo bote puede actuar como susceptor cuando pasa por una bobina angosta de radiofrecuencia. En cualquier caso, el efecto es fundir una porción del lingote y pasar la zona fundida continuamente a lo largo de la barra, de un extremo al otro, conforme el lingote se desplaza por la zona caliente. La atmósfera de hidrógeno se usa para evitar la oxidación del germanio a altas temperaturas. En la figura 11.1 se ilustra un diagrama de este proceso. De acuerdo con la ley de distribución de Nernst,Z en el estado de equilibrio térmico, un soluto diluido se distribuye entre dos fases disolventes, de manera que la razón de la concentración del soluto en las dos fases es una constante independiente de las concentraciones del soluto. Si por el momento se considera que las dos fases están en equilibrio teniendo una cantidad de soluto en exceso sobre la cantidad que se puede disolver en equilibrio, y si en ambas fases se forman soluciones ideales, es obvio que la razón constante de las concentraciones debe ser la razón de las solubilidades en equilibrio del soluto en las dos fases disolventes. En el caso del proceso de refinación por zonas, se puede considerar que existe un estado de equilibrio aproximadamente3 entre el germanio sólido y líquido, que se pueden tomar como dos fases disolventes, y las impurezas del sistemas actúan (o al menos eso se espera) como solutos ideales. A continuación, cada soluto se distribuye asimismo entre las fases sólida y líquida en la razón entre su solubilidad en el sólido y su solubilidad en el líquido. Esta razón se cita frecuentemente como el valor de equilibrio K para esa impureza específica. Puesto que la mayoría de los elementos de impureza son mucho más solubles en la fase líquida que en la sólida, los valores de equilibrio K para casi todas las impurezas son mucho menores que la unidad. En estas circunstancias, conforme la zona líquida pasa lentamente por la barra sólida, la mayoría de los átomos de impureza en el fundido se ven rechazados por el sólido en la interfaz, en donde la región fundida se solidifica para formar nuevamente una barra sólida. Cuando una sola zona fundida pasa por un lingote largo, los átomos de impureza tienden a recogerse en el líquido y finalmente se precipitan sólo en el mismo extremo del lingote cuando la última parte de la zona fundida se solidifica finalmente. Este proceso de segregación se puede acentuar más todavía repitiendo el proceso y terminando por pasar muchas zonas fundidas por el lingote. En el límite 2 Véase, por ejemplo, G. N. Lewis y M. R:mdall, Thermodynamics, Nueva York: McGrawHill, 1923, página 234. 3 Por supuesto, estrictamente hablando, el equilibrio se mantiene sólo en un sistema a temperatura constante, en el que la interfaz sólido-líquido sería la estacionaria. La descripción anterior no es válida cuando las velocidades de interfaz y los gradientes de temperatura se hacen demasiado grandes. 404 Tecnología de materiales y medición de propiedades volumétricas Concentración Concentración ¡K- ~=K C Cs t-----~Cs t-------lCs -4--------~---------------.x -4----------~------------.x líquido Sólido Interfaz (o) Velocidad baja de interfaz Figura 11.2. -K* C¡o ------::"!---- Czor------ Sólido Cz líquido ( b) Velocidad alta de interfaz Concentración de impurezas en las fases sólida y líquida cerca de una interfaz SÓlido-lÍquida dentro de un aparato de refinación por zonas, (a) a una velocidad baja de interfaz y (b) a una velocidad más alta de interfaz. de un número infinito de pasos de zona, se logra un perfil restrictivo de concentración y la purificación más allá de esta etapa no se puede lograr de modo directo. Sin embargo, si se desea una segregación de impurezas subsecuente, el lingote se puede sacar del horno, se le quita la porción extrema (que ahora contiene casi todas las impurezas de la muestra) y la sección restante vuelve a someterse a otra refinación por zonas. En cualquier caso, al concluir con el proceso de refinación por zonas, la sección extrema del lingote debe eliminarse. Mientras que para velocidades de interfaz muy lentas la razón de la concentración de impure7as en el sólido a la del líquido es la razón de las solubilidades en equilibrio, para mayores velocidades de interfaz, los átomos de impureza que rechaza el sólido en enfriamiento se concentran cerca de la interfaz más rápidamente de lo que se pueden eliminar por difusión hacia el interior de la zona fundida, como se ilustra en la figura 11.2. La concentración real de impurezas c1 cerca de la interfaz. por tanto es mayor que el valor de equilibrio c10 • El resultado es que se incorporan más átomos de impureza al sólido que en el caso de la velocidad baja, en donde se puede mantener una concentración constante a lo largo de la zona líquida por medio de la difusión. El efecto es el mismo que si el valor de equilibrio K se substituyera con un valor efectivo K*, en donde e, K*= K·--. (11.1-1) ero Puesto que la razón c1/c10 se verá afectada por la velocidad de interfaz, y el coeficiente de difusión de los átomos de impureza en el líquido, K* debe depender también de estos factores. No obstante, es evidente que si K< 1, entonces K* debe ser mayor que K. Por lo común, se considera ventajoso trabajar en condiciones tales que K* sea apreciablemeHte diferente de K, y en estas circunstancias casi siempre es necesario determinar K* por experimentación. Se puede demostrar fácilmente 4 que la distribución de impurezas en un lingote inicialmente uniforme después de pasar por una zona de longitud 1, es (11.1-2) 4 W. G. Pfann, J. Metals, 4, 747 (1952). Preparación de los materiales semiconductores 405 en donde eso es la densidad inicial de impurezas y x la distancia a lo largo de la barra. También se puede demostrar que la distribución limitante a la que se aproxima después de un gran número de pasadas es (11.1-3) en donde, A = _c.;;,0=-B_L_ e8 I. - 1 (11.1-4) K*=_!!!__ eBL - 1 (11.1-5) y En este caso, L es la longitud total del lingote. Para mayores datos sobre el proceso de refinación por zonas, el lector debe consultar el artículo de Pfann4 0 una monografía reciente de Hannai. s Es evidente que el proceso de la retinacion por zonas se puede aplicar no sólo al germanio, sino también a una gran variedad de otros materiales. En la tabla 11.1 se da una lista de los valores de equilibrio K para unpurezas que se encuentran comúnmente en el germanio y el silicio. Debe observarse que el boro es la única impureza común cuyo valor de equilibrio K en el germanio es mayor que la unidad, es decir, que el líquido la rechaza hacia el sólido. Esta peculiaridad da como resultado la segregación del boro en el extremo de la cabeza del lingote más que en su cola. La preparación de silicio altamente puro principia casi siempre con la reducción del tetracloruro de silicio (SiCl4 ) o el triclorosilano (SiHCh) por medio del hidrógeno a aproximadamente 11 00°C. La reacción se desarrolla de acuerdo con la ecuación SiHC1 3 + H 2 -+ St + 3HCI. TABLA 11.1 Coeficiente de segregación de Ge y Si6 •7 Impureza K(Ge) K(Si) p 0.12 0.04 0.003 20. 0.1 0.1 0.001 0.04 0.07 0.002 0.68 0.0016 0.004 0.0003 As Sb 8 Al Ga In s N. B. Hannay, Proceedinxs of the Jnternational School o( Physics, "Enrü:o Fermi". Curso 22 {Semiconductores). Nueva York, Academic Press, 1963. págs. 341-435. 6 R. N. Hall, J. Chem. Phys., 51, 836 {1953). 7 J. A. Burton, Physica, 20, 845 {1954). 406 Tecnología de materiales y medición de propiedades volumétricas Silicio sólido Zona fundida Figura 11.3. generador de rf Representación esquemática del proceso de zona flotante para la purificación d.:-: silicio. Todos los reactivos se encuentran en la fase gaseosa a la temperatura a la que el proceso se lleva a cabo, con la excepción del silicio, que se precipita en un substrato apropiado. Este substrato puede ser una muestra de un cristal de silicio de alta pureza, en cuyo caso, la estructura reticular fundamental del substrato se continúa en la capa precipitada y, entonces, el proce3o de crecimiento se denommJ. epitaxial. Otra posibilidad es que el substrato sea una varilla delgada de silicio policristalino que produce un lingote cilíndrico apropiado para la refinación por zonas.. La refinación por zonas del silicio es similar en principio, al proceso usadc para el germanio, excepto por la complicación de que el silicio fundido se humedece, reacciona y se contamina prácticamente con cualquier substancia conocida que pueda utilizarse como crisol. Por tanto, es necesario emplear una técnica que nü requiera un crisol y la más común es el proceso denominado zona flotante. En este proceso, una varilla cilíndrica de silicio se sujeta verticalmente por ambos extremos ~ se calienta mediante una bobina de inducción de radiofrecuencia acoplada directamente al mismo silicio. Se puede fundir una región angosta del lingote y la tensiór: superficial del silicio fundido basta para evitar que la zona fundida se derrumbe y se pierda. A continuación, la zona puede pasarse a lo largo del lingote para segregar impurezas hacia un extr~mo, y el proceso se puede repetir cuantas veces sea necesario para alcanzar el grado de pureza requerido. En la figura 11.3 se ilustra este proceso. Se puede reducir el contenido de impurezas eléctricamente activas tanto er: el germanio como en el silicio hasta una parte en 10 11 Esto es suficiente pan producir germanio que es intrínseco a la temperatura ambiente; pero no lo suficientemente bueno para obtener silicio intrínseco (sería necesario otro factor de 10-100 para lograr esto). El silicio y el germanio con refinación por zonas tiene~ la suficiente pureza para servir como material inicial para una gran variedad de dispositivos semiconductores. La preparación de especímenes de alta pureza de los compuestos intermetálicos lli-V se logra casi siempre fundiendo cantidades estequiométricas de los constituyentes elementales sumamente purificados, en tubos de cuarzo sellados, para prevenir la pérdida de los volátiles por evaporación. Los lingotes obtenidos se pueden purificar a menudo de un modo notable mediante la refinación por zonas; pero también en este caso, la muestra debe confinarse a un tubo sellado. En general, los esfuerzos para purificar los compuestos Ill-V por el procedimiento de refinación por zonas u otras técnicas, no han tenido el éxito logrado con materiales del grupo IV. Crecimiento de muestras monocristalinas 11.2 407 CRECIMIENTO DE MUESTRAS MONOCRISTALINAS En general, el material producido mediante el proceso de refinación por zonas es policristalino, a pesar de que es muy puro. Lo que normalmente se desea para las investigaciones experimentales o los fines tecnológicos, son muestras semiconductoras de un monocristal que puedan "impuríficarse" intencionalmente con algún elemento de impureza dado, con el fin de producir un material con un tipo de conductividad y una resistividad eléctrica específicas. Existen varías formas de hacer crecer monocristales y cada una posee ciertas ventajas para aplicaciones particulares. Los monocrístales de germanio se hacen crecer por un procedimiento en el que uno de los extremos de un lingote refinado por zonas se pone en contacto con una semilla monocristalína, dentro de un bote apropiado. A continuación se forma una zona fundida entre el cristal semilla y el lingote policrístalino, y se pasa lentamente hacía abajo del lingote, de tal manera que el recrecimiento se inicia en la semilla y continúa su estructura cristalina a lo largo del lingote. Sí se escoge la orientación adecuada de la semilla monocristalína, se puede obtener cualquier orientación cristalina deseada dentro del lingote final,' e incorporando pequeñas cantidades de elementos de impureza a la zona fundida, pueden elaborarse cristales tipo p o n con cualquier contenido de impureza deseado. Se debe permitir un margen apropiado para la segregación de impurezas en la interfaz de crecimiento cuando se calcula la cantidad de impurezas requerida. Puesto que las cantidades necesarias de impurezas que se deben agregar son casi siempre microscópicas, se acostumbra producir una aleación de impurificación de germanio puro al que se ha agregado quizá 0.1 ó 0.01 por ciento de la impureza deseada para introducir esta aleación de impurezas al fundido, en lugar de intentar impurificado de un modo directo. Este proceso es capaz de producir cristales grandes de germanio con una perfección estructural muy elevada y se puede usar también con ciertos compuestos intermetálicos, sobre todo el lnSb; pero no se puede emplear para producir monocristales de silicio, ya que Salida del cristal -1 Horno de cuarzo Soporte --r-E----1 Semilla Atmósfera inerte o vacío --"""""~ Figura 11.4. Cristal Representación esquemática del proceso de Czochralski para h·¡cer crecer monocristales a partir de una fase fundida. 408 Tecnología de materiales y medición de propiedades volumétricas éste se humedece o reacciona con todos los materiales que pueden utilizarse para fabricar el bote. Sin embargo, se pueden obtener monocristales de silicio de alta calidad utilizando una modificación adecuada del proceso de zona flotante. Otro método que se usa con mucha frecuencia para el crecimiento de monocristales, es la llamada técnica de Czochralski, en el que una semilla monocristalina con la orientación deseada se sumerge en un fundido preparado a partir de un material refinado por zonas y con una impurificación apropiada. El suministro de calor al fundido se reduce y el cristal semilla se extrae lentamente haciéndolo girar al mismo tiempo, como se indica en la figura 11.4. El diámetro del cristal óbtenido puede controlarse regulando la velocidad de extracción y el suministro de potencia al fundido. Un crisol de grafito puede ser satisfactorio para hacer crecer cristales de germanio; pero se requiere un recubrimiento de cuarzo para el silicio. Aunque el silicio fundido se humedece y reacciona con el cuarzo, el recubrimiento es atacado con mucha lentitud y el crecimiento del cristal no se perturba gravemente. Parte del oxígeno del recubrimiento de cuarzo se puede introducir a los cristales de silicio obtenidos por esta técnica; pero no es una impureza eléctricamente activa y no afecta seriamente la calidad del cristal para la mayoría de los fines experimentales o técnicos. La técnica de Czochralski también se puede usar para hacer crecer monocristales de los compuestos intermetálicos 111-V; pero para estas substancias se requiere casi siempre un sistema cerrado para minimizar las pérdidas de los compuestos volátiles. La extracción del cristal y la rotación con frecuencia se logran por medio del sistema sobre armaduras ferromagnéticas del interior. La posibilidad de hacer crecer epitaxialrnente regiones monocristalinas de silicio ya se mencionó en conexión con la preparación de dicho elemento mediante la reducción de fase de vapor de los cloruros. Este proceso es valioso, sobre todo para hacer crecer regiones planas paralelas de tipos opuestos de conductividad o condensidades de impureza abruptamente variables debido a que estas impurezas se pueden incorporar (por ejemplo, como, PC1 3 o BC13 gaseosos) en la corriente de gas de entrada. También se han desarrrollado procesos para adaptar esta técnica al uso del germanio. Además, se ha usado el crecimiento dendrítico del cristal para producir cristales apropiados para utilizarlos en la tecnología de dispositivos semiconductores. El crecimiento dendrítico se produce cuando un cristal semilla se inserta en un fundidc superenfriado. En estas condiciones se inicia un crecimiento rápido semiforme CU) a velocidad se determina de la razón a la que se puede alejar el calor latente de fusión en la interfaz de solidificación. Si el cristal en crecimiento se estira hacia arrriba con gran rapidez sac:\ndolo del fundido, se puede formar una tira dendrítica de semiconductor. Las v'elocidades de crecimiento del orden de 5cm/seg son típicas (er. comparación con 1o- 3 cm/seg del proceso de Czochralski en el que el fundido nc está superenfriado). La anchura y el espesor del cristal dendrítico se pueden controlar dentro de ciertos límites, variando el superenfriamiento del fundido y la velocidad con que se extrae la tira del fundido. También es muy posible, en el caso de: germanio, producir tiras dendríticas de 1 a 5 mm de ancho y de 0.1 a 0.5 mm de grueso. La longitud está limitada sólo por los arreglos que se puedan hacer pan extraer la dendrita. Las superficies de los cristales dendríticos son ópticamente planas y, si se toman ciertas precauciones en su crecimiento, pueden ser fundamentalmente perfectos desde el punto de vista estructural. La ventaja más evidente del procese dendrítico es que produce cristales que se pueden emplear directamente como material inicial para dispositivos semiconductores, sin necesidad de recurrir a operacione1 de corte, pulido, grabado o ataque con ácidos que, de otra manera, son necesariu. El espesor de las tiras dendríticamente crecidas se puede controlar de tal modo qut sea muy uniforme, lo cual tiene gran importancia en muchos procesos de fabricación de dispositivos. Se pueden producír con facilidad cristales dendríticos muy buenos de Medición de la resistividad volumétrica 409 germanio, silicio e InSb, y también se ha logrado el crecimiento de dendritas de otros compuestos intermetálicos III-V; pero con mayor dificultad y con resultados algo deficientes. 11.3 MEDICION DE LA RESISTMDAD VOLUMETRICA La medición de la resistividad es la más fundamental de las mediciones de rutina que se hacen en los cristales semiconductores. Básicamente, cualquier medición se hace pasando por la muestra una cantidad de corriente conocida con precisión, y midiendo la caída de voltaje entre dos puntos separados por una distancia conocida. Sin embargo, existen algunas técnicas específicas que tienen la suficiente importancia que justifique un estudio más amplio. Una forma muy exacta de medir la resistividad de un espécimen de semiconductor bastante homogéneo es obtener un potencial transversal de la muestra, haciendo una serie de mediciones potenciométricas de la caída de voltaje entre un contacto fijo y una punta de prueba móvil, conforme este último se desplaza a lo largo de la muestra en pequeños incrementos, casi siempre de 0.5 mm ó 1.0 mm. En la fJgUra 11.5 se muestra un diagrama de esta medición. Si la distancia entre las puntas de prueba se incrementa de x a x + Ax, la resistencia t:.R del elemento pequeño de la muestra que queda entre .X y x + !:u, se suma a la resistencia R de la porción comprendida entre O y x. Entonces, si la corriente que fluye por la muestra es 10 y si se observa un cambio AV en el potencial entre la punta fija y la móvil que acompaña al cambio en el espaciamiento de la punta /:u, por definición de la resistividad, (11.3-1) en donde A es el área transversal (constante) de la muestra. Al resolver para p, es evidente que AL\ V p=-- lol\x (11.3-2) representa la resistividad del material que queda entre x y x + Ax. Si se hace una serie completa de mediciones que incluyen incrementos constantes en el espaciamien- Al potenciómetro (- l Micrómetro para ,...L_ r-.-.,.-,¡vuw11l\ proporcionar el __L_L:.::.:..::::__:=::::.:_:_:.:..:::.::::::~=L!-c.....I4Mt.IJJI movimiento Base Figura 11.5. calibrado de la muestra Diagrama del aparato para determinar la resistividad volumétrica por el método del potencial transversal. 410 Tecnología de materiales y medición de propiedades volumétricas to de la punta, se puede llegar a una determinación experimental de la resistividad en función de la distancia a lo largo de la muestra. Esta gráfica a menudo se denomina perfil de resistividad de la muestra. Debe hacerse notar que, puesto que se usa un potenciómetro para medir el potencial entre la punta fija y la móvil, no fluye ninguna corriente entre estos electrodos. Otra forma muy sencilla, pero menos exacta de medir la resistividad, que con frecuencia se puede emplear para controlar las especificaciones del material en procesos de elaboración de dispositivos, es mediante la técnica de las cuatro puntas. En este método, se tienen cuatro puntas de prueba equidistantes que se sitúan sobre la muestra, como se ilustra en la figura 11.6. El par de puntas que queda al exterior se usa para hacer pasar por la muestra una corriente uniforme y el par del interior sirve como probadores de potencial entre los cuales se puede medir potenciométricamente una caída de voltaje. Si se usan los métodos normales de la electrostática y la teoría de la corriente uniforme, se puede encontrar la distribución de potencial resultante y, a partir de esta solución, se puede demostrar que la diferencia de potencial entre las puntas internas debe estar dada por 1 V=2nua (11.3-3) en donde 1 es la corriente uniforme que fluye por las puntas probadoras externas y a el espaciamiento entre las puntas adyacentes. Por tanto, la resistividad de la muestra es 1 2naV p=-=--. (1 1 (11.3-4) Los detalles de la derivación de (11.3-3) quedan asignados como tarea para el lector. Al obtener esta ecuación se supone una muestra semiinfinita y, por tanto. estrictamente hablando, (11.3-3) no es válida para muestras de extensión finita. Sin embargo, si todas las dimensiones de la muestra son grandes en comparación con el espaciamiento de las puntas, a, el error que representa el uso de (11.3-3) o (11.3-41 será muy pequeño. En estos dos métodos mencionados, las condiciones del experimento deben ser tales que se eviten por completo los efectos originados por la inyección de portadores minoritarios en los contactos de la corriente. Esto se logra con mayor facilidad puliendo o usando cualquier otro abrasivo en las superficies de la muestra para que los portadores inyectados en exceso se recombinen rápidamente Muestra Figura 11.6. Diagrama esquemático del aparato de cuatro puntas para medir la resistividad. Medición del contenido de impurezas 411 cerca de los contactos de la corriente y manteniendo la corriente uniforme lo suficientemente baja para .:vitar cualquier modulación significativa de la conductividad mediante los portadores inyectados. Al hacer las mediciones de resistividad a temperaturas bajas es necesario confinar la muestra dentro de un crióstato al vacío 1 para evitar la condensación de la humedad atmosférica ambiental en sus superficies. En estas circunstancias, la resistividad se mide casi siempre de un modo potenciométrico, determinando la caída de voltaje entre dos contactos fijos a una distancia conocida de separación cuanrlo se pasa una corriente uniforme a lo largo de la muestra. A continuación la resistividad procede de (11.3-2) siendo .!lV la caída de voltaje medida y .!lx la distancia entre los contactos. Todos los métodos analizados aquí se aplican principalmente a muestras de suficiente homogeneidad; para especímenes en los que las fluctuaciones de resistividad son grandes en distancias pequeñas, se requiere usar técnicas especiales. 11.4 MEDICION DEL CONTENIDO DE IMPUREZAS Y LA MOVILIDAD MEDIANTE EL EFECTO DE HALL La teoría del efecto de Hall se estudió en los capítulos 7 y 9, y aquí sólo se verá un estudio breve de las técnicas experimentales. En los extremos de la muestra se establecen contactos de corriente grandes, en tanto que se aplican a los lados pequeñas puntas de prueba o contactos soldados hacia la mitad de la trayectoria de la corriente, para la medición de potencial. Con frecuencia las técnicas de soldadura ultrasónica son muy útiles para establecer estos contactos, así como los que se utilizan para otros fines experimentales. El voltaje de Hall se debe medir potenciométricament~> para satisfacer la condición de que la componente y de la corriente sea cero. Por lo general, las superficies de la muestra se pulen y se usan valores mínimos de corriente de muestra casi siempre, para evitar, lo más posible, la inyección de un exceso de portadores a la misma. Si los contactos de potencial no están perfectamente alineados para que coincidan con los extremos opuestos de la misma línea equipotencial en ausencia del campo magnético estático, además del voltaje de Hall se deberá medir una caída óhmica de voltaje proporcional a la corriente uniforme de la muestra. Esta situación se ilustra en la figura 11.7. El efecto de esta caída óhmica espuria se puede eliminar haciendo cuatro mediciones por separado; primero con el campo magnético y la comente uniforme en dirección positiva, luego con el campo magnético positivo y la Terminal de voltaje 1 ---1 1 Error de alineación Io- Figura 11.7. Geometría de las muestras usadas para las mediciones del efecto de Hall, mostrando el origen de las caídas óhmicas de voltaje debidas a una alineación deficiente de los con tactos. 412 Tecnología de materiales y medición de propiedades volumétricas corriente unifonne inversa, a continuación con el campo magnético y la corriente inversos y, por último invirtiendo el campo y con la corriente positiva. Por tanto, el voltaje de Hall obtenido es (11.4-1) en donde las cantidades entre paréntesis describen la condición de la corriente y el campo pertenecientes a la medición del potencial. Es evidente que la caída óhmica se elimina mediante este procedimiento, ya que el voltaje de Hall cambia de signo tanto con la corriente como con el campo invertidos, en tanto que la caída óhmica cambia de signos sólo cuando la corriente se invierte. Puesto que el análisis de las mediciones de Hall es muy difícil para muestras intrínsecas o casi intrínsecas, cuando se trata de muestras que no son extrínsecas a la temperatura ambiente a menudo se prefiere efectuar las mediciones a temperaturas bajas a las que los especímenes son definitivamente extrínsecos. Esto se aplica sobre todo cuando el objetivo primordial es evaluar la densidad neta de átomos de impureza de las muestras. En estas circunstancias se requiere usar un crióstato al vacío. También se necesita utilizar valores de campo magnético estático suficientemente bajos para que w 0 T~ 1, en donde w 0 es la frecuencia de ciclotrón eE0 /m*c, para que sea válido el análisis de la sección 9.8. La densidad de portadores de la muestra se puede calcular a partir del voltaje de Hall de acuerdo con los métodos que ya se desarrollaron y describieron en las secciones 7.6 y 9.8. La movilidad de Hall puede obtenerse combinando los resultados de Hall y la resistividad; este procedimiento se delineó ya en la sección 9.8. 11.5 MEDICION DEL TIEMPO DE VIDA DE LOS PORTADORES EXCEDENTES La medición del tiempo de vida de los portadores en exceso se logra casi siempre observando el decaimiento de la fotoconductividad transitoria. La teoría de esta medición se vio detalladamente en la sección 10.7 y no es necesario que se agregue nada aquí, excepto una breve descripción del aparato. Se puede utilizar un tubo de arco de gas de xenón a alta presión (como por ejemplo, el Edgerton, Genneshausen y Grier XP-12) para excitar la fotoconductividad de la muestra. Este tubo produce una iluminación muy intensa y repentina que dura aproximadamente 10- 6 seg. El bulbo o tubo puede usarse en combinación con un sistema óptico para concentrar en la muestra la mayor cantidad de luz posible. Un arreglo muy aceptable es montar el tubo de "flash" en uno de los focos de un Reflector 4000V~~~~~---, Fuente de alimentación de alto voltaje Batería de barrido 1111~~+---o Figura 11.8. ~ Osciloscopio t----..._--11---o Representación esquemática para la determinación de los tiempos de vida de los portadores en exceso a través de las mediciones de fotoconductividad transitoria. Dislocaciones y otras imperfecciones 413 reflector elipsoidal y la muestra en el otro. El bulbo de "flash" es similar a los que se utilizan como fuentes lumínicas fotográficas. Se puede operar como un oscilador de relajación de funcionamiento libre en un circuito como el que aparece en la figura 11.8, con el fm de obtener "flashes" repetitivos. El decaimiento de la fotoconductividad se observa en un osciloscopio de banda ancha y los tiempos de vida se obtienen de las curvas de decaimiento observadas aplicando los métodos que se vieron en la sección 1O. 7 Este método se re!ftringe a tiempos de vida superiores a w- 6 segundos, ya que la iluminación del bulbo de "flash" no se corta abruptamente, sino que se pierde con cierta constante de tiempo de este orden de magnitud. Se han desarrollado fuentes especiales de chispa que se pueden emplear para resolver tiempos de vida algo más cortos. 11.6 DISWCACIONES Y OTRAS IMPERFECCIONES Las dislocaciones son defectos reticulares en cristales que se pueden comprender en función de un deslizamiento interno parcial. Existen dos tipos básicos de estructuras con dislocación, las de tipo de borde y las de tipo de tornillo. En la figura 11.9 se muestra el tipo de dislocación de borde. Se puede considerar que este tipo de dislocación es el resultado de un deslizamiento interno parcial en el plano ABCD a lo largo de la dirección BC. En la ilustración, la magnitud del deslizamiento es una distancia interatómica. Se puede pensar que el cristal resultante contiene un medio plano extra de átomos (ABEF en el diagrama) y está claramente en un estado de esfuerzo mecánico en la región del borde de dislocación AB tal, que el material está en tensión por encima del borde de dislocación y en compresión por debajo de éste. La dislocación tipo tornillo se ilustra esquemáticamente en la figura 11.1 O. En esta estructura con dislocación, el deslizamiento se ha desarrrollado paralelamente a la línea de dislocación, que es normal a la superficie superior del cristal, más que E e - Vector de deslizamiento F ,' , Figura 11.9. ..1/ A Diagrama esquemático de un cristal que contiene una di~locación tipo borde. La dislocación se puede considerar como producida por un deslizamiento que representa un espaciamiento de red en la dirección BC. Puede pensarse que el cristal contiene el "plano adicional" de átomos, ABEF. 414 Tecnología de materiales y medición de propiedades volumétricas Vector de deslizamiento Figura 11.10. Representación esquemática de una dislocación tipo tornillo. perpendicular a la línea de dislocación, como sucede en el caso de la dislocaciór: tipo borde. En realidad, las dislocaciones de borde y tomillo pueden considerarse como diferentes aspectos del mismo fenómeno de deslizamiento interno, como se indica en la figura 11.11, que es una vista del cristal que aparece en la figura 11.9 con una región de deslizamiento interno de distinta forma. En este caso, la mismé línea de dislocación (representada siempre por el símbolo 1) es normal al vector de deslizamiento en la cara frontal del cristal, como en una dislocación de borde, ~ paralela al vector de deslizamiento en un lado, como en la dislocación de tornillo. Quizá sea más exacto decir que la dislocación posee una orientación de borde en e: frente y una orientación de tornillo lateral, aunque no se usará aquí rigurosamente esta terminología. Las dislocaciones se forman en las etapas iniciales del crecimiento del cristal ~ son responsables de muchas propiedades que se observan en los cristales. En realidad. fTornillo /Vector de ¡..___,,__. deslizamiento Figura 11.11. Cristal que contiene una región de deslizamiento que origina una dislocación que tiene, en parte, una orientación de tornillo y, en otra, una orientación de tipo borde. Dislocaciones y otras imperfecciones 415 la mayoría de las características observadas del crecimiento del cristal a partir de un fundente líquido de una solución supersaturada o de una fase de vapor, están gobernadas por las dislocaciones en los cristales de crecimiento más que por cualquier otra propiedad de la red cristalina perfecta propiamente dicha. La razón de esto es que los átomos de las fases líquida o de vapor están enlazados a una cara creciente del cristal con mayor fuerza en un "escalón" en el que termina una capa incompleta de átomos, que en un sitio aislado en la cara del crecimiento. Esto es cierto porque en el escalón, un átomo que entra puede unirse a dos átomos de la red cristalina más bien que a uno sólo. En la figura 11.10 se ilustra esta situación. Por tanto, el crecimiento procederá con mucha mayor rapidez (o con la misma rapidez a un nivel mucho más bajo de saturación o subenfriamiento en la fase líquida o sólida) en una cara de escalón que en una superficie plana completa y estructuralmente perfecta. La formación de un escalón en un cristal estructuralmente perfecto mediante la coalescencia de varios átomos aishdo~ que se depositan de un modo aleatorio de la fase líquida o de vapor, es no obstante un suceso de muy escasa probabilidad, ya que tales átomos no están fuertemente unidos a la cara del cristal y, por lo general, no se unen a él el tiempo suficiente para enlazarse y formar un escalón de crecimiento; por lo contrario, casi siempre se sueltan por agitación térmica antes de que esto pueda ocurrir. Cuando se forma un escalón de esta manera, se extenderá con gran rapidez a través de la cara del cristal mediante la adición de átomos en los bordes, en donde se unen con gran fuerza hasta que se haya agregado una nueva capa atómica. Entonces, el crecimiento posterior procede sólo con gran dificultad, ya que ahora se debe formar un nuevo escalón sobre la capa añadida. Sin embargo, la situación es totalmente diferente si el cristal contiene una dislocación de tornillo, como se ilustra en la figura 11.1 O. La dislocación de tornillo proporciona un escalón autoconstruido que no se puede eliminar nunca de la cara de crecimiento mediante la adición subsecuente de átomos. Cuando los átomos se agregan a una velocidad constante al escalón asociado con una dislocación tipo tornillo, como la que s~ ilustra en la figura, todas las partes del escalón obtienen la misma veloddad de crecimiento lineal constante. Esto produce una velocidad angular de crecimiento respecto del centro, que es mayor cerca de la dislocación que lejos de ésta, y el escalón tiende a tomar una forma espiral arrollándose alrededor de la dislocación central. Estas configuraciones espirales escalonadas se observan con frecuencia en cristales en crecimiento y proporcionan una evidencia directa de que éste constituye un mecanismo importante de crecimiento. 8 Sólo estos pequeños núcleos cristalinos formadQs en un fundido ligeramente subenfriado o en una solución supersaturada, que contienen dislocaciones, son capaces de crecer a un tamaño macroscópico antes de separarse por agitación térmica. Los procedimientos de crecimiento que se pueden observar en muestras cristalinas ordinarias son procesos que se asocian con la presencia de dislocaciones de tornillo. Cuando se aplican esfuerzos a cristales que contienen dislocaciones, se puede mover la dislocación dentro de ellos. Por ejemplo, si se aplica un esfuerzo cortante proveniente de una fuerza dirigida hacia la izquierda y aplicada a la parte superior de la muestra, y una fuerza a la derecha en la parte inferior, en el cristal de la figura 11.9, la línea de dislocación AB puede desplazarse hacia la izquierda a través del cristal. Aunque un estudio completo de la mecánica de las dislocaciones está fuera del alcance de este estudio, casi todas las propiedades mecánicas de cristales macroscópicos, incluyendo los módulos elásticos, la deformación plástica y por deslizamiento, el endurecimiento con aleaciones y tratamientos térmicos, las propiedades 8 Por supuesto, para ser observables incluso al microscopio electrónico, el vector de deslizamiento de la dislocación de tornillo asociada con estas "espirales de crecimiento" deben extenderse muchas veces sobre la dimensión de la célula unitaria. 416 Tecnología de materiales y medición de propiedades volumétricas Figura 11.12. Resolución de un desajuste atómico de una frontera de grano con ángulo pequeño, mediante la formación de una hilera de dislocaciones tipo borde. de templado y endurecimiento por trabajo, se pueden explicar en función del movimiento de las dislocaciones y la interacción de éstas mismas, así como con los átomos de impureza.9 • 10 La formación de fronteras de grano y las regiones de material estructuralmente imperfecto, asociadas con las fronteras de grano, se pueden estudiar también de acuerdo con las dislocaciones. En particular, el desajuste entre los planos cristalinos que se producen en una frontera de grano de ángulo pequeño se puede resolver a través de la formación de una hilera de dislocaciones tipo borde en dicha frontera, 11 como se ilustra en la figura 11.12. Este tipo de frontera de cristal se denomina a veces frontera lineal de Burgers. La presencia de dislocaciones tipo borde en cristales semiconductores se detecta fácilmente con ataques químicos en la superficie cristalina utilizando ciertos reactivos. Puesto que la red cristalina alrededor de la dislocación ya se encuentra en un estado de deformación, se requiere menos energía para romper la red en ese punto que en cualquier otra parte. Como resultado de esto, el ácido ataca la superficie cristalina con mayor rapidez cerca de las dislocaciones formando pozos claramente visibles al microscopio que marcan la intersección de las dislocaciones de borde con la superficie del cristal. En la figura J 1.13 se muestra una fotografía con pozos atacados con ácido en las dislocaciones asociadas con una frontera de grano de ángulo pequeño en el germanio. Estas fotografías proporcionan una verificación experimental sorprendente de la representación de una frontera de ángulo pequeño que se muestra en la figura 11.12, ya que el ángulo de desajuste entre las dos secciones del cristal se puede calcular a partir del espaciamiento entre los pozos y determinarse experimentalmente a través de mediciones de difracción de rayos X. Por tanto, 9 W. T Read, Dislocations in Crystals, Nueva York: McGraw-Hill, 1953. 10 A. H. Cottrell, Dislocations and Plastic Flow in Crystals. Nueva York: 11 J. M. Burgers. Proc. Phys. Soc. (Londres) 52, 23 (1940). Oxford, 1953. Dislocaciones y otras imperfecciones Figura 11.13. 417 Dislocaciones tipo borde en una frontera de grano con un ángulo pequeño en un cristal de germanio, tal como las descubren un ataque químico. La amplificación es aproximadamente 600X ..[Fotografía del autor.] los dos valores obtenidos concuerdan invariablemente de un modo muy aceptable. 12 En la figura 11.13 se pueden observar también algunos pozos atacados con ácidos que se originaron por la presencia de dislocaciones aleatorias. En cristales de silicio se pueden observar directamente las líneas de dislocación mediante la difusión de cobre en la muestra, y luego observando microscópicamente el interior del cristal utilizando luz infrarroja de una longitud de onda que sobrepase apenas el borde de absorción. 13 Se emplea un bulbo convertido de imagen para hacer que el ojo pueda captar la imagen infrarroja. El cobre, que es opaco a la radiación infrarroja, se precipita a lo largo de las líneas de dislocación formando trazos oscuros que mar· can el curso de dichas líneas. La presencia de dislocaciones en cristales semiconductores también da origen a ciertos efectos eléctricos. Por ejemplo, en el caso del germanio, parece que las dislocaciones tipo borde introducen niveles receptores que se localizan a una gran profundidad, aproximadamente 0.2 eV de energía por debajo del borde de la banda de conducción. 14 • 15 Además algunas investigaciones independientes han demostrado que las dislocaciones tipo borde actúan como centros de recombinación en el germanio, y de hecho, el tiempo de vida de los portadores en exceso en germanio de alta pureza casi siempre tiene un límite marcado por la dislocación.16, 17 La situa- 12 F. L. Vogel y colaboradores, Phys Rev., 90. 489 (1953). 13 W. C. Dash, J. Appl. Phys., 27, 1193 (1956). 14 G. L. Pearson, W. T. Read y F. J. Morin, Phys. Rev., 93, 666 (1954). 15 W. T. Read, Phil. Mag., 45, 775 (1954). 16 J. P. McKelvey, Phys. Rev., 106, 910 (1957). 17 G. K. Wertheim y G. L. Pearson, Phys. Rev., 107, 694 (1957). 418 Tecnología de materiales y medición de propiedades volumétricas Figura 11.14. • • • • • •• • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • (a) ( b) Defecto (a) de Frenkel y (b) de Schottky en una red cristalina. c1on en el silicio y otros semiconductores no se ha investigado con la misma minuciosidad debido a las dificultades técnicas; pero se supone que el caso es similar. Otro ejemplo importante de una imperfección estructural es la vacante de red. Existen dos tipos básicos de vacantes de red denominados defectos de Frenkel y defectos de Schottky, como se ilustra en la figura 11.14. En la formación de un defecto de Frenke1, un átomo de la red cristalina se desplaza a una posición intersticial dejando una vacante de red tras él, en tanto que para formarse un defecto de Schottky, uno de los átomos de la región cercana a la superficie se pasa a un sitio de la superficie dejando tras sí una vacante móvil que luego puede difundirse hacia el interior del cristal. Existe una energía de activación asociada con la formación de cualquier defecto de esta índole y, dado que la energía térmica disponible para contrarrestar la barrera de activación es mayor a alta temperatura, la concentración de equilibrio de las vacantes aumenta con ésta. Se cree que los defectos de Schottky predominan en el germanio y en el silicio. Si el cristal se enfría repentinamente desde una temperatura alta, se puede "congelar" en el interior una concentración de vacantes por encima de la concentración de equilibrio a temperatura ~biente. El papel de las vacantes de red en la difusión de átomos de impurezas de substitución. desde la superficie hasta el interior de la red cristalina, tiene gran importancia. La presencia de vacantes de red permite que los átomos de la estructura reticular (al igual que los de impureza) emigren de un sitio de la red dentro del cristal a otro, y o o o o o o o o o o o o o o o o o o o o o o o • • o • • • • • • • • • • • • • • • • • • • • • • • • • • • • •(a)• • • ( b) o o o o o o o o o o o o o o o • o o o o o • o o • • o • • o • • • • • • • • • • • • • • • • • (e) o • • • • • • • • • • • ( d) o o o o o oooeoo • • • • • • • o • • • • • • • • • (e) Figura 11.15. Interdifusión en una interfaz entre dos substancias diferentes, originada por el movimiento de una vacante de red. Etapas sucesivas en el proceso de difusión. de (a) a (e). Dislocaciones y otras imperfecciones 419 con esto se efectúa el transporte por difusion de átomos de impureza superficiales hacia el interior. Este proceso se ilustra en la figura 11.15. La mayoría de las características importantes de la difusión de impurezas de substitución en cristales semiconductores, incluyendo la magnitud de los coeficientes de difusión y su dependencia en relación a la temperatura, concuerdan con el mecanismo de las vacantes. EJERCICIOS l. Derive las ecuaciones (11.1-2) a (1 1.1-5) a partir de las consideraciones fundamentales. 2. Se desea hacer crecer un monocristal de germanio tipo p con una resistividad de 2 a 5 ohms-cm mediante la técnica de Czochralski. Como material inicial se utilizarán 500 g de germanio intrínseco refinado por zonas. ¿Qué cantidad de aleación de impurificación compuesta de germanio que contiene 0.1 por ciento de galio atómico debe agregarse al fundente para que la resistividad a la temperatura ambiente de la parte del cristal que crece iniciahnente sea 5 ohms-cm? Se puede suponer que el coeficiente de segregación apropiado es el de equilibrio que se da en la tabla 11.1. ¿Cómo variará la resistividad del cristal así obtenida en función de su longitud? 3. Use la teoría electrostática y de corriente uniforme, suponiendo una muestra semünfinita homogénea e isotrópica, para derivar la ecuación (11.3-3) para el aparato de rt>sistividad de cuatro puntas. Demuestre explícitamente que la solución satisface todas las condiciones necesarias de frontera. Nota: Principie tomando en cuenta el campo electrostático creado por una carga positiva puntual y una carga negativa puntual en el espacio libre. 4. Una frontera lineal de Burgers en un cristal cúbico simple crea una línea de pozos atacados con ácido, con un espaciamiento de 2 X 10-4 cm, cuando el cristal se ataca químicamente. Suponiendo que la constante de red del cristal es 4 X 10-8 cm, encuentre el ángulo de desajuste entre las secciones del cristal en los lados opuestos de la frontera lineal. 5. Una punta metálica de prueba establece contacto con un cristal semiconductor semünfinito de una conductividad constante a. Se hace pasar una corriente constante conocida, / 0 , por la punta hacia el semiconductor. Suponiendo que la interfaz entre la punta de prueba y el semiconductor es una semiesfera de radio a que se extiende dentro del semiconductor, en donde el centro queda en el plano de la superficie del semiconductor y que no se inyecta un exceso de portadores a través de la punta, calcule la impedancia (resistencia de dispersión) del contacto. LECTURAS RECOMENDADAS W. Bardsley, "The Electrical Effects of Dislocations in Semiconductors," en Progress in Semiconductors, Vol. 4, Heywood and Co., Londres (1960), p. 155. A. H. Cottrell, Dislocations and Plastic Flow in Crystals, Oxford University Press, Nueva York (1953). l. G. Cressel y J. A. Powell, "The Production of High Quality Germanium Single Crystals," en Progress in Semiconductors, Vol. 2, Heywood and Co., Londres (1957), p. 137. P. Haasen y A. Seeger, "Plastische Verformung von Halbleitern und ihr Einfluss auf die Elektrische Eigenschaften," en Halbleiterprobleme, Vol. 4, Friedrich Vieweg and Sohn, Braunschweig (1958), p. 68. N. B. Hannay, "Semiconductor Chemistry," en Proceedings of the lnternational School of Physics, "Enrico Fermi" Course 22 (Semiconductors, Academic Press, Inc., Nueva York (1963), p. 341. w. G. Pfann, "Techniques of Zone Melting and Crystal Growing," en Salid State Physics, Advances in Research and Applications, Vol. 4, Academic Press, lnc., Nueva York (1957), p. 423. W. G. Pfann, Zone Melting, John Wiley & Sons, Nueva York (1958). W. T. Read, Dislocations in Crystals, McGraw-Hill Book Co., Inc., Nueva York (1953). W. Schockley, J. Holloman, R. Maurer y F. Seitz (editores), lmperfections in Nearly Perfect Crystals, John Wiley & Sons, Nueva York (1952). R. K. Willardson y H. L. Goering (editores), Compound Semiconductors, Vol. 1, Reinhold Publishing Corporation, Nueva York (1962). Teoría de las uniones p-n de los semiconductores 12.1 LA UNION p-n En capítulos anteriores se trató exclusivamente de los semiconductores que se suponían uniformes u homogéneos en cuanto a la densidad de átomos de impureza contenidos en su interior. Ahora se centrará la atención en el estudio de substancias dentro de las cuales la densidad de impureza puede variar de un punto a otro y, en particular, en muestras que contienen una región extrínseca tipo n y una región extrfuseca tipo p separadas por una zona de transición relativamente angosta. Esta región angosta de transición se denomina unión p-n y con ella se asocian propiedades físicas sorprendentes que, aunque tienen interés específico desde un punto de vista puramente fundamental, poseen una importancia primordial, ya que constituyen la base de operación de la mayoría de los dispositivos electrónicos semiconductores. A continuación se estudiará un cristal semiconductor que contiene una unión p-n. La transii:ión entre las regiones tipo p y n puede ser abrupta, en cuyo caso se encuentra unl!. región que contiene una concentración neta más o menos constante de impurezas donadoras junto a otra que posee una concentración neta más o menos constante de receptoras. Por otro lado, la unión puede ser graduada, en cuyo caso, N d y Na son funciones de la distancia a la unión en dirección de la normal, donde Nd decrece gradualmente empezando con un valor grande y Na aumenta en la misma forma a partir de un valor pequeño, conforme se acerca a la unión desde el lado tipo n; las dos cantidades se igualan en la unión y Na sobrepasa a Nd en el extremo de la unión dentro de la región p. Estos dos casos se ilustrat'l en la figura 12.1. En este estudio, el mayor énfasis se dará a las uniones abruptas, ya que son mucho más sencillas de analizar matemáticamente, puesto que ilustran la mayoría de las características importantes relacionadas con el comportamiento de las uniones p-n en general y, ya que, para la mayoría de dispositivos más importantes, la representación aproximada de la unión abrupta es aceptable. No obstante, debe hacerse notar que en muchos casos la uniones p-n de las estructuras de dispositivos semiconductores (sobre todo las que se producen una conductividad tipo n o p en un substrato de conductividad opuesta) son uniones graduadas. Se intentará señalar cualitativamente por lo menos, las diferencias existentes entre las conducta física de las uniones abruptas y graduadas, siempre que se presente la ocasión. 421 422 Teoría de las uniones p-n de los semiconductores ----------~~------------ --x tipo-n Figura 12.1. tip01J tipo-p ti po-n Unión Unión (a) (b) Concentraciones de átomos de impureza en la cercanía de (a) una unión p-n abrupta y (b) una unión p-n graduaL Supóngase que de alguna manera se forma instantáneamente una unión abrupta p-n juntando una muestra uniforme tipo p con otra tipo n 1 para formar un solo cristal. En el instante de formación existe una concentración uniforme nno de electrones libres móviles y Pn 0 de huecos libres móvibles en el lado n, extendiéndose hasta la unión, y en el lado p, una concentración uniforme Ppo de huecos móviles y npo de electrones libres que se extiende también hasta la unión. Estas concentraciones están relacionadas con las densidades netas de donadores y receptores Nd y Na por medio de {9.5-23) y {9.5-24), en tanto que en ambos lados las densidades de electrones y huecos satisfacen la relación (12.1-1) Puesto que la concentración nn 0 de electrones del lado n es mucho mayor que la concentración de electrones npo del lado p, en el instante de formación existe un gradiente enorme en la concentración de electrones en la unión entre ambas regiones. La misma situación existe con respecto a la concentración de huecos en la misma unión. Los grandes gradientes iniciales de concentración establecen corrientes de difusión que hacen que los electrones de la región n y los huecos de la región p fluyan descendiendo por los gradientes de concentración respectivos hasta la región de conductividad de tipo opuesto y dejando a la región cercana a la unión, vacía de portadores mayoritarios. No obstante, este flujo de difusión inicial no puede continuar indefinidamente, debido a que en las regiones cercanas a la unión hay deficiencia de portadores mayoritarios, las cargas de los iones fijos donadores y receptores cercanos a la unión ya no están balanceadas por las cargas de los portadores libres móviles que estaban allí inicialmente, de modo que se establece un campo eléctrico. La dirección de este campo eléctrico es tal que se opone al flujo de los electrones que salen de la región n y al flujo de los huecos que salen de la región p, y la magnitud de campo se desarrolla hasta el punto en que su efecto contrarresta exactamente la tendencia de los portadores mayoritarios a difundirse. descendiendo por la "pendiente" de concentración hacia la región de conductividad 1 La formación de una unión de esta manera es sólo un experimento imaginario y no puede efectuarse en la práctica. La estructura de la unión p-n debe existir como un monocristal casi perfecto y sólo se puede obtener impurificando debidamente el fundente "contraimpurif¡. cándolo" (o agregándole impurezas de otro tipo), conforme va creciendo el cristal o bien. utilizando alguna difusión especial o proceso de aleación con que se logre prácticamente el mismo resultado. La unión p-n tipo-p Unión tipo-n 1 +e e +e+ e 1 e e e +e +e e+ 1 e ~ + + e 1 Carga + 'é +e e+ e 1-espac!al e+ l negativa e + + e e EB EB 1 1 EB 1 EB EBI IEB Carga __j espacial positiva 1 EB e e + IEB 1 + e+e++e e le ee e+ e +¡e e e + + e e ¡e + + e e+ + e e ee + ee 1 e + ¡e ++ee+e e + 1 e <i> Iones fijos de impurezas donadoras e Iones fijos de impurezas receptoras Figura 12.2. EB EB ee 1 e + + + ¡e e EB EB 1 e e e e ~1 e 1 EB ' EB Cam~o ehfctrico e+e+e; e le EBI e+ e+ + 1 e e+ e + e EB EB 1 + + + e +e 1 e e +e + 423 1 - EB EB ¡-EB 1 1 EB JEB- EB J - Electrones libres + Huecos libres Diagrama que ilustra la formación de las capas de carga espacial y el campo eléctrico interno mediante la difusión de portadores mayoritarios cerca de una unión hacia la región con un tipo de conductividad opuesta. opuesta. Entones se establece una condición de equilibrio dinámico en la que la región cercana a la unión queda vacía de portadores mayoritarios y en la que forman fuertes capas de carga espacial que contienen campos eléctricos altos cerca de la unión. Esta situación se ilustra en la figura 12.2 y, de acuerdo con ella, es evidente que la configuración de carga espacial es una caplt dipolar eléctrica con iones donadores no compensados en el lado n y iones receptores no compensados en el lado p, proporcionando los componentes de carga positiva y negativa respectivamente. Uno de los resultados más conocidos de la electrostática es que se produce una diferencia de potencial entre los dos límites extremos de una capa dipolar eléctrica, que se relaciona con la intensidad (momento dipolar por unidad de área) de la capa mediante (12.1-2) en donde r/> 1 y r/> 2 son los potenciales de borde y .d es la intensidad de la capa dipolar. Por supuesto, más allá de las regiones de la carga espacial no existe una densidad de carga y, por tanto, el potencial electrostático es constante. De acuerdo con (12.1-2), la energía potencial de un electrón "en reposo" situado en la base de la banda de conducción es 41Te .d menor en un lado de la unión que en el otro. Se puede formular el mismo enunciado para un hueco "en reposo" que esté en la parte superior de la banda de valencia. Sin embargo, puesto que el estado del sistema es de equilibrio térmico, la energía de Fermi e¡ debe ser la misma en todo el sistema. Estas consideraciones permiten describir las bandas de energía abrupta tal como se 424 Teoría de las uniones p-n de los semiconductores fEnergfa potencial de electrones ;;;__+___ ••p _ _ _ _ _ _ _ _ 1 1 ----------------t-.. •, 1 - 1 1 1 1- ', ... -- -- - ~ ----- t:n •,-x 1 ++ +++++++ +++ + + 0._--~------,------+ ++ + + + + +1 + + -e </>(X) + + + 1 ---------:---+ + : 1 + + + + ••• --r--sc- +sc+- •rp +++ ~-+-1 tip01) (Densidad de receptores N0 ) Figpra 12.3. Unión ti po-n (Densidad de donadores Nd) Diagrama de la energía potencial en el que se muestra la configuración de bandas de energía cerca de la unión p-n en ausencia de un voltaje aplicado. ilustra en la figura 12.3. Evidentemente, existe un "potencial de contacto interno·· e(cp 2 - cp 1 ) = ecp0 desarrollado entre las dos regiones. En esta misma figura se pueden ver claramente las tendencias de oposición de los gradientes de concentración y los campos eléctricos; los electrones <k: la banda de conducción del lado n se difundirían obvia· mente descendiendo por el gradiente de concentración lado p, si no fuera por la "pendiente" del potencial eléctrico que deben vencer para lograrlo. 12.2 EL POTENCIAL DE CONTACTO INTERNO DE EQUILIBRIO El valor del potencial de contacto interno cf>o se determina fácilmente a partir de los valores de la densidad de electrones (o huecos) en equilibrio a ambos lados de la unión, lejos de las regiones de carga espacial. De acuerdo con (9.3-6), se puede escribir (12.2-1) para la densidad de electrones en el lado n y, para la densidad del lado p, (12.2-2) De ~stas ecuaciones se pueden despejar €en y ecp y la diferencia de energía potencial interna ecp 0 , que, como se puede ver claramente en la figura 12.3 no es más que la diferencia entre las dos, por lo cual está dada por n.o el/> 0 = ecp - ec• = kT ln-. npo (12.2-3) Esto se puede escribir de un modo diferente utilizando (12.1-1) para expresar npo en función de Ppo, como ,~, _ kT 1 n.oPpo 'I'O- e n 2 11¡ · (21.2-4) El potencial de contacto interno de equilibrio 425 Si todos los donadores y receptores de las regiones n y p están ionizados, como lo estarán a todas las temperaturas, excepto las muy bajas, y si las dos regiones p y n son fuertemente extrínsecas, entonces, de acuerdo con (9.5-25) y (9.5-26) nno ~Na y Ppo ~Na, por lo cual, (12.2-24) se convierte en ( 12.2-5) La aplicabilidad de estas fórmulas está evidentemente limitada a situaciones en que las estadísticas de Boltzmann se pueden utilizar para describir la distribución de equilibrio de los portadores, tanto en la región p, como en la n. A continuación se examinará lo que sucede cuando se aplica un voltaje externo a la muestra que contiene una unión p-n. Es obvio que, puesto que las regiones de carga espacial a ambos lados de la unión tienen una deficiencia de portadores, estas regiones poseen una resistividad mucho mayor que cualquier otra parte del cristal. Esto significa que cuando se aplica una fuente de voltaje externo a la muestra en que se tiene una región p-n, como sucede en la figura 12.4, casi toda la caída de voltaje se producirá en estas regiones. Prácticamente en todas las condiciones, excepto aquellas en las que se aplica un voltaje grande con la "polaridad en directo" que se indica en la figura 12.4(a), las caídas de voltaje en las regiones uniformes n y p que quedan fuera de las capas de cargas espacial cerca de la unión, son despreciables en comparación con la caída que se registra en la región de la unión misma. Si la unión p-n se usa como rectificador, se obtiene una condición de baja impedancia cuando la región n se conecta a la terminal negativa y la región p a la positiva de la fuente externa de voltaje, como se señala en la figura 12.4(a). Esta polaridad se conoce como estado de polarización directa. Se acostumbra considerar que el signo del potencial externamente aplicado en este caso es positivo. En la figura 12.3 se ve claramente, que cuando se aplica el voltaje externo en esta forma, el efecto es reducir la altura de la barrera de potencia. como se muestra en la figura 12.4(a). Si la caída de voltaje en las regiones volumétricas n y p que quedan fuera de la capa de carga espacial es despreciable en comparación con la que se produce en la unión, la altura de la barrera intensa será e(!/Jo - V0 ) en donde V0 es el voltaje externo. Si se invierte la polaridad de la fuente de potencial externo (en cuyo casos su signo se oonside· rará negativo), se observa claramente en la figura 12.3, que la altura de la barrera de po- ~ y~ V0 (Positivo) e (1(>0 -1{¡) - -~, ----!---- ~ V0 (Negativo) . eof>o -~ ----1--- "'-. Con el potencial '------ aplicado '' ' ... _ L --"'10. ............_____ 'Aplicando potencial ____¡~ ___ )~""----- Aplica~d1o f ~ eof> t- potenc1a Sin aplicar potencial (O) Figura 12.4. (b) Diagrama de la energía potencial que presenta el efecto de (a) un voltaje de polarización directa y (b) de polarización inversa en la configuración de bandas de energía en una unión p-n. 426 Teoría de las uniones p-n de los semiconductores tencial interno se ha incrementado como se ilustra en la figura 12.4(b ). Si la caída entre las regiones n y p que quedan fuera de la unión se desecha en comparación con la caída en las regiones de carga espacial de la unión, también es obvio que la altura de la barrera se puede representar como e(tf>o - ~0 ) en donde Voz es ahora una cantidad negativa. En estas circunstancias, como se verá detalladamente más adelante, la estructura presenta una independencia muy alta y se dice que el voltaje aplicado es una polarizadór: inversa. 12.3 POTENCIALES Y CAMPOS EN LAS CERCANIAS DE UNA UNION p-n Ahora se verá el modelo general de una unión p-n como la que se ilustra en la figura 12.5. Como se ha representado en esta figura, existe un voltaje aplicado V 0 (negativo en el dibujo) al igual que un potencial interno t/> 0 . En estas circunstancias. se tendrán flujos de corrientes eléctricas y el estado del sistema ya no será de equilibrio térmico. Por esta razón, no se puede definir ya un nivel único de Fenm para todo el cristal. Sin embargo, se supondrá que lejos de la unión prevalecen las condiciones de equilibrio y que las densidades de huecos y electrones en esos puntos se pueden describir mediante las distribuciones de Fermi relacionándolas con los dos niveles de Fermi E¡no y E¡po· Por supuesto, si no se aplica un voltaje, el sistema estará en equilibrio y E¡no y E¡po serán equivalentes; pero como están las cosas, es obvio, de acllerdo con la figura, que deben diferir en eV0 • Cuando se aplica un voltaje a la unión, resulta que, como se demostrará sin lugar a dudas más adelante. la concentración de portadores minoritarios en las regiones n y p contiguas a las capas de carga espacial se ven seriamente perturbadas en sus valores de equilibrio, en tanto que la concentración de portadores mayoritarios se ven muy afectados en lo -e4>(x) <cp-----------~ Densidad de donadores Nd (xl T .,P(x) 'fpo -......._:---------"""T"--t---;-+T---f'"'-f~p ' ', -l, -+-~-+-~-.l-- ---x ..... , ' ', v:_o_:-:lla=-----~'cl-~=---t--------'--'-'..::.-:::. ' ' [ .... - ---e. . . • ,. (x) 1 Densidad de receptores N.lxl tipo-p Figura 12.5. "-+--------- ... 1 ¡---se ' x=-x 0 _ +se-¡ un¡ón x=O tipo-n Diagrama que ilustra los detalles de los potenciales en las bandas de energía y los niveles casi Fermi de una unión p-n en presencia de un voltaje aplicado. Potenciales y campos en las cercanías de una unión p-n 427 que respecta a sus concentraciones de equilibrio. La razón se puede entender al estudiar la figura 12.5, en donde se muestra una unión con polarización inversa. La barrera alta de potencial evita que los electrones del lado n y los huecos del lado p se "derramen sobre" la unión hacia el lado opuesto; por otro lado, la presencia de la barrera favorece a los portadores minoritarios (huecos en el lado n y electrones en el lado p) para que se deslicen bajando por la pendiente de potencial hacia el lado opuesto de la unión, en donde se convierten en portadores mayoritarios. Esto reduce notablemente la concentración de portadores minoritarios cerca de la unión. Cuando se aplica una polarización directa, la altura de la barrera se reduce y los electrones de la región n, y los huecos de la región p se derraman sobre la unión convirtiéndose en portadores minoritarios en el lado opuesto. Sin embargo, también en este caso la concentración relativa de los portadores minoritarios se ve mucho más afectada que la concentración de portadores mayoritarios. 2 El resultado es que, cerca de la región de la unión, mientras que las poblaciones de electrones y huecos se caracterizan independientemente por distribuciones de Fermi, existen dos diferentes "niveles efectivos de Fermi" o "niveles quasi Fermi", uno para la población de electrones y otro para la de huecos. Estos niveles casi de Fermi se representan como e¡n para los electrones y e¡p (para los huecos) en la figura 12.5. Lejos de la unión, en la región n, la concentración de equilibrio de los huecos recibe poca influencia por el efecto de los huecos cercanos a la unión y que se deslizan por la "pendiente" de potencial hasta la región p y, por tanto, los niveles efectivos de Fermi para electrones y huecos son casi iguales. Sin embargo, conforme se acerca a la unión, la concentración local de los huecos desciende por debajo del valor de equilibrio como resultado de este efecto, en tanto que la concentración de electrones raramente se ve afectada. Entonces, como se indica en la figura 12.5 el nivel efectivo de Fermi de los electrones permanece igual en tanto que el nivel efectivo de Fermi para los huecos se eleva a partir de equilibrio, correspondiente a una concentración más pequeña de huecos en la región n cerca de la ur.ión. Se produce un efecto similar invirtiendo los papeles de los niveles casi de Fermi de electrones y huecos en la región p, al otro lado de la unión. El comportamiento de los niveles casi de Fermi de huecos y electrones debe ser algo semejante a lo que se indica en la figura. En conexión con los cálculos acostumbrados casi siempre se supone que el nivel casi Fermi de los portadores minoritarios ha llegado al valor de equilibrio asociado con la misma especie de portadores que son los mayoritarios en la región volumétrica al otro lado de la unión. Entonces, en la figura 12.5, el valor de e¡p en A casi siempre se supone igual al valor de equilibrio en el extremo izquierdo, y el valor de e¡n en B se supone idéntico al de la extrema derecha. Esto significa sencillamente que los portadores de la misma especie en las orillas opuestas de la región de carga espacial de la unión poseen la misma distribución de energía, en virtud de la eficiencia de los procesos de colisión que se producen en dicha región. Esta suposición lleva a una condición de frontera en las concentraciones de portadores de la unión que serán de gran utilidad en el siguiente capítulo. Puesto que, por ejemplo, para los electrones, la distancia entre la banda de conducción y el nivel efectivo de Fermi para electrones en el lado n es en e(cp 0 - V0 ), menor que la distancia correspondiente en el lado p como se ilustra en la figura 12.5, entonces, la 2 El requisito de neutralidad eléctrica en el material lejos de la unión, origina también una alteración en la densidad de los portadores mayoritarios. Sin embargo, puesto que la densidad de portadores mayoritarios en equilibrio es mucho mayor que la densidad de portadores minoritarios en equilibrio, la adición de un número dado de electrones y huecos puede dar como resultado un incremento en la densidad de portadores minoritarios de muchos órdenes, al tiempo que aumenta la densidad de portadores mayoritarios en sólo un pequeño porcentaje. 428 Teoría de las uniones p-n de los semiconductores razón entre la concentración de electrones en el borde de la región de carga espacial en el lado n, y la que prevalece en el borde de la región de carga espacial en el lado p, debe estar dada por - _n.:.:."(.:. _X_:o.:. _+_:_)_ _ np( -x 0 _) -e e(</>o- Vo)/kT (12.3-1) ' en donde las coordenadas x 0 + y - x 0 _ se refieren a la ubicación de los bordes de la región de carga espacial en los lados n y p de la unión, respectivamente. Siguiendo un razonamiento similar, las concentraciones de huecos a ambos lados debe estar relacionada por Pi -Xo_) = e•<<l>o-Vo)/kT (12.3-2) P.(xo +) Al escribir estas ecuaciones, se supone que la aproximación de Boltzmann es válida. El potencial y el campo eléctrico en las regiones de carga espacial se puede encontrar a partir de la ecuación de Poisson. En el caso en donde la densidad de carga varía sólo en la dirección x, la ecuación de Poisson se puede escribir como d 2 </J - dx 2 4np(x) 4ne K K = - - - = - - (p- 11 + Nlx)- N.(x)). (12.3-3) Para mayor facilidad, se escogerá el origen que se indica en la figura 12.5 tal que en ese punto el potencial sea cero. 3 Además, la función de potencial ¡j>(x), que contiene una constante arbitraria adicional, se definirá en relación con los bordes de la banda de conducción y valencia de tal modo que tenga la posición del nivel intrínseco de Fermi con respecro a ellos. En estas circunstancias se puede escribir (1 2.3-4) y (12.3-5} De igual manera, ec(x) y ev(x) se relacionan con if>(x) por medio de (1 2.3-6) y (12.3-7) Al substituir estos valores en la ecuación de Poisson (1 2.3-3), se obtiene 2 </J d_ 4ne = _ _ (U e-<•t.-<v;+e<t><xl)!kT _U e-<-e<t>(x)+<,,-, .,¡¡kr dx2 1 K v + Nix)- N.(x)). e ( 12.3-8) 3 Por ahora se supone que las densidades de donadores y receptores son funciones de la distancia aunque la figura 12.5 se ha dibujado, para mayor simplicidad, como si fueran constantes. Modelo matemático simplificado de la unión p-n abrupta 429 En casi todas las circunstancias, la solución de esta ecuación constituye un problema complejo y difícil. Este estudio se limitará a examinar varios casos particulares que pueden comprenderse en términos relativamente sencillos. Por ejemplo, sea un sistema en el que el voltaje aplicado es cero. En este caso, e¡n = e¡p = e¡, y (haciendo referencia a la figura 12.5) es evidente que, (12.3-9) de donde, (12.3-8) se puede expresar como d 2</J = 4nen¡ (ee<P<-<l!H _ e-etP<x)fkT _ Nd(x) + Na{x)) dx 2 " 11¡ n¡ 4nen¡ ( e</J(x) Nk'C)- Na("<)) = - - 2senh - - . " /..T ( 12.3-10) 11¡ Esta es la ecuación diferencial fundamental que debe resolverse para obtener el potencial tj>(x ). Para una unión abrupta se tiene que N.(x) = N.= const} Nd(x) =O (x <0) (12.3-11) N.(x) =O } Nix) = Nd = const (x >O) (12.3-12) y en cuyo caso, (12.3-1 O) da dos ecuaciones, una para el potencial cp_ (x) en la región (x < 0), de la forma . h erp- N •) -dx2 - =4nen¡ -K - ( 2 Sll1 --+kT n¡ d 2 </J _ (x < O) (12.3-13) y otra para el potencial tP+(x) en la región (x > 0), que se puede escribir como sigue d) . (x > O) dz</J + = 4nen¡ (2 senh e</J + - N dx 2 K kT n¡ (12.3-14) Estas ecuaciones se deben resolver para tP+(x) y tf>_(x) utilizando condiciones de frontera apropiadas, que se verán en la siguiente sección. Desafortunadamente, estas ecuaciones tampoco se pueden resolver con precisión por medios analíticos, de manera que se deben introducir métodos numéricos o métodos físicos aproximados. A continuación se analizará un modelo simplificado que se basa en las ecuaciones precedentes y que admite una solución matemática exacta incluso cuando se tiene un voltaje externo y que representa muy aproximadamente a la unión p-n abrupta en casi todas las circunstancias de importada práctica. 12.4 MODELO MATEMATICO SIMPLIFICADO DE LA UNION p-n ABRUPTA En ciertas condiciones, se puede obtener una solución aproximada para una unión p-n abrupta. Obsérvese que de acuerdo con (12.3-4) y (12.3-6), la concentra- 430 Teoría de las uniones p-n de los semiconductores p(x) eNd 1------r:-,..., \ \ ~------~-~x~o~------1--------~~'------~--.x ''\ Xo+ 1 1 1 \ 1 1 ' -eN0 1 j---sc -1----+sc tipo-p Unión Densidad de receptores N.= const. Figura 12.6. -.j tipo-n Densidad de donadores Nd =const. Densidad real de carga (curva punteada) y la densidad de carga supuesta en el modelo aproximado de la sección 12.4 (curva continua) correspondientes a una unión abrupta p-n para la que <Po ~kT/e. cton de portadores varía exponencialmente en función de rp, de modo que la densidad de portadores disminuirá a un valor despreciable en comparación con el nivel volumétrico existente lejos de la unión, conforme la energía potencial del borde de la banda -erp varía por unos cuantos múltiplos de kT. Si la caída total de potencial en la unión, rp 0 - V0 , es mucho mayor que kT, habrá una variación de la energía potencial de varias veces kT que se logrará en una distancia relativamente pequeña en comparación con la extensión lineal total de la región de carga espacial de la unión. En estas circunstancias, la densidad de carga llega rápidamente a un valor constante -eNa conforme se penetra a la región de carga espacial desde la región p. y un valor constante eNd conforme se penetra a la región de carga espacial desde el lado n, como lo indican las curvas punteadas de la figura 12.6. En esta situación, un método bastante aproximado consiste en representar la densidad de carga espacial mediante un valor positivo constante eNd, tratándose de la parte del lado n que se encuentra entre la unión y el borde de la capa espacial en este lado -y no más allá-, y representarla mediante un valor negativo constante -eNa en el lado p de la unión hasta el borde de la región de carga espacial, y no más allá de este punto. De acuerdo con esta aproximación, la densidad de carga se representa mediante la línea continua de la figura 12.6. Por fortuna, la mayoría de las uniones abruptas p-n que tienen un interés práctico satisfacen la condición e(cfJo - Vo)~ kT en la que esta representación aproximada de la situación real es aceptable. Si el potencial electrostático se denota por rp+(x) para x >O, y por rp_(x) para el potencial en la región x <O, y si se asignan los valores x 0 + y -x 0 _ a las coordenadas de los bordes de las regiones de carga espacial en los lados n y p respectivamente, la ecuación de Poisson toma la forma (O<x<xo+), (12.4-1) (-x 0 _<x<0) (12.4-2) Modelo matemático simplificado de la unión p-n abrupta 431 y (x > x 0 + ; x < -x 0 _). (12.4-3) Si se supone que todo el voltaje aplicado a la muestra aparece como una caída potencial en la región de la unión, entonces, en las regiones que quedan más allá de las fronteras de las capas de carga espacial el potencial debe ser constante, por lo cual, cp+(x) = <f>+(x 0 +) = const (12.4-4) <f>_(x) = <f>_( -x 0 _) = const (12.4-5) Evidentemeate, estas soluciones satisfacen (12.4-3). Puesto que la caída total de potencial en la región de la unión es rp 0 - V 0 , se debe tener también que (12.4-6) Además, se puede demostrar fácilmente, de acuerdo con el teorema de flujo eléctrico de Gauss, que el campo eléctrico debe ser continuo en todas partes excepto en una superficie que tiene una verdadera distribución de carga superficial. Se recomienda al lector que efectúe la comprobación de este postulado como ejercicio. Esto significa que en la unión, -E+(O) = ( -d<f>+) = (d<f>_) = -E_(O) = -E0 dx 0 dx 0 (12.4-7) en donde E+(x) y E_(x) representan los campos en las regiones (x >O) y (x <O) y E 0 es el valor común en el origen. Las ecuaciones (1 2.4- 1) y (1 2.4-2) se pueden integrar para obtener y d<f>_ 4neNa - = - - x + B = -E_(x) dx K (O<x<x 0 +) (12.4-8) (-x 0 _<x<O) (12.4-9) en donde A y B son constantes arbitrarias. De acuerdo con (12.4-4) y (12.4-5), más allá de los límites Xo+ y x 0 _ de la región de carga espacial, el campo es cero y, puesto que el campo debe ser continuo en todas partes, (1 2.4-8) debe dar drp+fdx = O en Xo+ y (12.4-9) debe dar drp_jdx =O en x = -x 0 _, por lo cual, 4neNd A = - - x0 + y 4neNa B=--Xo- K (12.4-10) K Y (1 2.4-8) y (1 2.4-9) se convierten en d<f>_ dx 4neNa - - = - - (x 0 +- x) = -E+(x) K (0<x<x 0 +) (12.4-1 J) 432 Teoría de las uniones p-n de los semiconductores y d4J_ - dx 4rreNa = - - (.x + x 0 _) = -E_(x) (-x 0 _<x<0) (12.4-12) K mientxas que, por supuesto, (x > x 0 +; x < -x 0 _). (12.4-13) Si en (12.4-11) y (12.4-12), x se iguala a cero, entonces, haciendo referencia a (12.4-7), es evidente que 4neN.x 0 _ (12.4-14) K y, por tanto, que (12.4-15) De acuerdo (12.4-15), la razón de las anchuras de las dos capas de carga espacial es la inversa de la razón de las densidades de impureza respectivas. Esto implica que el número total de cargas positivas y negativas en cada capa es la misma. Al integrar una vez más (12.4-11) y (12.4-12), el potencial se obtiene como (O<x<xo+) (12.4-16) (-x 0 _<x<O) (12.4-17) y 2neN. 2 4J_(x) = - - (x + x 0 _) +D. K El punto cero del potencial se puede escoger arbitrariamente; para mayor facilidad se seleccionará de tal modo que cf>+(O) = cf>_(O) =O. Si se substituye esto una vez en (12.4-16) y (12.4-17), se pueden evaluar tanto C, como D. Combinando estos resultados con (12.4-4) y (12.4-5) se ve claramente que el potencial debe tener la forma (0 <X< Xo+) ( 12.4-18) 2neN. 4J_(x) = - - [(x + x 0 _) 2 - x~_J K (-x 0 _<x<O) (12.4-19) = 'l'_.. (- Xo- ) = _ 2rreN.x~- . K (x < -x 0 _) Modelo 111/ltemiÍtico simplificaclo de 14 unión p-n abrupta 433 Ahora, las expresiones para el campo y el potencial han quedado completas, excepto que las distancias Xo+ y x 0 _ no se han especificado todavía. Para obtener los valores de estas cantidades, los valores de cf>+(x 0 +) y cf>_(-x 0 _) dados por (12.4-18) y (12.4-19) se pueden substituir en la condición de frontera (12.4-6), de donde, (12.4-20) En esta ecuación, x 0 _ puede expresarse en función de x 0 + mediante (12.4-15), y la expresión resultante se puede resolver para x 0 +, lo cual da K((j> 0 - Vo) Xo+ = 2ne Na Ni N d + N a) (12.4-21) De acuerdo con (12.4-15), x 0 _ se puede obtener en la forma (12.4-22) Entonces, la anchura total combinada de las regiones de carga espacial es Xo = Xo+ + Xo- = J K( 4>o - V0) ( 2ne 1 1) Nd + Na (12.4-23) y el campo E 0 en la unión, de acuerdo con (12.4-14), se puede expresar como sigue Eo = J8ne(4>o - V0 ) K (..!.. + ..!..) Nd Na 1 = 2(4> 0 - V0 ) Xo (12.4-24) Se debe hacer notar que x 0 +, x 0 _ y E 0 , están relacionadas con las densidades de impurificación Nd y Na de un modo directo, como se demostró antes, y también a través de cf>o, que es una función de Nd y Na tal y como lo expresa (12.2-5), aunque la variación logarítmica de cf>o en función de Nd y Na es mucho más lenta que la variación directa. En la figura 12.7 se presentan las gráficas de la densidad de carga espacial, el campo eléctrico y las variaciones del potencial electrostático tal y como los presenta la teoría anterior, para una polarización cero, una polarización directa (V0 >O) y una polarización inversa (V0 < 0). De acuerdo con esta figura o con las ecuaciones anteriores, es obvio que (a) La capa de carga espacial tiene mayor extensión en regiones tipo p o n levemente impurificadas, que en regiones con impurificación mayor. Para una unión dada, la capa de carga espacial se extiende más dentro de la región en la que la impurificación es menos fuerte. (b) El valor máximo de campo E 0 es muy alto en las uniones en donde las regiones p y n están fuertemente impurificadas, y mucho más pequeño en las uniones en donde una o ambas regiones están levemente impurificadas. (e) En condiciones de polarización inversa, las regiones de carga esp1cial se extienden hacia afuera dentro del cristal; la extensión cf;- las !..egion~~..!!,e _ 434 Teoría de las uniones p-n de los semiconductores P(x) E(x) V¡¡=O t eNd 1----rL,------, V.> O o 1 _j l V.o< O -!11 1 ! -x / \ ! ! L--- -L-t-~-==l- eNo \ 1 / \ \ 1 / / \Ea \ - V¡¡<O / \ Ea ( b) 4> ( x) ' \ / \.-/ \ 1 (a) / -x / / / / Eo V¡¡< O ------ ...... ... '' '' --"------v;>_o______\ , \ \ \~ \ \ \ . ------- \ \ \ \ \ \ (e) Figura 12.7. ' ' ... ' ... ... Representación esquemática de (a) densidad de carga, (b) el campo eléctrico y (e) el potencial en las cercanías de una unión abrupta p-n en presencia de varios voltajes aplicados, según se calcularon de acuerdo con los métodos de la sección 12.4. carga espacial puede hacerse muy grande en uniones en donde la región n o la p esté ligeramente impurificada. Para - V 0 ~ 1/Jo (una gran polarización inversa), la extensión de las regiones de carga espacial es proporcional a (-V0 ) 1 12 , de acuerdo con (12.4-21) y (12.4-22). (d) En condiciones de polarización inversa, el campo máximo E 0 se hace muy grande; a una gran polarización inversa, es proporcional a (- V0 ) 1 12 • Estas conclusiones, aunque se han verificado para un modelo específico de unión abrupta, son bastante gen~rales y aceptables para todas las uniones p-n de semiconductores, ya sean abruptas o graduales (aunque para uniones graduales, la dependencia de raíz cuadrada que se menciona en (e) y (d) ya no es cuantitativamente correcta). Las relaciones derivadas en las páginas anteriores son bastante exactas para las condiciones de polarización inversa; pero no debe esperarse que se apliquen perfectamente a polarizaciones directas elevadas. En este último caso, se tiene grandes flujos de corrientes y existen caídas de voltaje apreciables en las regiones volumétricas fuera de las capas de carga espacial de la unión, que hacen que la caída de voltaje Capacitancia de unión; determinación del potencial interno 435 4> (x) Figura 12.8. Representación aproximada del potencial cerca de una unión abrupta p-n en condiciones de intensa polarización directa. de dicha umon sea diferente del voltaje externamente aplicado. Entonces, el potencial adquiere una forma semejante a la que se ilustra en la figura 12.8. En la tabla 12.1 se dan algunos valores numéricos para las propiedades de las capas de carga espacial asociados con uniones p-n típicas del germanio. 12.5 CAPACITANCIA DE UNION; DETERMINACION DEL POTENCIAL INTERNO Los resultados de la sección anterior sugieren claramente que una unión p-n se comporta en muchas formas de un modo semejante a un capacitar de placas paralelas. Se tienen dos capas de carga espacial que contienen cantidades iguales y opuestas de carga, y la cantidad de carga perteneciente a las capas aumenta conforme se incrementa el voltaje inverso. La carga asociada con un área unitaria de la región de carga espacial positiva en el lado n de la unión, es claramente el producto de la densidad de carga eNd y el volumen x 0 + de la región de carga espacial correspondiente a una unidad de área de la unión. La carga por unidad de área de capa de carga espacial negativa en el lado p, se puede calcular en la misma forma. En ambos casos, se ve claramente con la ayuda de (12.4-21) o (12.4-22), que la carga por unidad de área de unión es (12.5-1) Un pequeño incremento del voltaje aplicado LlV0 se verá acompañado por un cambio LlQ en la carga almacenada. Si la capacitancia diferencial por unidad de área asociada con la unión a este valor de voltaje aplicado se define como klQ/dV0 1, entonces, de acuerdo con la ecuación anterior, es obvio que (12.5-2) 436 Teoría de las uniones p-n de los semiconductores De acuerdo con esto, se puede llegar a la conclusión de que las uniones en las que tanto la región p como, la región n están fuertemente impurificadas, tendrán una capacitancia muy alta, en tanto que si la región n o la p o bien, ambas, están levemente impurificadas, la capacitancia será mucho menor. Para voltajes de polarización inversa que sobrepasan notablemente el potencial de contacto interno <Po, se encontrará, de acuerdo con (12.5-2), que e varía casi proporcionalmente a (- V0 ) 1 12 • En efecto, esta variación de capacitancia es característica de las uniones abruptas que se encuentran en dispositivos fabricados por medio de procesos de aleación. Las uniones graduales o no abruptas tales como las que se encuentran en muchos dispositivos elaborados mediante la difusión de impurezas tipo n en un cristal tipo p, o viceversa, presentan una capacitancia que varía con el voltaje inverso de un modo más lento que aquélla. Por ejemplo la capacitancia de una unión linealmente gradual con polarización inversa, varía con el voltaje como (- V 0 )- 1 13 • Para rectificadores de unión abrupta, las mediciones de capacitancia proporcionan una forma sencilla para determinar el potencial de contacto interno <Po. Con este fin. la ecuación (12.5-2) se puede reordenar en la siguiente forma (12.5-3) La capacitancia ppr unidad de área e se puede medir experimentalmente y se hace una gráfica de tje2 en función del voltaje inverso -V0 , como se ilustra en la figura 12.9. De acuerdo con (12.5-3), esta gráfica debe ser una recta. La intersección de esta gráfica en el eje V0 extrapolado de los datos medidos, proporciona el valor de <Po tal y como se indica. De acuerdo con la pendiente de esta línea determinada de un modo experimental, se puede evaluar la cantidad _VdNaf(Nd +Na); si un lado de la unión tiene una impurificación mucho más fuerte que el otro,4 esta cantidad es aproximadamente igual a la concentración de impurezas en el lado cuya impurificación es más leve. La concentración de impurezas en el lado más fuertemente impurificado se puede obtener una vez que se conocen <Po y la otra concentración Figura 12.9. Una gráfica de 1/C 2 en función del voltaje de polarización, que ilustra la determinación del potencial de contacto interno y las concentraciones de impurezas receptoras y donadoras a partir de las mediciones de capacitancia. 4 Este es casi siempre el caso en uniones producidas mediante procesos de aleación, como se verá más adelante. TABLA 12.1. Propiedades de uniones abruptas p-n en el germanio (K = 16) N. N. e/> o Vo Xo+ Xo- Xo Eo e (cm-') (cm- 3 ) (V) (V) (¡.L) (¡.L) (¡.L) (kv/cm) (f.Lffcm 2 ) 10'4 10 14 0.0702 -50 -500 0.788 3.08 6.69 21.0 66.5 0.788 3.08 6.69 21.0 66.5 1.58 6.15 13.4 42.1 133.0 0.891 3.48 7.57 23.8 75.2 0.00898 0.00229 0.00105 0.000336 0.000106 o o o o o 0.405 0.163 0.0606 0.0217 0.0076 0.405 0.163 0.0606 0.0217 0.0076 0.810 0.326 0.121 0.0433 0.0151 4.58 21.5 68.6 245.2 855.5 0.0175 0.0434 0.117 0.327 0.Y37 o 2.31 4.80 9.68 29.8 94.1 0.00023 0.00048 0.00097 0.00298 0.00941 2.31 4.80 9.68 29.8 94.1 2.61 5.42 10.95 33.7 106.4 0.00613 0.00295 0.00146 0.000475 0.000151 o -1 -5 10'5 10'6 1017 10' 8 10' 9 10'5 10'6 10 17 10 18 10'9 0.1854 0.3005 0.4156 0.5308 0.6459 10'4 10'8 0.3005 -1 -5 -50 -500 438 Teoría de las uniones p-n de los semiconductores de impureza a partir de (12.2-5). Se puede emplear un procedimiento similar para determinar Na y Na, incluso si las densidades de impurezas en ambos lados de la unión son comparables, aunque los aspectos matemáticos son un poco más complejos. Los detalles de este procedimiento se asignan como ejercicio para el lector. En la tabla 12.1 se muestran algunos datos numéricos de la capacitancia de estructuras de unión típicas. EJERCICIOS l. Demuestre que existe una discontinuidad en el potencial electrostático de una magnitud 47T A en donde .::l es el momento dipolar por unidad de área, en los lados opuestos de una capa dipolar eléctrica. 2. Se intenta medir el potencial de contacto interno de una unión p-n conectando un voltímetro de alta impedancia con conductores de cobre, a contactos que se encuentran en los lados opuestos del cristal que contiene una unión. El voltímetro indica una lectura de cero. Un potenciómetro substituye al medidor, pero la lectura sigue siendo cero. Explique físicamente la falla de estos dos métodos y analice los potenciales de contacto entre el cobre y las regiones tipo n y tipo p. 3. Utilice el teorema del flujo eléctrico de Gauss para demostrar que el campo eléctrico debe ser continuo en todas partes excepto en una superficie que tiene una distribución de carga. 4. Explique físicamente por qué el ancho de la región de carga espacial de una unión abrupta p-n es proporcional a la raíz cuadrada más que a la primera potencia de la caída de potencial de la unión 1/>o- V0 • 5. Encuentre expresiones aproximadas para los potenciales, los campos y el ancho de las capas de carga espacial asociadas con una unión linealmente gradual en la que Nd = O, N. = - cxx (x < 0) N. = O, Nd = cxx (x >0) donde a es una constante. Suponga que la caída total de potencial en la región de carga espacial es 1/Jo- Vo y que 1/Jo- Vo ~kT. Nota: use una extensión de los métodos expuestos en la sección 12.4. 6. Encuentre la capacitancia diferencial por unidad de área asociada con la unión linealmente gradual del ejercicio 5. 7. Demuestre la forma en que el potencial de contacto interno y Na y Na se pueden obtener a partir de una gráfica de datos experimentales como la que se muestra en la f¡gura 12.9. Derive fórmulas explícitas para Na y Na en función de la pendiente de la gráfica experimental y el potencial interno 1/>o. LECTURAS RECOMENDADAS J. D. Jackson, Classical Electrodynamics, John Wiley & Sons, Nueva York (1962), capítulo l. Allen Nussbaum, Semiconductor Device Physics, Prentice-Hall, Inc., Englewood Cliffs N. J. (1962), capítulo 4. W. Shockley, Electrons and Holes in Semiconductors, D. van Nostrand Co., Inc., Nueva York (1950). R. A. Smith, Semiconduc10rs, Cambridge University Press, Londres (1961), E. Spenke, Electronic Semiconductors, McGraw-Hill Book Co., lnc., Nueva York (1958). CAPITUW 13 Rectificadores de unión p-n • y transiStores . 13.1 TEORIA DEL RECTIFICADOR DE UNION p-n En el capítulo anterior se examinó la naturaleza física de una unión semiconductora p-n. También se analizaron cuantitativamente ciertas manifestaciones físicas de la estructura de la unión, tales como la carga espacial, los campos eléctricos, los potenciales y la capacitancia, basándose en un simple modelo de unión abrupta. En esta sección se verá el flujo de corriente asociado con la unión en condiciones de desequilibrio y la característica de corriente-voltaje de un simple rectificador de unión p-n. El modelo de unión que se adoptará se ilustra en estado de equilibrio en la figura 13 .1. Se supone que las regiones tipo p y n son homogéneas y se P.xtienden al infinito en las direcciones + x y - x. En el estado de equilibrio habrá cierto número de electrones presentes como portadores mayoritarios en el lado n, que tienen la suficiente energía para saltar la barrera de potencial y difundirse en el lado p de la unión. En la región p, estos electrones constituyen portadores minoritarios y f-ec#> + + + + + ++ + + + + Jp,- Figura 13.1. -= Vo= O --x + Carga espacial tipo-p -- - - -- -- + + + + -Jp, + + ~e ., •• ti po-n Diagrama de potencial de una unión p-n en condición de equilibrio, en donde se muestran las distribuciones de portadores de carga y los flujos de generación y recom binación. 440 Rectificadores de unión p-n y transistores pueden, después de cierto tiempo, desaparecer mediante su recombinación con huecos. Por tanto, en equilibrio se tiene una corriente de electrones de la región n, pasando sobre la unión, hasta la región p, en donde se pierden por recombinación. Este flujo electrónico de equilibrio se citará como flujo de recombinación lnr· Sin embargo, se obvio que en la condición de equilibrio no puede haber un flujo neto de corriente; es más, de acuerdo con el principio del balance detallado, en estado de equilibrio, cualquier proceso microscópico de transporte y su inversa deben proceder a la misma velocidad. La inversa de este proceso en particular es la generación de pares electrón- hueco en el lado p de la unión, y la difusión subsecuente de electrones a través de la unión hacia el lado n, en donde se convierten en portadores mayoritarios. Este proceso inverso conduce a una corriente electrónica que fluye de la región p a la región n y que se denominará corriente de generación. En estado de equilibrio, el flujo de partículas resultante Jng debe ser exactamente igual a -Jnr· Estas mismas observaciones se aplican a los huecos por igual; existe un flujo de recombianción Jpr que se origina cuando los huecos de la región p se desplazan sobre la barrera hasta la región n, en donde se recombinan con electrones. Esto va acompañado por un flujo de generación Jpg que se crea mediante la generación térmica de pares en la región n, seguida de la difusión de huecos térmicamente generados a través de la unión. En estado de equilibrio se debe tener J ng = - J nr· Por tanto, en estado de equilibrio los flujos totales de huecos y electrones a través de la unión son igual a cero. La base para la acción de una unión p-n como rectificador es como sigue. En condiciones de polarización inversa, la altura de la barrera de potencial en la unión aumenta en una cantidad igual a -e V 0 , en donde V 0 es el voltaje aplicado. En estas condiciones, es difícil para los portadores vencer la barrera por difusión y, por ende, J nr y J pr se hacen muy pequeños; sin embargo, los flujos J ng y J pg dependen sólo de la velocidad de generación térmica de pares electrón-hueco en las regiones volumétricas respectivas y, en consecuencia, no se ven reducidos. Por tanto, conforme se incrementa el voltaje de polarización, la densidad de corriente a través -eq, -eq, _ tipo-n V0 <O +++++++ ++++++ + + + + + + + -x + + tipo-p + ~-----.,.+ <V Unión (a) Figura 13.2. + + -Jpg Jp,---· tipo-p + + -Jpg Unión tipo-n ( b) Diagrama de potencial de una unión p-n (a) con polarización inversa, (b) con polarización directa, en donde se señala cómo se modifican los flujos de generación y recombinación. Teoría del rectificador de unión p-n 441 de la unión tiende a un valor pequefio constante -e(Jpg- lng), denominado co"iente de saturación, que está limitada por el número de pares térmicamente generados que se crean en las regiones volumétricas cerca de la unión. Esta corriente depende sólo de parámetros del material y la temperatura, y no puede aumentar notablemente, no importa el alto valor que puede adquirir el voltaje. Esta situación física se ilustJ;a esquemáticamente en la figura 13.2(a). Cuando se aplica un voltaje de polarización directo, la altura de la barrera de potencial se reduce y es muy fácil para los electrones mayoritarios del lado n y los huecos mayoritarios del lado p, difundirse sobre la barrera hacia los lados opuestos respectivos en donde pueden convertirse en portadores minoritarios y, finalmente, recombinarse. En este caso, las corrientes de recombinación Jpr y lnr pueden hacerse muy grandes en comparación con sus valores de equilibrio. No obstante, las corrientes de generación lng y Jpg permanecen iguales, ya que están limitadas por la velocidad de generación térmica. El resultado es un gran flujo de corriente, como se ilustra en la figura 13 .2(b ). La estructura de la unión presenta una impedancia muy elevada en la dirección de polarización inversa y una impedancia muy pequefia en la dirección de polarización directa, por lo que se comporta como un rectificador. En la figura 13.3 se muestra la relación corriente-voltaje. En la condición de polarización inversa se originan flujos de corriente de saturación consistentes en portadores minoritarios generados de un modo térmico en las regiones volumétricas que quedan fuera, pero son adyacentes, a las capas de carga espacial de la unión y que la barrera de potencial de la unión se encarga de recoger. En la condición de polarización directa, la corriente se compone en su mayor parte de portadores mayoritarios que se difunden sobre la barrera reducida para convertirse en portadores minoritarios en la región de conductividad opuesta, al otro lado de la unión; en efecto, la unión inyecta un gran número de portadores minoritarios hacia las regiones volumétricas adjuntas a ambos lados. Puesto que el número de electrones que poseen la energía suficiente para sobrepasar la barrera de potencial de la unión es proporcional a e-e(v>o- Vo)fkT = (const)eeVofkT (suponiendo que la estadística de Maxwell-Boltzmann es válida), es de esperarse que Jnr y Jpr sean proporcionales a eeVofkT. Sin embargo, para V0 =O, Jpr =Jpg Y Jnr =1n 1p de donde, se tiene que y J pr = J pg e•VofkT (13.1-1) J nr = J ng e•VofkT • (13.1-2) l Figura 13.3. Relación corriente-voltaje de una unión p-n, con la región de ruptura inversa. 442 Rectificadores de unión p-n y transistores Entonces, de acuerdo con la figura 13.2, (13.1-3} y (13.1-4¡ La relación entre el voltaje aplicado y la densidad de corriente eléctrica 1 estará dada por (13.1-5) en donde la densidad de corriente de saturación 10 es la suma de las densidades de corriente de generación (13.1-6} La relación que existe entre la corriente y el voltaje que aparece en la figura 13.3 es una gráfica de la ecuación (13.1-5) antes mencionada. A continuación se procederá a sacar el resultado (13.1-5) por medio de un método de cálculo más riguroso que cuenta con dos ventajas: la primera, que proporciona una expresión más explícita de la corriente de saturación y, segunda, que forma la base para la técnica de cálculo que se puede aplicar a dispositivos de unión más complicados. El procedimiento que se seguirá consiste en resolver la ecuación de continuidad para los portadores en exceso, tanto en la región n, como en la p, y aplicar las condiciones apropiadas de frontera a la unión y a todas las demás partes del sistema. Con este fin se supondrá que la unión es planar y que el plano de unión se extiende esencialmente al infinito en las direcciones y y z, de tal manera que sólo se requiere tomar en cuenta las variaciones de concentración de portadores y el flujo de corriente a lo largo de la dirección x. También se supondrá que se ha llegado a un estado estacionario y que todo el voltaje aplicado al sistema aparece en la región de carga espacial asociada con la unión. Las caídas de voltaje y los campos eléctricos en el material que se encuentra fuera de la región de la unión son, por tanto, despreciables y el transporte en dichas regiones es puramente difusivo. En estas condiciones. las ecuaciones de continuidad para los electrones de la región p y los huecos de la región n, tienen la forma (región-p, x < -x 0 _) (13.1-7) (región-n, x > x 0 +) (13.1-8) y en donde, y (13.1-9) Como de costumbre, sólo se tratan explícitamente las ecuaciones de continuidad para portadores minoritarios en cada región; pero se debe recordar que existe un exceso de concentración de electrones en todas partes, dentro de la región n, que es igual a la concentración local de huecos en exceso, y una concentración de huecos Teoría del rectificador de unión p-n 443 en exceso en toda la región p, que es igual a la concentración local de electrones en exceso, con el fin de que se satisfaga el requisito de neutralidad eléctrica. La fuente última de estos portadores mayoritarios excedentes la constituyen los contactos extremos del dispositivo (que están alejados de la unión en el modelo más o menos idealizado que está considerando). En cierto modo, la inyección de una distribución de portadores minoritarios da como resultado la formación inmediata de una distribución adjunta de portadores mayoritarios que vacía el resto del dispositivo de este tipo de portadores, creando instantáneamente un campo que atrae a los portadores mayoritarios neutralizantes hacia adentro, desde el contacto extremo. En la condición de estado estacionario se mantiene una neutralidad aproximada en todas partes excepto dentro de la región de carga espacial de la unión. Las condiciones de frontera que van a usarse indican lejos de la unión que la densidad de portadores minoritarios excedentes debe tender a cero, de donde, para X= -oo , (13.1-10) para X= +oo (13.1-11) y Pn- Pno =O en tanto que las condiciones de frontera (12.3-1) y (12.3-2) desarrolladas en el capítulo anterior deben satisfacerse en la unión. El uso de estas condiciones de frontera simplifica el análisis, si se supone que la densidad de portadores en exceso es mucho más pequeña en todas partes que la densidad de portadores mayoritarios en equilibrio. Es evidente que esta condición se satisfará siempre en el dispositivo a todos los voltajes de polarización directa, excepto los muy grandes. Si se hace esta suposición, ent;:mces, en (12.3-1) nn(Xo+) puede igualarse a nno• mientras que en (12.3-2), Pp( -x0 _) puede considerarse 1 igual a Ppo. Entonces, estas condiciones de frontera toman la forma np{ -Xo-) = e-e(+o-Vo)/kT nno (13.1-12) y e -e(+o-Vo)/kT. (13.1-13) Las soluciones generales de las ecuaciones de continuidad (13.1-7) y (13.1-8) se pueden expresar como (región-p) (13.1-14) (región-n) (13.1-15) y en donde A, B, C y D son constantes arbitrarias. Se puede ver claramente que, para satisfacer las condiciones de frontera (13.1-10) y (13.1-11), es necesario determinar que B = C =O. Así también, puesto que cuando el voltaje aplicado V0 es cero, 1 De otra manera, sería necesario escribir nn(Xo+)=nno+fpn(Xo+>-Pno] y Pp(Xo-)= Ppo +[np(- xo_)- npo]. Rectificodores de unión p-n y transistores 444 np(-x 0 _)=npo y Pn(Xo+)=Pno• como lo indican (13.1-12) y {13.1-13), la cantidad e-e4>o/kT se puede expresar -en función de la relación de las concentraciones de equilibrio de huecos y electrones en los lados opuestos de la unión2 , como sigue e-e+ofkT = npo = Pno nno Ppo (13.1-16) Esto permite expresar las condiciones de frontera {13.1-12) y {13.1-13) en la forma n P(-x o- ) = n pO eeVofkT (13.1-17) y (13.1-18) Si se hace que B = C= O, en {13.1-14) y {13.1-15), y se aplican {13.1-17) y {13.1-18) para evaluar las otras dos constantes, se puede demostrar fácilmente que np - npo = npo(eeYo!kT - 1)e(x+xo-l/Ln (región-p) (13.1-19) Pn- Pno = Pno(eeVofkT- 1)e-(x-xo+l/Lp {región-n) (13.1-20) y Estas ecuaciones permiten ver que para una polarización inversa {V0 <O) la concentración de electrones en la región p y la concentración de huecos en la región n son menores que el valor de equilibrio; en este caso, la concentración de portadores minoritarios en exceso es negativa. Se puede afirmar lo contrario cuando el voltaje de polarización aplicado tiene un sentido directo (V0 > 0). Las ecuaciones {13.1-19) y {13.1-20) se pueden emplear para encontrar las corrientes de huecos y electrones que fluyen dentro de las regiones de carga espacial desde el lado n y el lado p del cristal, respectivamente. Se supondrá que la corriente de electrones que cruza la unión es la misma que la corriente de electrones minoritarios que fluye dentro de la región de carga espacial, desde el lado p, y que la corriente de huecos que cruza la unión es igual a la corriente de huecos minoritarios que fluye dentro de la región de carga espacial, desde el lado n. Al hacer esto, se está desechando cualquier generación o recombinación térmica de portadores que pueda ocurrir dentro de la capa de carga espacial propiamente dicha. 3 Esto se justifica por el hecho de que el espesor de la capa de carga espacial es, en la mayoría de los casos, muy pequeño y los campos muy altos dentro de la capa de carga espacial aceleran casi siempre a los electrones desde el lado p, y a los huecos desde el lado n, para que atraviesen la capa en un intervalo muy pequeño en comparación con sus tiempos de vida. Al hacer esta simplificación, la corriente de unión se puede evaluar determinando las corrientes de difusión de los portadores minoritarios en las fronteras de la región de carga espacial, lo cual da Esto se establece también fácilmente a partir de (12.2-3) ó (12.2-4). Si no se efectuara esta aproximación, las ecuaciones de continuidad (incluyendo los términos apropiados del campo} tendrían que resolverse en las dos capas de carga espacial e igualarse con las soluciones de fuera, como las expresan (13.1-19) y (13.1-20) en x 0 + y - x 0 _ con condiciones de frontera adecuadas. En este caso, el cálculo será más díficil, aunque más general. 1 3 Teoría del rectificador de unión p-n n 0 D"(eeVo/kT -1} = _ __f!____L dn ) JiO}~Jn(-Xo_)= -Dn ( - dP X y -xo- (dp") J p(x O+ ) = -D p d J p(O),.., = X (13.1-21) n = PnoDp L (eeVofkT _ l} . XO+ 445 (13.1-22) p La corriente eléctrica que cruza la unión es, entonces, 1 = e(Jp(O)- Jn(O)) = e(nP~~n + Pn~~P)(eeVo/kT- 1). (13.1-23) Este resultado tiene la misma forma que el que se obtuvo anteriormente como (13.1-5); ahora, la corriente de saturación es (13.1-24) Las concentraciones reales de huecos y electrones a ambos lados de la unión, tanto para la polarización directa como para la inversa, se muestran en la figura 13.4 para un rectificador típico de unión p-n del tipo que se acaba de describir. De acuerdo con la ecuación anterior, se encuentra que la corriente de saturación incluye las densidades de equilibrio de portadores minoritarios npo y Pno los coeficientes de difusión Dn y Dp, así como los tiempos de vida de los portadores en exceso a través de las longitudes de difusión Ln y Lp. Esto se puede expresar en función de las densidades de portadores mayoritarios aplicando la relación (13.1-25) en donde, (13.1-23) se puede expresar en la siguiente forma (13.1-26) Parece que la corriente de saturación se puede reducir mediante el uso de un material con impurificación relativamente fuerte en la región n y p, y también haciendo que el tiempo de vida de los portadores en exceso sea lo más grande posible en ambas regiones. De acuerdo con (13.1-26}, la corriente de la saturación depende de la temperatura a través d¡: Dn, Dp, Ln, Lp y n¡. De estos parámetros, el más sensible a la temperatura es la densidad de portadores intrínsecos n¡ y, por tanto, la corriente de saturación debe aumentar rápidamente al incrementarse la temperatura. Los semiconductores que tienen bandas de energía prohibida relativamente grandes (y, por ende, valores más o menos pequeños de n¡), son convenientes para elaborar rectificadores de unión p-n que deban manejar densidades elevadas de corriente y operar a altas temperaturas. En estas condiciones de operación, la densidad de portadores intrínsecos dentro del semiconductor con esa banda pequeña se hace excesiva y la corriente de saturación adquiere un gran valor, lo cual da como resultado una eficiencia pobre de rectificación y una generación excesiva de calor en la región de polarización inversa, como se muestra en la figura 13.5. En consecuencia, los rectificadores de silicio son superiores a las unidades de germanio para aplicaciones de alta corriente o alta temperatura. Desafortunadamente, la baja 446 Rectificadores de unión p-n y transistores Concentración Concentración Déficit electrónico tipo-p Región de la unión (a) Polarización directa Figura 13.4. Déficit de huecos . tlpO-n Región de la unión (b) Polarización inversa np(x) -· Concentraciones de electrones y huecos en la cercanía de una unión p-n (a) con polarización directa y (b) con polarización inversa. corriente de saturación ele los semiconductores de bandas prohibidas grandes, a temperaturas bajas, produce una impedancia más alta en el estado de polarización directa y, por ende, una gran caída de voltaje directo para una corriente dada. Esto representa una mayor pérdida de potencia dentro del dispositivo y una generación de calor interno superior en condiciones de corriente pequeña. Por esta razón muchas veces se prefiere usar rectificadores de germanio cuando se tiene como requisito una baja caída de voltaje en sentido directo a corrientes bajas, y cuando no es importante un buen funcionamiento en condiciones de alta corriente y alta temperatura. Las fracciones ele la corriente total de unión portada por electrones y huecos se menciona a veces como las eficiencias de inyección de electrones y huecos, respectivamente. De acuerdo con (13.1-21) y (13.1-22), es obvio que estas cantidades están dadas por (13.1-27) (13.1-28) En una umon simétrica, en donde Pp 0 = nn 0 , las corrientes de electrones y huecos son aproximadamente iguales, a condición de que la relación de movilidad b sea del orden de la unidad y que Ln y Lp no difieran en gran manera. Sin embargo, en un dispositivo asimétrico en el que una región está más fuertemente impurificada que la otra, las expresiones anteriores demuestran que casi toda la corriente que Corrientes y campos en los rectificadores de unión p-n 447 IVc, Potencia Corriente alta de 1saturación Región de ruptura Figura 13.5. Corriente baja de saturación Disipación de potencia de un rectificador de unión p-n en función del voltaje aplicado. fluye por la umon es transportada por el portador que constituye el elemento mayoritario dentro de la región fuertemente impurificada. Desde el punto de vista físico esto es cierto, ya que los portadores mayoritarios de la región con impurificación leve que, por ejemplo. podrían inyectarse dentro de la otra región si se aplicara una polarización directa, existen en una cantidad reducida en comparación con los portadores mayoritarios dentro de la región de gran impurificación que, en condiciones similares, podrían inyectarse hacia el lado de impurificación ligera. Más tarde se verá que la eficiencia de inyección de la unión del emisor es un factor importante en la ganancia de un transistor de unión. Si el voltaje de polarización inversa aplicado a un rectificador de unión p-n se incrementa uniformemente, se llegará a un punto en el que la corriente inversa aumenta de un modo repentino y abrupto, como se ilustra en las figuras 13.3 y 13.5. Este fenómeno se conoce como ruptura y el voltaje al que se produce se denomina voltaje de ruptura del dispositivo. Si éste funciona mucho más allá del punto de ruptura, se generará internamente una gran cantidad de calor, ya que tanto I como IVo 1son grandes y puede fundirse o quemarse en un lapso muy corto. En el siguiente capítulo se presentará un breve estudio de los mecanismos típicos que intervienen en la ruptura de los rectificadores de unión p-n. 13.2. CORRIENTES Y CAMPOS EN LOS RECTIFICADORES DE UNION p-n Para obtener los resultados de la sección anterior, se supuso que todo el transporte de portadores de carga en las regiones volumétricas p y n adyacentes a la región de carga espacial de la unión es puramente difusivo. La justificación física de esta suposición es que casi todo el voltaje aplicado a un dispositivo de unión p-n aparece en la región de carga espacial de la unión que está casi vacía de portadores de carga y, en efecto, tiene una resistividad mucho mayor que las regiones situadas a ambos lados. No obstante, se verá que en realidad los resultados obtenidos, contradicen la suposición; es necesario tratar de determinar si esta contradicción es lo suficiente- 448 Rectificadores de unión p-n y transistores mente grave para que se abandone este planteamiento y vuelva a comenzarse desde el principio. Como se verá, en la mayoría de los casos no sucede esto. Por ahora, la atención se deberá enfocar en la región n del dispositivo (x > x 0 +)· Obviamente, en esta sección del dispositivo, los flujos de partículas Jn y JP se pueden expresar como dn,. J n = -D n "E dx - nnrn (13.2-1) y (13.2-21 en donde E es el campo eléctrico que hasta ahora se ha despreciado. Del mismo modo, puesto que no existen fuentes ni escapes para la corriente eléctrica dentro de la región volumétrica, es necesario tener, en el estado estacionario, como ecuación de continuidad para la densidad de corriente eléctrica 1, op --=V·I=O at (13.2-3) en donde p es la densidad de carga. En el sistema unidimensional que se está viendo, esto significa que dl/dx =O, ó l(x) = e(Jp(x)- Jix)) = const. (13.2-4) Las expresiones de corriente de partículas (13.2-2) se pueden transformar en una expresión algo más útil haciendo notar que, debido a la condición de neutralidad eléctrica ~n = ~p. la densidad de portadores mayoritarios se puede escribir como sigue (13.2-5) de donde, dn,. dp,. dx dx -=- (13.2-6) Cuando se substituyen estas relaciones en (13.2-1) y (13.2-2), se insertan las ecuaciones resultantes en la expresión de continui~ad (13.24) y, resolviendo para el campo E, se obtiene dp,. 1- eDp(b- 1) -d-x E=-~--~--~-~ eJJ.p[bn,.o + b(p,. - Pno) + p,.]. (13.2-7) Los resultados obtenidos en la sección anterior en la forma de las ecuaciones (13.1-20) y (13.1-23), suponiendo que el efecto de los campos eléctricos en la región volumétrica n del dispositivo, que queda fuera de la región de carga espacial, puede ser despreciable en comparación con el efecto del transporte difusivo, se pueden substituir ahora en (13.2-7) para corroborar la consistencia de los resultados Corrientes y campos en los rectificadores de unión JH1 449 con la supos1c1on. En el capítulo 10 se demostró que, en general, un campo eléctrico no altera el carácter difusivo del perfil de concentración, a menos que se sobrepase el valor crítico dado por (10.244). Si &e observa que los coeficient&' de transporte ambipolar apropiados son Dp y IJ.p, y si se usan (13.1-9) y (10.2-11), esta condición se puede expresar como kT (13.2-8) IEI~-. eLP Si los valores de Pn e 1 dados por (13.1-20) y (13.1-23) se substituyen en (13.2-7), esta ecuación toma la siguiente forma lo+ epnoDp (b- 1)e-<x-xo+)/Lp E_ LP . (eeYo/kT _ 1) - qo + Pnoep-p(b + 1)(eeYo/kT- 1)e (x xo+)/Lp (13.2-9) en donde a0 = ep.p(pn 0 + bnno) es la conductividad de equilibrio del material tipo n y en donde 10 está dada por (13.1-24). Para V 0 =O, desaparece el campo dado por (13.2-9); para voltajes de polarización lo suficientemente pequefíos, ya sean directos o inversos, se satisfará la condición (13.2-8). En general, en el rango de polarización inversa, el factor (eeVofkT- 1) debe tener valores entre cero y -1. Puesto que el segundo término del denominador anterior es casi siempre pequefío en comparación con a0 para cualquier valor de polarización inversa, debido al hecho de que nno ;;¡¡:.. Pno• la magnitud del campo aumentará cuando se incremente la polarización inversa, llegando a un valor máximo para V 0 ~- oo. En estas condiciones, despreciando el segundo término del denominador por la razón que se acaba de citar, (13.2-9) adquiere la forma 1 p D (b- 1)e-<x-xo+)/Lp qo JliPno + bnno) E=~+nOp . (13.2-10) Si se usan (13.1-24) y (10.2-11), esto se puede transformar en kT Pno[1- (b- 1)e-<x-xo+)/Lp] + bnpo ~P E=-· n eLP Pno + bnno (13.2-11) Si Lp -Ln y b -1, la condición (13.2-8) debe satisfacerse en todas partes dentro de la región n para todos los valores de polarización inversa, ya que si el material dentro de esta región es bastante extrínseco, nno ;;¡¡:.. Pno, npo. Todos estos resultados coinciden con la hipótesis original de que el campo era tan pequefío que podrían desecharse los efectos de todos los transportes excepto el difusivo. Para valores grandes de polarización directa eeVofkT se hace grande y positivo. En estas cucunstancias, el segundo término del denominador de (13.2-9) puede hacerse tan grande o mayor que el primero . Dentro del límite de un gran voltaje en directo4 en el borde de la región de carga espacial (x = x 0 +), (13.2-9) se reduce a E_ kT b - eLP b + 1 (t + Pno npo LP) Ln (13.2-12) 4 Por supuesto, en estas circunstancias los coeficientes de transporte ambipolar (10.2-27) y (10.2-28) deben usarse en las ecuaciones de continuidad, ya que las concentraciones de portadores excedentes pueden ser mayores que la densidad de portadores mayoritarios en equilibrio. Sin embargo, para materiales donde b es del orden de la unidad, la discrepancia no será lo suticientemente grande como para invalidar las conclusiones cualitativas que se han derivado. 450 Rectificadores de unión p-n y transistores y es evidente que (13.2-8) ya no se satisface. En estas circunstancias el papel del campo puede ser muy importante. En consecuencia, no debe esperarse que la ley de la corriente y el voltaje (13.1-23) se obedezca a grandes voltajes de polarización directa. Aunque sólo se ha investigado en detalle la región n del dispositivo, es obvio que se pueden hacer las mismas observaciones en relación con la región p. Ya se ha verificado la corrección fundamental del uso de los perfiles de concentración puramente difusivos (13.1-19) y (13.1-20) en casi todas las condiciones para describir la distribución de portadores en exceso en las regiones n y p de un rectificador de unión p-n. Ahora es necesario, para completar el cuadro, justificar la suposición de que la co"iente de portadores minoritarios que fluye dentro de la región de carga espacial de la unión es puramente de tipo difusivo. Esto se puede lograr de una manera muy similar. También en este caso, considerando en particular la región n del dispositivo, (13.2-2) deja ver que la componente difusiva de la corriente de huecos es mucho mayor que la componente de arrastre, siempre que (13.2-13) en donde E está dado por (13.2-9). Si en esta ecuación se substituyen (13.1-20) y (13.2-9), el resultado es D Lp e-<x-xa+)/Lp ~ J.lp(l + (eeYo/kT- l)e-<x-xa+)/Lp) p (13.2-14) Lejos de la umon (x ~xo+), los factores e<x-xo+)/Lp se hacen extremada· mente pequeños y (13.2-14) se reduce a (13.2-15) y es obvio que se viola la condición (13.2-13). Por supuesto, esto es de esperarse desde el punto de vista puramente físico, ya que por ejemplo, en el caso de la polarización directa, los portadores minoritarios excedentes que se inyectan en la unión se recombinan con portadores mayoritarios cuando se difunden cada vez más lejos de la unión y por esta razón su concentración se hace extremadamente pequeña cuando están lejos del plano de la unión. Sin embargo, si la concentración de portadores minoritarios en exceso se hace pequeña, lo mismo sucede con su gradiente y la corriente de difusión que es proporcional a ella. No obstante, la corriente total debe ser la misma en todas partes de acuerdo con (13.2-4). El déficit resultante en la corriente de difusión lejos de la unión se contrarresta mediante el incremento correspondiente en la corriente de arrastre que se origina debido a la presencia de un campo eléctrico. En efecto, es evidente, a partir de (13.2-9), que cuando se está lejos de la unión el campo eléctrico E se acerca a un valor constante J0 (ef!Vo/kT- 1)/ a 0 dando origen a una corriente de arrastre puramente óhmica, libre de cualquier componente de difusión o efecto de portadores en exceso dentro de esta región. Esto es precisamente lo que la intuición indicaba. Corrientes y campos en los rectificadores de unión p-n 4S 1 Por supuesto, más cerca de la unión, parte de la componente de arrastre da origen a una corriente de difusión y, en la unión misma, con contribución relativa de la componente difusiva puede valorarse haciendo x = x 0 + en (13.2-14), por lo cual, esa desigualdad se reduce a (13.2-16) Si se sigue una línea de razonamiento similar a la que se usó previamente en relación con (13.2-14), se puede demostrar que cuando LP -Ln y b,.., 1, (13.2-16) se satisface a todos los valores de volt.tje de polarización inversa y para pequeños voltajes de polarización directa. También, al igual que antes, para grandes voltajes de polarización directa, esta condición puede violarse. Nuevamente (excepto a grandes valores de polarización directa) estos resultados son consistentes con el punto de vista original, de que casi toda la corriente de portadores minoritarios que fluye hacia la región de carga espacial de la unión es de difusión. El resultado se ha comprobado explícitamente sólo para la región n; pero es evidente que pueden formularse conclusiones similares para la región p. De donde, se justifica la conclusión establecida de que, aunque los resultados de los cálculos de la sección anterior revelen que hay campos eléctricos en las regiones volumétricas, en contradicción con la hipótesis original en la que se basaron dichos cálculos, en la región de polarización inversa o baja polarización directa, los campos son tan reducidos que no hay contradicciones importantes a la suposición del transporte difusivo de los portadores minoritarios. 5 Los cálculos realizados en estas circunstancias son totalmente congruentes. Para valores mayores de voltaje de polarización directa, los campos calculados se hacen tan grandes que amenazan esta congruencia y ya no se puede tener la seguridad de que siga siendo válida la suposición inicial de que el transporte de portadores minoritarios es puramente difusivo dentro de las regiones volumétricas p y n del dispositivo. En el siguiente capítulo se estudiarán las propiedades de los rectificadores p-n en estas condiciones de un modo más detallado. Ya se hizo notar en relación con (13.2-15), que dentro de las regiones volumétricas, las componentes difusiva y de arrastre de la corriente total no son iguales en todas partes a pesar de que la corriente total propiamente dicha es constante en ellas. Se puede hacer la misma observación sobre las componentes de la corriente de huecos y electrones. Por ejemplo, de acuerdo con la figura 13.4(a), es obvio que en el lado n cerca de la unión, la corriente de huecos es mucho mayor (en vista de la gran componente difusiva) que lejos de la unión, en donde los huecos escasean y en donde la corriente de huecos es casi exclusivamente de arrastre. En vista del requisito de que la corriente total sea la misma en todas partes, es evidente que la corriente electrónica cerca de la unión debe ser correspondientemente más pequeña que lejos de ella en la parte volumétrica del cristal. Este equilibrio se mantiene por medio del campo E, dado aproximadamente por (13.2-9), que tiene un efecto mucho más importante en las corrientes de portadores mayoritarios (debido al número mucho mayor de portadores mayoritarios presentes), que en las corrientes de portadores minoritarios que, como se demostró antes, tiene una naturaleza más bien difusiva. S Por supuesto, en algunos casos y debido a las caídas óhmicas dentro de las regiones volumétricas p y n, ya no se podrá identificar a V0 como el voltaje total aplicado, sino sólo como la caída que se produce en la región de la unión. 452 Rectificadores de unión p-n y transistores 13.3 RECTIFICADORES DE UNION DE TAMAÑO FINITO; EFECTOS DE SUPERFICIE Y TERMINALES OHMICAS Los resultados de la secc10n anterior, aunque se derivaron para un dispositivo de extensión infmita a lo largo del eje x, se pueden aplicar perfectamente a dispositivos de tamaño finito, con la única condición de que las regiones reales n y p sean muchas veces más gruesas que las longitudes de difusión respectivas Lp y Ln, y que la cantidad V 0 se considere como el voltaje aplicado a la región de carga espacial de la unión y no como el voltaje aplicado a todo el dispositivo. Si los espesores de una o las dos regiones volumétricas adyacentes a las capas de carga espacial de la unión son del orden de la longitud de difusión en dicha región, o menores que ésta, es necesario modificar las cálculos de la sección 13.1. Para ver cómo se hace, estúdiese primero el rectificador que aparece en la figura 13.6(a), en donde la estructura del dispositivo se termina por medio de dos superficies libres con velocidades de recombinación superficial sp y sn. Se supone que el dispositivo es grande en las direcciones y y z, de tal manera que se pueden escribir ecuaciones de continuidad unidimensionales de la forma (13.1-7) y (13.1-8). Aunque la forma general de las soluciones tal como la expresan (13.1-14) y (13.1-15) sigue siendo válida, es más conveniente escribir las soluciones como sigue np- npo = A cosh p.- P.o = C cosh X+ X 0 _ L. X- Xo+ LP + B senh X+ Xo- L (x <O) (13.3-1) (x > 0). (13.3-2) n + Dsenh X- Xo+ L P Se puede demostrar fácilmente que estas soluciones satisfacen las ecuaciones (13.1-7) y (13.1-8). Las condiciones de frontera (13.1-17) y (13.1-18) siguen siendo aplicables en los bordes de la unión en x 0