Subido por minufer98

John P. McKelvey - Física del Estado Solido y de Semiconductores-Limusa Noriega Editores (1996)

Anuncio
Temas que trata la obra:
• Redes cristalinas y tipos de cristales
• Análisis cristalográfico con rayos X
• Dinámica de las redes cristalinas
• Mecánica cuántica, generalidades
• Mecánica estadística, generalidades
• Vibraciones reticulares y propiedades
térmicas de los cristales
• Teoría del electrón libre de los metales
• Teorí~ cuántica de los electrones en
redes periódicas
• Semiconductores electrónicos uniformes
en equilibrio
• Exceso de portadores en
semiconductores
• Tecnología de materiales y medición de
propiedades volumétricas
• Teoría de las uniones p-n de los
semiconductores
• Rectificadores de la unión p-n y
transistores
• Uniones p-n a niveles altos de
corrientes; el rectificador p-i-n
• Otros dispositivos semiconductores
• Contactos metal-semiconductor y
superficies de semiconductores
,6flll""'
FISIC
,
DEL ESTADO SOLIDO Y DE
SEMICONDUCTORES
J. P. McKELVEY
~LIMUSA
NORIEGA EDITORES
MÉXICO • Eapel\a • Venezuela • Colombia
VERSIÓN AUTORIZADA EN ESPNIOL DE LA OBRA
PUBLICADA EN INGLéS CON EL TITULO:
SOLIO STATE ANO
SEMICONDUCTOR PHYSICS
O HARPER & Row PuBLISHERs, INc.
COLABORADOR EN LA TRADUCCIÓN:
HORTENSIA CORONA RODRÍGUEZ
INGENIERO DE LA UNIVERSIDAD DE CALIFORNIA,
8eRKELEY.
REVISIÓN:
FRANCISCO RESÉNDIZ RODRÍGUEZ
MAESTFÚA EN CIENCIAS EN INOENIERIA ELéCTRI•
CA DEL CeNTRO DE INVESTIGACióN Y EsTUDIOS
AVANZADOS, PROFESOR DE ELECTRÓNICA DE LA
EscueLA SuPERIOR DE INOENIERfA MECÁNICA
Y ELéCTRICA DEL INSTITUTO PouTéCNICO NA·
CIONAL, MéxiCO.
LA PRESENTACIÓN YDISPOSICIÓN EN CONJUNTO DE
FÍSICA DEL ESTADO SÓLIDO Y
DE SEMICONDUCTORES
SON PROPIEDAD DEL EDITOR. NINGUNA PARTE DE
ESTA OBRA PUEDE SER REPRODUCIDA O TRANS·
MlliDA, MEDANll: NfGÚN SISTBM O MÉlalO, B..EC·
TIÓIIICO o aECÑICO (N:W'fENX) afOitlCXlPWlO,
LA GRABACIÓN O CUALQUIER SISTEMA DE RECUPE·
RACIÓN Y ALMACENAMIENTO DE INFORMACIÓN), SIN
CONSENTIMIENTO POR ESCRITO DEL EDITOR.
DERECHOS RESERVADOS:
O 1996, EDITORIAL LIMUSA, S.A. DE C.V.
GRUPO NORIEGA EDITORES
BALDERAS 95, MéJOCO, D.F.
C.P. 06040
i l 521·21.05
Q 512·29.03
CANIEM NúM. 121
NovENA RBMPRESIÓN
HECHO EN MéxiCO
ISBN 968·18·0431·7
Prólogo
Este libro se basa en el material que utilicé para impartir cursos especiales
de dos semestres a los estudiantes de las carreras de física, ingeniería
eléctrica, metalurgia y ciencias de materiales. Por lo común, el primer
semestre de estos cursos se dedica ala física general del estado sólido y el
segundo, a un estudio detallado de los materiales y dispositivos semiconductores, incluyéndose en él (además de una gran cantidad de material nuevo)
muchas aplicaciones de los principios desarrollados en la sección introductoria del curso. Por consiguiente, la obra es fundamentalmente un libro de
texto para un curso de este tipo. Esperamos que su alcance sea lo
suficientemente amplio y la exposición de los aspectos fundamentales, lo
suficientemente detallada y clara para que también sirva como libro de
consulta general para los ingenieros y otros profesionales que trabajan en el
área de investigación y desarrollo de los materiales y dispositivos
semiconductores.
En vista de que este material puede interesar a los estudiantes y
profesionales de carreras muy diversas, se incluyeron los capítulos sobre
mecánica cuántica y mecánica estadística, por creer que serían muy útiles
para algunos. Sin embargo, cabe señalar que con estos capítulos no se
pretende suplir un curso completo de estos temas, ya que sólo se trata df.
breves ensayos introductorios que le proporcionan al lector los conocimientos necesarios para seguir el desarrollo del tema y entender el significado
físico de los conceptos presentados. Desde luego, para apreciar debidamente
la importancia que tienen los fenómenos cuánticos y estadísticos en la física
del estado sólido, no queda otra, sino estudiarlos a fondo.
A lo largo de la obra, los temas se presentan desde el punto de vista de la
física; por otra parte, se incluyen muchos detalles técnicos sobre temas tales
como tecnología de materiales y crecimiento de cristales; fabricación de
dispositivos semiconductores; características y configuración de circuitos de
estos dispositivos, y para proporcionar un panorama más completo, se
indican las obras que conviene consultar, si se desea obtener datos más
concretos y detallados en relación con estos temas. Traté de presentar en
forma exhaustiva la teoría de la unión p-n y el análisis del dispositivo
semiconductor y dar una explicación completa y detallada de las técni<:as
analíticas que se utilizan en este campo tan importante, pero tan descuidado.
Prólogo 6
Los conceptos de la física general del estado sólido que se estudian en la
sección introductoria, capítulos del 1 al 8, sólo abarcan aquellos que tienen
una importancia central en la física de los semiconductores. Por lo tanto,
esta introducción es más bien selectiva que completa; peri, aun así, contiene
el material suficiente para un curso completo, de nivel intermedio, sobre la
física del estado sólido. Desde luego, un libro de texto de tamaño normal no
puede abarcar un estudio de dieléctricos, magnetismo, centros de color,
experimentos de resonancia y otros temas que por lo general se tocan en los
cursos de física del estado sólido.
El nivel de presentación es intermedio; he tratado de ir mucho más allá de
lo que puede lograrse con un enfoque cualitativo, sin recurrir realmente a la
mecánica cuántica y la mecánica estadística, a fin de evitar las tremendas
complejidades matemáticas requeridas para un planteamiento absoluto de la
teoría cuántica. La línea de mis planteamientos es pragmática bien que
axiómática y traté sistemáticamente de explicar todos los temas desde dos
puntos de vista, el físico y el matemático. A lo largo de la obra se hace
énfasis en los principios fundamentales y no en los detalles técnicos. Además,
con mucha frecuencia se recurre al planteamiento de la partícula tal y como
se explica en la teoría del transporte del electrón libre; este planteamiento se
justifica a la luz de la teoría cuántica que se subraya en el capítulo 8. No se
necesita tener conocimientos matemáticos más avanzados que el análisis
vectorial y de las ecuaciones diferenciales ordinarias. Aunque en varias
ocasiones aparecen las ecuaciones diferenciales parciales y expansiones de la
función ortogonal, siempre se proporcionan en seguida los medios
matemáticos necesarios para resolverlas.
Me es imposible expresar en forma adecuada mi gratitud a todos mis
colegas que han contribuido a esta obra. Sin embargo, quisiera dar las gracias
de un modo específico a los doctores D.R. Frankl, P.H. Cutler, J. Yahia y
H.F. John por sus útiles comentarios, observaciones y sugerencias, así como
al Dr. F .G. Brickwedde quien me autorizó a emplear su personal, cuando la
transcripción del manuscrito se retrasaba por alguna emergencia. Mis
antiguos alumnos, los doctores J.C. Balogh, M W. Cresswell y E.F. Pulver
también me ayudaron mucho leyendo, evaluando y corrigiendo partes del
manuscrito. También muchos de mis estudiantes me señalaron los errores
que hubo en las notas del manuscrito y sugirieron cómo mejorar la
exposición de algunos temas. No me puedo acordar de todas las personas que
me ayudaron; pero estoy profundamente agradecido a cada una de ellas.
También deseo expresar mi gratitud a la señorita Frances Fogle, a la señora
Marion Shaw y a la señorita Eileen Berringer por su inapreciable
colaboración en la transcripción del manuscrito.
J.P. MCKELVEY
University Park, Pa.
Contenido
Capítulo 1 Redes cristalinas y tipos de cristales
13
1.1
1.2
1.3
1.4
1.5
Concepto de estado "sólido", 13
Celdas unitarias y redes de Bravais, 14
Algunas estructuras cristalinas simples, 18
Planos cristalinos e índices de Miller, 23
Espaciamiento de los planos en las
redes cristalinas, 25
1.6 Clasificación general de los
cristales, 27
Capítulo 2 Análisis cristalográfico con rayos x
31
2.1 Introducción, 31
2.2 Física de la difracción de los rayos X: las
ecuaciones de V on Laue, 34
2.3 Factor de dispersión atómica, 37
2.4 Factor geométrico de la estructura, 40
2.5 La red recíproca, 43
2.6 La condición de Bragg en función de la red
recíproca, 47
Capítulo 3 Dinámica de las redes cristalinas
3.1 Vibraciones elásticas de medios continuos, 51
3.2 Velocidad de grupo de trenes de ondas
armónicas, 53
3.3 Movimiento ondulatorio en redes atómicas
unidimensionales, 55
3.4 Estructuras diatómicas unidimensionales, 62
3.5 Región de frecuencia prohibida, 65
3.6 Excitación óptica de vibraciones reticulares
en cristales iónicos, 6 7
3. 7 Energía de enlace de estructuras cristalinas
iónicas, 69
51
Contenido 8
Capítulo 4 Mecánica cuántica, generalidades
19
4.1
4.2
4.3
4.4
4.5
4.6
Introducción, 79
Radiación del cuerpo negro, 79
Efecto fotoeléctrico, 81
Calor específico de los sólidos, 83
El átomo de Bohr, 84
La hipótesis de De Broglie y las propiedades
ondulatorias de la materia, 8 7
4.7 Mecánica ondulatoria, 87
4.8 Dependencia del tiempo de la función de onda, 91
4.9 La partícula libre y el principio de
incertidumbre, 94
4.10 Una partícula en un pozo de potencial
unidimensional e infinitamente profundo, 100
4.11 Una partícula en un pozo unidimensional
de profundidad finita, 103
4.12 El oscilador armónico unidimensional, 111
4.13 Oetogonalidad de las funciones propias y
la superposición de estados, 119
4.14 Valores esperados y números cuánticos, 123
4.15 El átomo de hidrógeno, 128
4.16 El espín electrónico, el principio de
exclusión de Pauli y el sistema
periódico, 141
Capítulo S Mecánica estadística, generalidades
5.1 Introducción, 147
5.2 La función de distribución y la densidad
de los estados, 148
5.3 La distribución Maxwell·Boltzmann, 153
5.4 La estadística de Maxwell-Boltzmann para
un gas ideal, 161
5.5 Estadística de Fermi-Dirac, 168
5.6 La distribución Bose-Einstein, 176
147
Capítulo 6 Vibraciones reticulares y propiedades térmicas
de los cristales
6.1 Cálculos clásicos del calor específico
reticular, 181
6.2 Teoría de Einstein sobre el calor específico, 183
6.3 Teoría de Debye sobre el calor específico, 186
6.4 El fonón, 192
6.5 Expansión térmica de los sólidos, 193
6.6 Conductividad térmica reticular de los sólidos, 195
181
Contenido 9
Capítulo 7 Teoría del electrón libre de los metales
203
Introducción, 203
La ecuación de Boltzmann y la trayectoria libre media, 204
Conductividad eléctrica de un gas de electrones libres, 209
Conductividad térmica y efectos termoeléctricos en
sistemas de electrones libres, 215
7.5 Procesos de dispersión, 219
7.6 El efecto de Hall y otros efectos galvanomagnéticos, 222
7. 7 Capacidad térmica de sistemas de electrones libres, 225
7.1
7.2
7.3
7.4
Capítulo 8 Teoría cuántica de los electrones en redes periódicas
231
8.1 Introducción, 231
8.2 El teorema de Bloch, 232
8.3 El modelo de Kronig-Penney de un cristal infinito
unidimensional, 23 5
8.4 Cantidad de movimiento del cristal y masa efectiva, 240
8.5 Representación de zona reducida; electrones y huecos, 243
8.6 La aproximación del electrón libre, 248
8. 7 La aproximación del enlace firme, 255
8.8 Dinámica del electrón en estructuras bidimensionales
y tridimensionales; superficies de energía constante y
zonas de Brillouin, 260
8.9 Aisladores, semiconductores y metales, 269
8.10 Densidad de la función de estados y cambios de fase en
aleaciones binarias, 273
Capítulo 9 Semiconductores electrónicos uniformes en equilibrio
9.1 Semiconductores, 281
9.2 Semiconductores intrínsecos y semiconductores
con impurezas, 284
9.3 Estadística de huecos y electrones- El caso del
semiconductor intrínseco, 288
9.4 Energía de ionización de centros de impurezas, 292
9.5 Estadísticas de los semiconductores con impurezas, 295
9.6 El caso de la ionización incompleta de niveles de impureza
(Temperatura muy baja), 300
9. 7 Conductividad, 302
9.8 El efecto de Hall y la magnetorresistencia, 306
9.9 Resonancia de ciclotrón y superficies elipsoidales
de energía, 316
9.10 Densidad de estados, conductividad y efecto de Hall con
superficies complejas de energía, 327
9.11 Mecanismos de dispersión y movilidad de los portadores
de carga, 335
281
Contenido 10
Capítulo 1O Exceso de portadores en semiconductores
347
10.1 Introducción, 347
10.2 Comportamiento de transporte de los portadores excedentes; las
ecuaciones de continuidad, 348
10.3 Algunas soluciones particulares de la ecuación de
continuidad, 361
10.4 Movilidad de arrastre y el experimento de Haynes-Shockley, 371
10.5 Recombinación superficial y condiciones de frontera
superficiales, 3 74
10.6 F otoconductividad de estado estacionario, 3 79
10.7 Fotoconductividad transitoria; tiempo de vida de los
portadores en excedentes, 383
10.8 Mecanismos de recombinación; la teoría de recombinación
de Shockley-Read, 390
Capítulo 11 Tecnología de materiales y medición de propiedades •E
volumétricas
401
11.1 Preparación de los materiales semiconductores de alto
grado de pureza, 401
11.2 Crecimiento de muestras monocristalinas, 407
11.3 Medición de la resistividad volumétrica, 409
11.4 Medición del contenido de impurezas y la movilidad mediante
el efecto de Hall, 411
11.5 Medición del tiempo de vida de los portadores excedentes, 412
11.6 Dislocaciones y otras imperfecciones, 413
Capítulo 12 Teoría de las uniones p-n de los semiconductores
12.1
12.2
12.3
12.4
12.5
421
La unión p-n, 421
El potencial de contacto interno de equilibrio, 424
Potenciales y campos en las cercanías de una unión p-n, 426
Modelo matemático simplificado de la unión p-n abrupta, 429
Capacitancia de unión; determinación del potencial interno, 435
Capítulo 13 Rectificadores de unión p-n y transistores
13.1 Teoría del rectificador de unión p-n, 439
13.2 Corrientes y campos en los rectificadores de unión p-n, 44 7
13.3 Rectificadores de unión de tamaño finito; efectos de
superficies y terminales óhmicas, 452
13.4 Mecanismos físicos de ruptura en las uniónes p-n, 456
13.5 Técnicas de fabricación de la unión p-n, 460
13.6 Transistores de unión p-n-p- y n-p-n, 460
439
Contenido 11
Capítulo 14 Uniones p-n a niveles altos de corriente;
el rectificara p-i-n,
479
14.1 Uniones p-n a densidades altas de corriente, 479
14.2 El análisis del rectificador p+-i-n+ a niveles
altos de corriente, 481
14.3 Rectificadores p-i-u; la caída de voltaje en sentido directo
como una función de la temperatura, 490
Capítulo 1S Otros dispositivos semiconductores,
495
15.1 El efecto fotovoltaico p-n y las celdas fotovoltaicas de
unión p-n, 495
15.2 Otros dispositivos sensibles a la luz; fototransistores, detectores
de partículas y detectores infrarrojos, 502
15.3 Rectificadores controlados p-n-p-n, 503
15.4 Diodos túnel, 506
15.5 Transist~res de efecto de campo o unipolares, 509
CAPITULO 16 CONTACTOS METAL-SEMICONDUCTOR Y
SUPERFICIES DE SEMICONDUCTORES, 513
16.1 Contactos metal-semiconductor en equilibrio, 513
16.2 Rectificación por contacto metal-semiconductor, 517
16.3 Estados superficiales y rectificación independiente de las
funciones de trabajo, 5 20
16.4 Potencial, campo y carga en la capa superficial de un
semiconductor, 524
16.5 Conductividad superficial, efecto de campo y movilidad
superficial; propiedades de superficies de
semiconductores reales, 5 31
Apéndice a la función & dirac
S3S
Apéndice b análisis tensorial
537
Indice de nombres
541
Indice de temas
S43
CAPITUW
1
Redes cristali,-,m y
tipos de cristales
1.1
CONCEPTO DE ESTADO "SOLIDO"
Desde un punto de vista general, el término sólido se aplica a substancias
elásticas rígidas, es decir, a substancias que tienen un comportamiento elástico no
sólo cuando se les somete a fuerzas hidrostáticas, sino también a esfuerzos de tensión y cortantes. Por supuesto, existen algunos materiales cuyo comportamiento es
tanto elástico como plástico o viscoso, de modo que esta clasificación no es del
todo rigurosa. No obstante, se adoptará como criterio de lo que es una substancia
sólida, reconociendo que existe un tipo de substancias que, al mismo tiempo, se
comporta como sólido y como fluido.
Los materiales que se pueden considerar como sólidos de acuerdo con esta
defmición, se dividen en dos categorías: los amorfos y los cristalinos. Entre las
substancias amorfas, los átomos o moléculas pueden estar enlazados con bastante
firmeza entre sí; pero poseen poca o ninguna regularidad o periodicidad geométrica,
en la forma en que los átomos están dispuestos o acomodados en el espacio. Estas
substancias son casi siempre viscoelásticas y se pueden considerar como líquidos
sobreenfriados. En la figura 1.1 se muestra una representación bidimensional de un
material amorfo.
•o •o •o •o•
•o •o•o •o•
•o •o •o •o •
•o • o •o •o •
•o •o •o •o•
•o •o • • •
• o • o • oo • oo •
• • • • •
Cristalino
Figura 1.1.
•o • • o• •o•
o • o
•
•
•o • o o • o • o
• o •o••
•
•o o o • •o
• o• o o •
•o • • •
o •
o o o •o •
• • • • •
Amorfo
Representación esquemática en dos dimensiones, que muestra la düerencia existente
entre el arreglo atómico de un sólido cristalino y otro amorfo.
13
14 H.edes cristalinos y tipos de cristales
Por otro lado, las substancias cristalinas se caracterizan por una periodicidad
perfecta (o casi perfecta) en su estructura atómica; esta regularidad de estructura
proporciona un cuadro conceptual muy simple de un cristal y facilita la tarea de
comprender y calcular sus propiedades físicas. Por esta razón, los sólidos cristalinos
se comprenden mejor físicamente que los sólidos y líquidos amorfos. En este libro,
el tema se restringirá principalmente a un estudio de las propiedades físicas de los
sólidos cristalinos perfectos o casi perfectos. En algunas ocasiones, la presencia de un
número relativamente pequeño de imperfecciones tales como átomos de impurezas,
vacíos en la red o dislocaciones, en un cristal periódico que sería perfecto a no ser
por esta circunstancia, puede producir cambios notables en el comportamiento físico
del material. Esta obra se ocupará también de ellos según la importancia que revistan
dichos efectos.
Por último, es necesario comprender que las muestras macroscópicas de sólidos
cristalinos tales como metales, cerámicas, sales iónicas, etc., no siempre se componen
de un solo cristal, sino que a menudo están formados por un conjunto o conglomerado de pequeñas unidades de cristal -cada una con diferente orientación de
cristal- separadas entre sí por "fronteras o límites de grano" que se pueden considerar como regiones definidas de rupturas y dislocaciones reticulares muy grandes.
Principalmente se tratarán las propiedades de diferentes tipos de cristales individuales;
pero se intentará comprender la naturaleza de las fronteras o límites de granos y
sei'ialar las principales formas en que pueden influir en las propiedades físicas de las
muestras cristalinas macroscópicas.
1.2 CELDAS UNITARIAS Y REDES DE BRAVAIS
En la figura 1.2 se describe la estructura reticular de un cristal bidimensional
que se utilizará como ejemplo para explicar ciertos términos cristalográficos fundamentales. En relación con esta figura, se puede seleccionar el paralelogramo ABCD
como una celda unitaria de dicha estructura reticular o red, la cual está determinada
por los vectores base a y b. Todas las traslaciones del paralelogramo ABCD mediante
múltiplos enteros de los vectores a y b a lo largo de las direcciones a y b, darán
como resultado su traslación a una región del cristal exactamente igual a la original.
Así pues, todo el cristal se puede reproducir sencillamente si se reproduce la super-
Figura 1.2.
Celdas unitarias y vectores base en una estructura reticular bidimensional.
Celdas unittuios y redes de Bravais
15
ficie ABCD que se traslada sobre las direcciones a y b mediante todas las combinaciones posibles de múltiplos de los vectores base a y b. En otras palabras, cada
punto de la red del cristal se puede describir por medio de un vector r tal que
r =ha+ kb,
(1.2-1)
en donde h y k son enteros. Evidentemente, este procedimiento se puede ampliar
con suma facilidad para determinar celdas unitarias y vectores base en redes cristalinas tridimensionales. Por tanto, se puede llegar a las siguientes defmiciones:
Celda unitaria: una región del cristal defmida por tres vectores, a, b y e, que
al trasladarse por medio de cualquier múltiplo entero de dichos vectores
reproduce una región similar del cristal,
Vectores base: conjunto de vectores linealmente independientes a, b, e, que se
pueden usar para defmir una celda unitaria,
Celda unitaria primitiva: la celda unitaria más pequeiia (en volumen) que se
puede defmir para una red dada,
Vectores base primitivos: conjunto de vectores linea1mente independientes que
definen una celda unitaria primitiva.
De acuerdo con las anteriores defmiciones, en este caso también es evidente que
cada punto reticular de una red cristalina tridimensional se puede describir mediante
un vector de la forma
r =ha+ kb +le
(h, k, 1 enteros)
(1.2-2)
Conviene obserYar que la celda unitaria se puede defmir de varias maneras, po1
ejemplo, A'B'C 'D' y A"B''C "D" son otras posibilidades que describen la celda uni·
taria ilustrada en la figura 1.2. Estas tres celdas unitarias son de tipo primitivo para
esta red y, por ende, existe una ambigüedad correspondiente en la selección de un
conjunto de vectores base primitivos. Cualquiera de los vectores (a, b) o (a', b')
podría servir de igual manera. La celda de mayor tamaño EFGH de la misma figura
es un ejemplo de una celda unitaria que no es primitiva.
Se puede demostrar que existen 14 formas de acomodar los puntos en las
redes cristalinas, de tal modo que todos los puntos de dichas redes tengan exactamente el mismo medio circundante. Estas estructuras reticulares conocidas como
redes de Bravais se ilustran en la figura 1.3. En el caso de una de estas redes, un
observador que ve el cristal desde uno de los puntos de la red, vería exactamente la
misma disposición o arreglo de los puntos circundantes de la red, sea cual fuere el
punto que haya seleccionado para observar. A primera vista podría parecer que
puede existir otra red de Bravais; por ejemplo, en las 14 redes de Bravais de la
figura 1.3 no se incluye un arreglo tetragonal centrado en la cara. la razón de ello
es que esta estructura tetragonal centrada en la cara equivale a una red tetragonal
centrada en el cuerpo, en la que el lado de la base de la celda unitaria es 1/.¡2
veces su valor correspondiente a la disposición centrada en la cara. La demostración
de este postulado, y la pregunta acerca de por qué las estructuras cúbicas centrada
en la cara y centrada en el cuerpo son distintas, se le dejan al lector como ejercicio.
Estas 14 redes se pueden agrupar en siete sistemas cristalinos, cada uno de los
cuales tiene en común ciertos elementos de simetría característicos. Los elementos
de simetría que se han escogido para especificar estos siete sistemas son los siguientes:
16 Redes cristoliliiiS y tipos de cristales
/
/
/
V
Cúbica simple
Cúbica centrada en la base
./
7
./
[7
Tetragonal centrada
en el cuerpo
Tetragonal simple
V
Cúbica centrada en
la cara
V
Ortorrómbica
simple
Ortorrómbica
Ortorrómbica
Ortorrómbica
centrada en la base centrada en el cuerpo centrada en la cara
MonocHnica Monoclínica
simple
centrada en la base
Triclínica
Trigonal
e
Figura 1.3.
Las catorce redes de Bravais.
(1) Eje de rotación de orden n: la rotación alrededor de un eje de este tipo a
un ángulo de 21rjn radianes no produce ningún cambio en la estructura
reticular. En este caso, n puede tener los valores 1, 2, 3, 4 y 6. La simetría
rotacional de 5 veces en una red cristalina es imposible.
(2) Plano de simetría: una mitad del cristal reflejada en un plano semejante
que pasa por un punto de la red, reproduce la otra mitad.
Celdas unitarias y redes de Bravais
17
(3) Centro de inversión: un punto de la red alrededor del cual la operación
r-+ - r (en donde r es un vector a cualquier otro punto de la red) deja a
la estructura reticular sin sufrir cambio alguno.
( 4) Eje de rotación-inversión: la rotación alrededor de este eje a 2n/n radianes
(n = 1, 2, 3, 4, 6) seguida de una inversión alrededor de un punto de la red
por el que pasa el eje de rotación, no produce ningún cambio en la red.
Existen otras formas posibles de operaciones de simetría; pero se puede demostrar que todas son equivalentes a combinaciones lineales de estas cuatro. Los siete
sistemas cristalinos con sus elementos de simetría representativos y sus características
de celda unitaria aparecen en la tabla 1.1. En la figura 1.4 se describe la notación
que se emplea para las dimensiones y los ángulos de la celda unitaria.
TABLA l.l
Los siete sistemas cristalinos
Sistema
Elemento característico
de simetría*
Red de
Bravais
Triclínico
Ninguno
Simple
Monoclínico
Un eje de rotación doble
Simple
Centrada en
la base
Características de
la celda unitaria
a=l=b=l=c
a. = f3 = 90° =1= y
Ortorrómbico
Tres ejes de rotación doble
mutuamente perpendiculares
Simple
Centrada en
la base
Centrada en
el cuerpo
Centrada en
la cara
a=l=b=l=c
a. = f3 = y = 900
Tetragonal
Un eje de rotación cuádruple
o un eje de rotación-inversión
cuádruple
Simple
Centrada en
el cuerpo
a=b=l=c
a. = f3 = y = 900
Cúbico
Cuatro ejes de rotación triple
(diagonales cúbicas)
Simple
Centrada en
el cuerpo
Centrada en
la cara
a=b=c
a. = f3 = y = 90°
Hexagonal
Un eje de rotación séxtuple
Simple
a =b =1= e
a.= 120°
f3 =y= 90°
Trigonal
(Rombohédrico)
Un eje de rotación triple
Simple
a=b=c
a. = f3 = Y
-r 90·
*Por supuesto, pueden existir otras propiedades de simetría en casos individuales. aquí se
indican sólo los más peculiares de cada sistema cristalino en particular.
18 Redes cristalinas y tipos de cristales
b
~------b--------~
Figura 1.4.
Notación de los ángulos y las dimensiones dentro de la celda unitaria.
Conviene recordar que, por lo general, los puntos de la red de una estructura
reticular no representan a un solo átomo, sino más bien a un grupo de átomos o
molécula. En consecuencia, además de las propiedades de simetría de los puntos
reticulares propiamente dichos, se necesita tomar en cuenta las propiedades de simetría de las moléculas o grupos de átomos en cada punto reticular alrededor de los
puntos de red propiamente dichos, a fin de enumerar totalmente todas las estructuras cristalinas posibles. Cuando esto se hace, se descubre que hay 230 patrones
repetitivos básicamente diferentes en los que los elementos se pueden acomodar para
formar posibles estructuras cristalinas. Las limitaciones de este libro no permiten
estudiar y enumerar todas estas posibilidades en detalle. Si el lector desea obtener
datos más detallados sobre este tema, convendrá que consulte una de las obras que
tratan sobre cristalografía y que se citan al final de este capítulo.
1.3
ALGUNAS ESTRUCTURAS CRIST AUNAS SIMPLES
De acuerdo con la figura 1.3, es evidente que existen tres redes cúbicas posibles, es decir, la cúbica simple, la cúbica centrada en el cuerpo y la cúbica centrada
en la cara. La celda cúbica unitaria que se ilustra en la figura 1.3 como la red
cúbica simple, constituye también la celda unitaria primitiva, dado que contiene el
mínimo irreductible de un átomo por cada celda. Este resultado se obtiene observando que en la celda cúbica simple se tienen ocho átomos en los ocho vértices de
la celda, donde, cada átomo es compartido en la misma forma por ocho celdas
unitarias adyacentes a cada vértice. Por tanto, se puede decir que se tienen 8 átomos
en las esquinas y que 1/8 de cada uno de éstos pertenece a esta celda en particular,
dando un total de un átomo por celda unitaria. La celda cúbica correspondiente a la
estructura cúbica centrada en la cara, contiene 8 átomos en los vértices, compartidos
por 8 celdas y 6 átomos centrados en la cara, que son compartidos por dos celdas,
lo cual da un total de 8(1/8) + 6(1/2), o bien, 4 átomos dentro de la celda cúbica.
En la celda cúbica correspondiente a la estructura cúbica centrada en el cuerpo, se
tienen 8 átomos en los vértices compartidos por 8 celdas y un átomo central que
pertenece exclusivamente a dicha celda, dando un total de 8(1/8) + 1 ó 2 átomos
dentro de la celda cúbica. Para estructuras simples que contienen átomos de un solo
tipo, la celda unitaria primitiva contiene casi siempre un solo átomo y, por tanto, se
puede llegar a la conclusión de que la celda cúbica centrada en la cara y la centrada
en el cunpo no son primitivas. En efecto, este es el caso; las celdas primitivas para
las estructm:J<; cúhica crntrada en la cara y cúbica centrada en el cuerpo, se ilustran
Algunas estructuras cristalinas simples
19
Celda primitiva
cúbica centrada en la cara
Celda primitiva
cúbica centrada en el cuerpo
1
1
1
1
1
1
1
11
~--------4'
1
1
Figura 1.5.
Celdas unitaria~ primitivas de redes cúbicas centrada en la cara y centrada en el
cuerpo.
en la figura l.S. Cada celda primitiva contiene un solo átomo. Como siempre, estas
celdas primitivas no son las únicas que se pueden definir, ya que existen muchas
opciones posibles de grupos de vectores base primitivos para cualquiera de las estructuras.
La celda primitiva para la estructura cúbica centrada en la cara que se ilustra
en la figura 1.5 es, obviamente, un caso especial de una estructura trigonal en la
que a = {3 = 'Y = 60°. Para este valor particular de a, la estructura trigonal posee una
simetría cúbica y se reduce a la red cúbica centrada en la cara. Por supuesto, se
puede hacer caso omiso de la celda cúbica de la red cúbica centrada en la cara y
considerar que la estructura sea de tipo trigonal con a = 60°, empleando sólo la
celda primitiva de la figura l.S. Sin embargo, casi siempre conviene considerar la
mayor celda cúbica como la base del cristal, en lugar de utilizar la celda primitiva,
ya que esto permite representar la estructura reticular en un sistema de coordenadas
ortogonales (x, y, z) -el cual es mucho más simple que un sistema oblicuo- y porque
la red tiene todas las propiedades de simetría relacionadas con la estructura cúbica
simple. En el caso de la estructura cúbica centrada en el cuerpo, por similares
consideraciones, se aconseja usar, siempre que sP.a posible, la mayor celda cúbica
como la base del cristal. No obstante, para ciertos fines será absolutamente necesario
emplear la celda primitiva; pero estos casos especiales se señalarán cuando surjan.
Cuando se tienen esferas iguales dentro de un recipiente, el empaquetamiento
más cerrado o compacto que se puede lograr es tener una capa en la base en la que
cada esfera está rodeada por otras seis adyacentes, con capas exactamente iguales
encima de ella, utilizando los intersticios triangulares entre las esferas de la capa
inferior para acomodar las que se van agregando en la capa inmediatamente superior.
Es obvio que en un arreglo de empaquetamiento compacto cada esfera sólo tiene 12
vecinas adyacentes, seis que la rodean en la misma capa, 3 en la superior y. 3 en la
inferior. Cualquier estructura que tiene un empaquetamiento compacto en este sentido, se caracteriza por la propiedad de que cada átomo tiene 12 vecinos adyacentes
y, por lo contrario, no hay otra estructura en la que cada átomo tenga más de 12
vecinos cercanos.
20
Redes cristalinos y tipos de cristales
@ Posiciones para la tercera capa en h.e.c.
© Posiciones para la tercera capa
en cúbica centrada en la cara
c.c.c. de empaquetamiento
compacto
A
A
A
Figura ] .6.
Arre~( o de capas de empaquetamiento compacto en las redes cúbica centrada en la
eara con empaquct~miento compacto y la hexagonal con empaquetamiento comp;wto. [Tomado l"Oil autorización de L. V. Azaroff, Introduction to Solids, McC.raw-Hill (1960), pá¡>;ina 1)0.1
Algunas estructuras cristalinas simples
21
Para tener una estructura con esta clase de empaquetamiento compacto, se
puede colocar una capa inferior A, luego una segunda capa B -tal como se describió
en el párrafo anterior-, después se pone una tercera capa en la que los átomos
quedan directamente arriba de los de la capa A, a continuación, la cuarta capa
cuyos átomos se ubican directamente arriba de los de la capa B, y así sucesivamente
hasta formar un arreglo de capas ABABABAB ... , como se ilustra en la figura 1.6.
Esta estructura tiene una Simetría hexagonal y se le conoce con el nombre de
estructura hexagonal de empaquetamiento compacto (h.e.c.). De igual modo, se pueden colocar los átomos de la tercera capa ya no directamente encima de los de la
primera, sino en una tercera gama de posiciones como se ilustra en la figura 1.6,
formando la tercera capa C cuyos átomos quedan arriba, en una posición diferente a
los de las capas A y B. A continuación se agrega la cuarta capa en las posiciones
correspondientes a la capa A y se forma una disposición de capas ABCABCABC ...
Esta segunda estructura ·posible de empaquetamiento compacto es sencillamente, la
cúbica centrada en la cara, que es la normal en las capas de empaquetamiento
compacto de la estructura diagonal cúbica. De acuerdo con la figura 1.3, se puede
ver claramente que cada átomo de la estructura cúbica centrada en la cara tiene sólo
12 vecinos contiguos, a una distancia de ..j2(2 veces el lado del cubo, por lo que la
estructura debe ser de empaquetamiento compacto. Por el contrario, en la estructura
cúbica centrada en el cuerpo, cada átomo tiene sólo 8 vecinos adyacentes a una
distancia de ../'f/2 veces el lado del cubo; si los puntos reticulares de la estructura
cúbica centrada en el cuerpo se observaran como si fueran esferas en expansión,
éstas tocarían el borde del cubo antes de rozar la diagonal y la estructura resultante
no tendría un empaquetamiento tan compacto.
En la figura l. 7 se muestran las estructuras de NaCl y CsCI. La estructura del
NaCI tiene átomos alternantes de Na y Cl en los puntos reticulares de una red
cúbica simple. Los átomos de Na quedan en los puntos reticulares de una estructura
cúbica centrada en la cara, al igual que los átomos de Cl. La estructura del CsCl es
básicamente centrada en el cuerpo y, en ella, los átomos de Cs quedan en las
posiciones centradas en el cuerpo y los de Cl en los vértices del cubo (o viceversa).
Hay un gran número de cristales iónicos que cristalizan en cualquiera de estas dos
formas reticulares.
/
/
L
~
V
/
~
V
/
/
V
V
V
V
V
V
(O) NoCI
Figura 1.7.
V
V
(b) CsCI
Las estructuras de NaCI y CsCI.
En la figura 1.8 se ilustran las estructuras del diamante y la zincblenda. Las
líneas que conectan los átomos de estas estructuras representan los enlaces covalentes
de los pares de electrones que están dispuestos tctrahédricamente alrededor de cada
átomo. En estas dos estructuras, cada átomo tiene cuatro vecinos contiguos. En el
caso del diamante, la estructura se puede considerar como dos redes cúbicas centra·
das en la cara que se intercalan una en la otra, desplazándose entre sí a lo largo de
la diagonal del cubo en 1/4 de la longitud de dicha diagonal. Por tanto, la re.d tiene
22
Redes cristaliTUlS y tipos de cristales
{al
Zincblenda
{ZnS)
Figura 1.8.
Figura 1.9.
{ b)
Diamante
Estructuras de la zincblenda y el diamante.
Diagrama de la estructura reticular de la zincblenda en donde se muestran los
contornos lk la n:lcla unitaria cúbica.
Planos cristalinos e índices de Miller
23
una simetría cúbica. La descripción anterior de la red del diamante se puede entender mejor estudiando la figura 1.9 en donde se muestra cómo la red del diamante se puede describir mediante una celda unitaria cúbica. El silicio, el germanio y el
estaño a- (gris) se cristalizan también en la estructura del diamante. La estructura de
la zincblenda está íntimamente relacionada con la del diamante. En el caso de la
zmcblenda, la estructura se puede representar como dos redes cúbicas centradas en
la cara que tienen una interpenetración, al igual que el diamante, excepto que una de
las redes cúbicas centradas en la cara se compone por completo de átomos de zinc y
la obra está constituida totalmente por átomos de S. Por supuesto, esta estructura
reticular también tiene simetría cúbica. Los compuestos semiconductores III-V,
InSb, GaAs, GaSb, InP, GaP, etc., se cristalizan con esta misma estructura.
Lo "compacto" del empaquetamiento de los átomos en cualquier estructura
dada se puede inferir del número de vecinos más cercanos que rodean a cada átomo.
Esta cifra, que con frecuencia se denomina número de coordinación del cristal,
puede variar de un máximo de 12 en las estructuras de empaquetamiento compacto
hasta el 4, en el caso del diamante y la zincblenda, cuyas estructuras son relativamente "abiertas".
1.4
PLANOS CRISTALINOS E INDICES DE MILLER
En un cristal de red periódica regular, con frecuencia es necesario mencionar el
sistema de planos dentro del cristal que corren en ciertas direcciones, cortando varios
conjuntos de átomos. Así pues, las capas con empaquetamiento compacto de las
redes cúbicas centradas en la cara y hexagonal con empaquetamiento compacto,
forman sistemas muy definidos e importantes de planos cristalinos. La orientación de
estos sistemas de planos dentro del cristal se especifica mediante tres números denominados índices de Miller, que se pueden determinar como sigue:
(1) Se toma como origen cualquier átomo del cristal y se levantan ejes de
coordenadas a partir de dicho átomo en las direcciones de los vectores
base.
(2) Se encuentran las intersecciones de un plano que pertenece al sistema,
expresándolos como múltiplos enteros de los vectores base a lo largo de
los ejes cristalinos.
(3) Se sacan los recíprocos de estos números y se reducen a la tríada más
pequeña de enteros h, k, l, que tienen la misma relación. De donde, la
cantidad (hk/) constituye lol> índices de Miller de dicho sistema de planos.
Por ejemplo, en la figura 1.1 O se muestra un plano cuyas intersecciones son el
doble de la distancia reticular a, tres veces la distancia reticular b y 4 veces la
distancia reticular c. Los índices de Miller de la familia a la que pertenece este
plano se obtienen sacando los recíprocos de estos números, es decir, 1/2, 1/3, 1/4, y
reduciéndolos a la tríada más pequeña posible de enteros que tengan la misma
relación. Esto se logra multiplicando cada uno de los recíprocos p0r doce, que en
este caso dan 6, 4, 3. Los índices de Miller se escriben simplemente encerrando estos
tres números entre paréntesis; en este ejemplo, el plano forma parte de una familia
de planos (643) o sea, un plano.
Puede haber un número de sistemas de planos cuyos índices de Miller difieran
por permutación de los números o de signos menos y, sin embargo, ser todos
cristalográficantente equivalentes en lo que respecta a densidad de átomos y espa-
24 Redes cristalinas y tipos de cristales
Figura 1.10.
Un plano reticular (643) de una red cristalina.
ciamiento interplanar. Por ejemplo, en una red ortogonal, los siguientes planos
(Jzkl), (hkl), (hKl), (hkl), (ftld), (fikl), etc., obtenidos al asignar varias combinaciones de
signos menos a los índices de Miller, son equivalentes en este sentido. (Se acostumbra escribir los signos menos encima y no antes de los índices de Miller.) De igual
modo, en una estructura reticular cúbica, todos los planos representados por permutaciones de los tres índices de Miller entre sí mismos, tales como (hkl), (khl), (lhk),
etcétera, al igual que los que se obtienen tomando varias combinaciones de signos menos, son cristalográficamente equivalentes. C'uando se hace referencia a un grupo
completo de planos cristalográficamente equivall'ntes, de los cuales (hkl) ~s un miembro, se acostumbra encerrar los índices de Miller entre llaves, o sea, { hkl}.
Si el plano es paralelo a uno o dos de Jos vectores a, b, e, una o dos de las
intersecciones se localizarán en el infinito; los índices de Miller correspondientes son,
por tanto. cero. Por ejemplo, si el plano que se ilustra en la figura 1.1 O se hace
girar alrededor de la línea AB hasta que queda paralelo a e, las intersecciones se
convierten en 2, 3, oo, y los índices de Miller son, en consecuencia (320). Si se hace
girar más todavía alrededor de una línea perpendicular al plano a y b pasando por
el punto A hasta que quede en paralelo a b, las intersecciones serán 2, oo, uo, y los
índices de Miller son (1 00). El lector debe conocer a fondo las familias de planos
{ 100} (planos de cara cúbica), { 11 O } y de {111} para las redes cúbicas.
Los índices de una dirección dentro de un cri~tal se pueden expresar como un
conjunto de enteros que tienen la misma relación que los componentes de un vector
en esa dirección, expresados como múltiplos de los vectores base a, b, c. Por tanto,
el índice de dirección de un vector ha+ kb +le es, en todo caso, [hkl]. Los paréntesis cuadrados que encierran las tres cifras señalan los tres índices de dirección. Por
supuesto, las direcciones con distintos índices direccionales pueden ser cristalográficamente diferentes en la misma forma que los planos cristalinos con distintos
índices de Miller; sobre todo las normales a los planos cristalográficamente equivalentes también deben tener direcciones cristalográficamente equivalentes. El conjunto
completo de direcciones cristalográficamente equivalentes de las cuales [hkll es un
miembro, se expresa encerrando los índices de dirección en la siguiente forma: (hk[).
En cristales cúbicos, una dirección con índices direccionales [hkl] es normal a un
plano cuyos índices de Miller son (hkl); pero, por lo general, esto no se aplica a
otros sistemas. Esta es otra de las razones aceptables para relacionar las redes cúbicas
centradas en el cuerpo y la centrada en la cara con estructuras cúbicas más que con
celdas unitarias primitivas. El comprobar este resultado queda como ejercicio para el
lector.
La posición de los puntos de una celda unitaria se especifica en función de las
partes fraccionales de las magn1tudes de los vectores de base a lo largu de las
direcciOne~ de coordenadas correspondientes, tomando siempre como origen el átomo
Espaciamiento de los planos en las redes cristalinas
25
de un vértice. Por ejemplo, las coordenadas del punto central de una celda unitaria
son {1/2, 1/2, 1/2) y las coordenadas de los centros de las caras son (1/2, 1/2,
0), (0, 1/2, 1/2), (1/2, O, 1/2), (1/2, 1/2, 1), (1, 1/2, 1/2) y (1/2, 1, 1/2).
1.5
ESPACIAMIENTO DE LOS PLANOS EN LAS REDES CRISTALINAS
De acuerdo con la figura 1.1 O, se podría pensar que el espaciamiento existente
entre los planos vecinos del sistema (hkl) sería simplemente igual a la longitud de la
normal al plano definida por las intersecciones dadas y el origen. Sin embargo,
generalmente no es así y la razón es que al determinar la ubicación de un plano
(hkl) desde ciertas distancias de intersección, el origen se podría tomar como cualquier punto reticular del cristal, por lo que un plano (hkl) debe pasar por cada
punto reticular del cristal. Esto se ilustra gráficamente en la figura 1.11 para el caso
de un conjunto de "planos" en una estructura reticular bidimensional. El sistema de
planos es el que determinan las intersecciones 3a y 2b a lo largo de los ejes, a y b,
respectivamente. En consecuencia, los índices de Miller son (23) (o bien, (230) si se
piensa que los planos son paralelos a un eje e que sale del plano de la hoja de papel
en un cristal tridimensional). Los planos que están delineados con líneas más gruesas
son los que se determinan por medio de las distancias de intersección (3a, 2b) y el
origen se escoge en O. No obstante, el origen podría haberse escogido en el punto
reticular número "1 ", en cuyo caso se habrían definido los planos de trazo más
ligero marcados con "1 ", utilizando el mismo conjunto de distancias de intersección.
De igual manera, el origen se podría haber ubicado en los puntos reticulares 2, 3, 4
ó 5, en cuyo caso, usando todavía el mismo conjunto de distancias de intersección,
el conjunto de planos números 2, 3, 4 y 5 habrían quedado definidos. Sin embargo,
ahora se tiene un plano de esta familia que pasa por cada átomo del cristal, entre
Figura I.l L
Una representación de todas las líneas (23) dentro de una red bidimensional.
Si existe un eie e- normal al nlano del papel, este sistema de líneas se puede considerar como los tra10s de planos (230) (que son normales a la página) en el plano
del papel. Observe que sólo se tiene una línea (o plano) del sistema que pasa pnr
cada punto reticular.
26 Redes cristalinos y tipos de cristales
los cuales se intercalan 5 planos adicionales entre cada par de planos originales de
trazo grueso. Ahora se ve que las intersecciones de los planos adyacentes a lo largo
de los ejes a y b difieren, respectivamente, en a/2 y b/3. Para un .conjunto de índices de Miller (hk) estas intersecciones diferirán en a/h y b/k.
Para demostrarlo, véase primero el área OA CB de la figura 1.11. Se tienen los
puntos reticulares hk que pertenecen a esta área, ya que consiste en hk celdas
unitarias que tienen cada una de ellas un solo punto reticular. La región ABCD, que
obviamente equivale en superficie a OACB (ambas se pueden tomar como superposiciones de dos triángulos congruentes a OAB) por tanto, también tiene hk puntos
reticulares. Esta superficie también contiene sólo hk planos reticulares (6 en el ejemplo anterior), uno por cada uno de los puntos reticulares hk dentro del área. Se
observará que cada plano puede cortar sólo un punto reticular dentro de ABCD,
excepción hecha de los planos que cortan los puntos reticulares de las fronteras, que
pueden pasar por dos puntos reticulares, de los cuales un medio o un cuarto pueden
pertenecer a ABCD, dependiendo de que dichos puntos reticulares así intersecados
representen átomos laterales o de vértices. En consecuencia, en ABCD hay hk planos
del sistema que se intersecan con el eje b dentro de una distancia hb, siendo la
diferencia que hay entre las intersecciones b de los planos adyacentes, hb/hk = b/k.
De la misma manera, en el área ABEC que también es igual en superficie a OACB y
que contiene también hk puntos reticulares y hk planos, se observa que se tienen hk
que cortan el eje a en una distancia ka, en donde la diferencia existente entre las intersecciones a de los planos adyacentes del sistema es afh. Para simplificar los conceptos
geométricos, este resultado se obtuvo para un cristal bidimensional (o para planos
paralelos al eje e de un cristal tridimensional). Sin embargo este mismo argumento se
puede ampliar en una forma muy directa para un conjunto de planos (hk{) de un
cristal tridimensional teniendo como resultado el hecho de que las distancias entre
las intersecciones entre los ejes y los planos adyacentes de un sistema con índices de
Miller (hkl) a lo largo de los ejes a-, b- y e- son, respectivamente, afh, b/k y cfl.
El desarrollo de la exposición para un cristal tridimensional queda de ejercicio para
que el lector lo resuelva.
El espaciamiento real d que hay entre los planos adyacentes se puede calcular
tomando cualquier punto reticular como origen, levantando ejes en las direcciones
b
k
Figura 1.12.
Angulas direccionales de la normal al plano (hkl).
Qasificación general de ~os cristales
27
a-, b- y e-, y encontrando la distancia perpendicular existente· entre este origen y
el plano cuyas intersecciones con el eje son afh, b/k y cfl. En relación con la figura 1.12, es obvio que
a
b
e
d = OP = h cos rx = k cos fJ = l cos y,
(1.5-1)
en donde a, {3, 'Y son los ángulos que hay entre la nonnal al plano y los ejes a-, bY e-, respectivamente. No obstante, si n es el vector unitario nonnal al plano, se
tiene que n • a =a cosa, etc., y
n·a
n·b
n·c
(1.5-2)
d=-=-=h
k
l .
En una red ortogonal, tomando el eje de la coordenada x a lo largo de a, el
eje y sobre b y el eje z sobre e, la ecuación del plano (hkl) cuyas intersecciones con los
ejes son a/h, b/k, cfl, es
hx
f(x,y,z)
ky
lz
=-; + b +e = l.
(1.5-3)
Si f(x, y, z) =constante es la ecuación de una superficie, entonces Vf es un
vector nonnal a dicha superficie y la unidad nonnal n está dada por
(hfa)i" + (k/b)i, + (lfc)iz
Vf
0 =
\-Vf-1 = "'--"-........;;;J'":-h-2..;. . .;. . . ;k2-<--l....:.2.;.....;....=.,
(1.5-4)
2+b2+2
a
e
y el espaciamiento d'que hay entre los planos adyacentes (hkl) es simplemente
n·a
d= -
h
=
1
Jh2 k2 [2
2+b2+2
a
e
,
(1.5-5)
de acuerdo con (1.5-2). En este punto conviene observar que a, b y e no son
vectores unitarios, en este ejemplo, a = aix, b = biy y e = ciz, en donde ix, iy e iz
son la tríada usual de vectores unitarios a lo largo de las direcciones x-, y- y z-,
respectivamente. En estructuras reticulares no ortogonales, el problema de encontrar
el espaciamiento existente entre planos adyacentes en ténninos explícitos de los
espaciamientos y los ángulos reticulares se hace más complejo y no se estudiará en
esta obra, aunque las expresiones generales (1.5-1) y (1.5-2) son correctas tanto para
sistemas ortogonales como para los no ortogonales.
1.6
CLASIFICACION GENERAL DE LOS CRISTALES
Para darle al lector una imagen inicial amplia de las propiedades y las características de varios tipos de materiah:s cristalinos, se hará un repaso breve de algunas de las
características más sobresalientes de varias clases de cristales. Por supuesto, se pueden
28 Redes cristalinas y tipos de cristales
clasificar en muchas formas, por ejemplo, según sus redes cristalinas, propiedades
eléctricas, propiedades mecánicas o características químicas. Sin embargo, para el
estudio que nos ocupa, es más conveniente adoptar un esquema de clasificación
basado en el tipo de interacción que hace que los átomos del cristal se mantengan
unidos. De acuerdo con este esquema de clasificación, los sólidos se subdividen en
cuatro categorías generales: iónicos, covalentes, metálicos y moleculares. Cada una de
estas clases se examinará en lo particular, aunque se reconoce que no son absolutamente distintos y que algunos cristales pueden posser, al mismo tiempo, características relacionadas con más de una de estas clases generales.
Los iónicos son cristales en los que los electrones de valencia se transfieren de
un átomo a otro, dando como resultado que el cristal esté compuesto de iones
positivos y negativos. La fuente de energía cohesiva que mantiene unido al cristal es
la intersección electrostática de estos iones. La configuración electrónica de los iones
es esencialmente la de un gas inerte, en donde la distribución de carga de cada ion
es esféricamente simétrica. Los compuestos químicos que contienen átomos muy
electropositivos y electronegativos, por ejemplo, NaCl, KBr, LiF, tienden a formar
cristales iónicos en estado sólido. Casi siempre los cristales iónicos tienen energías de
enlace relativamente altas y, como resultado, se caracterizan por puntos de fusión y
ebullición más o menos elevado. También se caracterizan por ser malos conductores
eléctricos a temperaturas normales y casi siempre son transparentes a la luz visible
en tanto que muestran un solo pico de reflexión óptico característico en la región
lejana infrarroja del espectro. Los cristales son a menudo muy solubles en disolventes
ionizantes tales como el agua, y sus soluciones se disocian fácilmente en iones libres.
Casi siempre los cristales iónicos se cristalizan en estructuras de empaquetamiento
relativamente compacto como las del NaCl y el CsCI.
Los cristales covalentes son aquellos en los que varios átomos comparten equitativamente los electrones de valencia en lugar de transferirlos de unos a otros, como
sucede en los cristales iónicos. De donde, no se tiene una carga neta asociada con
ningún átomo del cristal. A menudo los elementos de las columnas III, IV y V de la
tabla periódica forman combinaciones covalentes. Un ejemplo típico de cristal cavalente lo tenemos en el diamante, en el que cada átomo de carbono comparte sus
cuatro electrones de valencia con sus cuatro vecinos más cercanos formando enlaces
covalentes de pares de electrones. Los espins de los electrones de estos enlaces de
par de electrones son antiparalelos. Estos enlaces covalentes de pares de electrones
del diamante son idénticos a las uniones carbono-carbono que se encuentran tan
frecuentemente en los compuestos orgánicos. Tienen una naturaleza muy direccional,
es decir, los electrones tienden a concentrarse a lo largo de las líneas que unen a los
átomos adyacentes y estas líneas tienden a ubicarse tetrahédricamente alrededor de
cualquier átomo. Esta disposición tetrahédrica natural de los enlaces covalentes se
satisface en las estructuras del diamante y la zincblenda y se ha descubierto que los
cristales covalentes tienen a menudo estas estructuras. Por lo general, los cristales
covalentes son materiales duros, quebradizos y de energías de enlace bastante elevadas, con puntos de fusión y ebullición elevados. Son semiconductores típicos cuya
conductividad eléctrica es muy sensible a la presencia de pequeñas cantidades de
átomos de impurezas y aumenta al incrementarse la temperatura a niveles lo suficientemente elevados. Son transparentes a la radiación de longitudes de onda largas y
opacos a longitudes de onda más cortas, con una transición abrupta que se produce
a una longitud de onda característica y que casi siempre se localiza en la región
visible o infrarroja cercana.
Existe un rango continuo entre las propiedades covalente e iónica; un cristal
dado puede tener naturaleza tanto covalente como iónica y sus electrones de valencia se transfieren en parte y se comparten parcialmente. En la tabla 1.2, los
cmtales de la primera columna se componen de átomos de la columna IV del
Dosificación general de los cristales
29
TABLA 1.2.
Cristales covalentes y iónicos
Covalentes
(Grupo IV)
e (diamante)
SI
Ge
cx-Sn
Compuestos
III-V
Compuestos
11-VI
Compuestos
{iónicos)
I-VII
BN
BP
AIN
AIP
GaP
AlAs
BeO
BeS
MgO
MgS
CaO
Ca S
ZnS
CaSe
ZnSe
CdS
CdSe
ZnTe
CdTe
LiF
LiCI
NaF
NaCI
KF
KCI
LiBr
KBr
Nal
RbCI
RbBr
KF
Rbl
CsBr
GaAs
InP
AISb
GaSb
InAs
InSb
sistema periódico y forman cristales completamente covalentes. Los compuestos de la
cuarta columna de la tabla son de '"I y VII" y están constituidos de átomos muy
electropositivos y electronegativos y los cristales de estos compuestos son muy iónicos. La segunda y la tercera columnas contienen compuestos (II-Vl y lll-V) que son
intermedios entre estos dos extremos y tienen naturaleza tanto iónica como cavalente. Por supuesto, los compuestos 111-V son un poco más covalentes que los compuestos 11-VI. Los compuestos intermetálicos III-V forman, a pesar de su carácter
ligeramente iónico, una serie de semiconductores cuyas propiedades son similares en
muchas formas a las de Jos materiales correspondientes del grupo IV.
Los elementos metálicos en estado libre forman cristales metálicos en los que
están presentes electrones libres. El hecho de que haya tales electrones libres explica
la elevada conductividad eléctrica y térmica de los metales. A su vez, a esta elevada
conductividad eléctrica se deben directamente los elevados coeficientes de reflexión y
absorción ópticas que son las propiedades ópticas más típicas de los metales. Las
propiedades eléctricas y térmicas de los metales que se deben a la existencia de los
electrones libres, se pueden explicar fácilmente si se supone que el cristal metálico es
un recipiente lleno de un "gas ideal de electrones libres". La energía de enlace de
metales "ideales" tales como los metales alcalinos, se originan en la interacción del
gas de electrones libres con iones positivos de la red, aunque para muchos otros
metales esta imagen es mucho más compleja. Las energías de enlace reales de los
cristales metálicos pueden ser muy bajas, como sucede en el caso de los metales
alcalinos, que tienen puntos de ebullición y fusión relativamente bajos o muy elevados, como el tungsteno. cuyo punto de fusión es muy alto.
Los cristales moleculares son aquellos en los que el enlace entre átomos o las
moléculas no es iónico ni covalente, sino que se origina exclusivamente en fuerzas
dipolares existentes entre los átomos o las moléculas del cristal. A pesar de que un
átomo o una molécula no tiene un momento dipolar promedio, por lo general tendrá
un momento dipolar instantáneo y fluctuante que se origina en las posiciones instantá-
30 Redes cristalinas y tipos de cristales
neas de los electrones dentro de sus órbitas. Este momento dipolar instantáneo
es la fuente de un campo dipolar electrostático que, a su vez, puede inducir un momento dipolar en otro átomo u otra molécula. La interacción existente entre el momento dipolar original y el inducido es de atracción y puede servir para unir un
cristal en ausencia de un enlace de tipo iónico y covalente. Las fuerzas de enlace
que se originan en interacciones dipolares fluctuantes de esta naturaleza se conocen
con el nombre de fuerzas de van der Waals. Casi siempre, estas fuerzas son muy
débiles y la energía de enlace que originan disminuye según l/r6 , en donde r es la
distancia entre los dipolos. Entonces, los cristales moleculares se caracterizan por
energías de enlace reducidas y, en consecuencia, por puntos de fusión y ebullición
bajos; por lo general son conductores eléctricos deficientes. Los cristales de compuestos orgánicos generalmente pertenecen a esta clase, como es el caso' de los gases
inertes He, Ne, A, etc., en estado sólido.
EJERCICIOS
l. Demuestre geométricamente que la estructura tetragonal centrada en la cara es equivalente a una red tetragonal centrada en el cuerpo en la que el lado de la base de la celda unitaria
es 1/.,¡2 veces la magnitud que tiene para la disposición centrada en la cara. ¿Por qué son
distintas las estructuras cúbicas centrada en la cara y la centrada en el cuerpo?
2. Demuestre que la proporción máxima de espacio que se puede llenar con esferas sólidas
acomodadas en varias estructuras es la siguiente para cada arreglo
Cúbica centrada en el cuerpo
7T/6,
7Tv' 3/8,
Cúbica centrada en la cara
7Tv'1¡6,
Hexagonal con empaquetamiento compacto
7Tv'2/6,
7Tv'3!t6.
Cúbica simple
Estructura del diamante
3. Analice desde el punto de vista físico el porqué un cristal real no puede tener un eje
de un múltiplo de cinco de simetría rotativa.
4. (a) Dibuje los bosquejos que ilustren Jos planos (100), (110) y (111) para una celda
•
unitaria cúbica.
(b) ¿Cuántos planos equivalentes {lOO'}, ( 110} y { 111} existen en un cristal cúbico?
Considere que los planos (hkl) y (hkl) son idénticos.
5. (a) ¿Cuántos planos equivalentes {123} existen en un cristal cúbico?
(b) ¿Cuántos planos equivalentes { 111} existen en un cristal ortorrómbico?
(e) ¿Cuántos planos equivalentes { 123} existen en un cristal ortorrómbico? En todos
estos casos se considerará que los planos (hkl) y (hkl) son idénticos.
6. Demuestre que en un cristal cúbico la dirección [hkl] es normal al plano (hkl).
7. Demuestre que las intersecciones entre los ejes y Jos planos adyacentes (hkl) a Jo largo
de los ejes, a-, b- y e- dentro de una estructura tridimensional son a/h, b/k y e/1, respectivamente, utilizando una extensión de los métodos que se usaron en el caso bidimensional dt' la
sección 1.5.
8. Demuestre que para las fuerzas de van der Waals, la energía de interacción de los
átomos y las moléculas desciende en la forma lfr6, en donde r es la distancia que hay entre
los átomos o las moléculas interactuantes. Nota: principie teniendo en cuenta la energía potencial
de un dipolo eléctrico en un campo eléctrico externo.
9. De acuerdo con los resultados de la teoría electromagnética de Maxwell para ondas
planas, demuestre que en el caso de un conductor muy bueno (a~oo, K ~oo, a= conductividad,
K =constante dieléctrica) se debe esperar un alto grado de reflectividad superficial y una gran
absorción interna.
CAPITULO
2
Análisis cristalográfico
con rayos X
1.1
INTRODUCCION
El uso de la difracción de los rayos X como técnica para analizar la estructura
de los cristales, data del descubrimiento de los efectos de difracción de los rayos X
en muestras de un monocristal, efectuado por von Laue en 1912. Laue predijo que
:0s átomos de un espécimen monocristalino producirían la difracción de un haz de
::o~ os X monocromático y paralelo, originando una serie de haces difractados cuyas
.:!necciones e intensidades dependerían de la estructura reticular y la composición
":.~ímica del cristal. Estas predicciones se verificaron en un plazo muy corto, gracias
1 los trabajos de Friedrich y Knipping. En la figura 2.l(a) se muestra un diagrama
esquemático del arreglo experimental correspondiente. La ubicación de los máximos de
difracción fue explicada por W. L. Bragg, 1 a base de un modelo muy simple en el que
;.e supone que la radiación X se refleja especularmente desde los planos sucesivos de los
fi!~Jra
2.1.
1 W.L.
(a) Diagrama esquemático de la difracción de rayos X obtenida con la técnica de
Laue.
Bragg, Proc. Cambrige Phil. Soc. 17, 43 0912).
31
32 Análisis cristalográfico con rayos X
Figura 2.1.
(continúa) (b) Un patrón de difracción de Laue de un cristal de fluoruro de litio,
haz incidente de rayos X a lo largo de una dirección { 100} (fotografía por cortesía de H. A. McKinstry, Materials Research Laboratory, Pennsylvania Sta te University).
471"
~~--~~----~~L-~~--~~~----~~----~671"
Planos
del cristal
AB = AC =d sen 8
Figura 2.2.
Representación de Bragg de una difracción de rayos X, de acuerdo con reflexion.:s
en fase desde planos sucesivos de un sistema particular (hk/).
Introducción
33
diversos sistemas (hkl) del cristal, y en el que los máximos de difracción sólo se encuentran para direcciones de incidencia y reflexión tales que las reflexiones de los planos
adyacentes de un sistema interfieran en forma constructiva, con diferencias de fase de
2rrn radianes, en donde n es un entero.
Según este experimento, la diferencia de trayectoria para reflexiones sucesivas
sería igual a un número entero de longitudes de onda de los rayos X. Sin embargo,
esta diferencia de trayectoria, de acuerdo con la figura 2.2, es 2d sen e, en donde d
es el espaciamiento entre planos átomicos adyacentes, tal y como lo dan las expresiones (1.5-2) o (1.5-5) y e es el ángulo de incidencia entre el plano atómico y el
haz incidente. Por tanto, los haces fuertemente difractados deben propagarse, fuera
del cristal, en direcciones para las que se satisface la ecuación de Bragg
nA.= 2d sen e
(2.1-1)
A partir de 1916, la observación experimental de los patrones de difracción de
rayos X se simplificó enormemente gracias a la introducción del método de potencia
de Debye y Scherrer. 2 Como se ilustra en la figura 2.3(a), en este método se deja
pasar un haz monocromático paralelo lit> rayos X a través de un espécimen finamente pulverizado. En forma puramente accidental, algunos de los microcristales del
espécimen pulverizado estarán orientados en el ángulo correcto de difracción para un
conjunto particular de planos (hkl), como se expresa en (2.1-1) y el haz difractado
'
.
'
.
\'
'
.
1
)\
;
¡
(b)
Figura 2.3.
2 P.
(a) Diagrama esquemático de la difracción de rayos X obtenida con la técnica del
polvo de Debye-Scherrer. (b) Un patrón de difracción de polvo, de Debye-Scherrer
a partir de una muestra de un óxido compleJO de escandia y circonio (fotografía
por cortesía de H. A. l\lcKimtry, Materials Research Laboratory, Pennsylvania State
University).
Debye y P. Scherrer, Physikal, Zeitschr. 17, 277 (1916).
34
Análisis cristalográfico con rayos X
se produce inmediatamente. Puesto que la condición de difracción se puede satisfacer
para cualquier orientación angular posible </> de la normal a los planos de dispersión
alrededor del eje del haz incidente, y dado que siempre habrá microcristales orientados en tal forma que produzcan la difracción (hkf) para cualquier valor de </>, el
haz difractado tendrá la forma de un cono cuyo ángulo de abertura es e y no sólo
un haz de rayos. Se acostumbra colocar una tira de película en la pared interior
de una cámara cilíndrica, concéntrica con la muestra, con el fin de interceptar una
porción específica de estos conos de difracción, que son una serie de arcos producidos sobre dicha película. En la figura 2.3(b) se ilustra un patrón pulverizado
logrado mediante este sistema.
2.2
FISICA DE LA DIFRACCION DE LOS RAYOS X:
LAS ECUACIONES DE VON LAUE
Los rayos X se pueden producir fácilmente permitiendo que electrones de alta
energía choquen contra un ánodo metálico que constituye el blanco. Los rayos X
producidos en esta forma poseen, además de un espectro de fondo continuo, algunas
líneas espectrales muy intensas y casi monocromáticas cuya frecuencia es característica del material del blanco. Estas líneas se originan debido al paso de electrones
de capas internas del átomo a estados de mayor energía de los cuales se apartan
para volver al estado base original con la consecuente emisión de rayos X. La
producción de rayos X debido a la interacción de electrones de alta energía con la
materia se analiza más detalladamente en la obra de Leighton. 3
Si existe un potencial V0 entre el cátodo y el ánodo de un tubo de rayos X,
los electrones adquieren una energía eV0 -en donde e es la magnitud de la carga
electrónica- al llegar al ánodo. El cuanto de rayos X más energético que pueden
producir tales electrones es aquel para el que la energía del cuanto hv es igual a
eV0 • En consecuencia, para este cuanto,
eV0 = hv =he/A.,
(2.2-1)
en donde h( = 6.62 x 10- 27 erg-seg) es la constante de Planck. De donde, la longitud
de onda de rayos X más corta que se puede producir es
A.=~
l/ .
e o
(2.2-2)
Para un voltaje de 10 kilovolts, esto demuestra que la longitud de onda mínima
de rayos X que se puede excitar es 1.24 x I0- 8 cm o sea, 1.24 unidades Angstrom.
Esta magnitud es del orden de las distancias interatómicas de cristales reales y, de acuerdo con la ecuación de Bragg (2.1-1), es la apropiada para producir efectos de difracción
observables sin recurrir a valores extremos de d y e. Por tanto, en un tubo de rayos X
en el que los electrones se aceleran mediante un potencial de unas cuantas decenas de
kilovolts, se puede considerar satisfactorio para producir rayos X apropiados para el
trabajo de difracción cristalográfica.
3 R B. 1 ei¡•hton, l'rinl"iples o( Modern Physics, McGraw-Hill Book Co., Inc. Nueva York
(1959), p 405 d 21.
Física de la difracción de los rayos X
35
Cuando los átomos de un cristal están sometidos a una radiación electromagnética, por ejemplo, los rayos X, se ejercen sobre ellos fuerzas eléctricas debidas a la
interacción de las partículas cargadas de los átomos con el vector del campo eléctrico de la onda electromagnética. Debido a esto, los electrones atómicos vibran
armónicamente a la frecuencia de la radiación incidente sufriendo una aceleración.
Estas cargas aceleradas vuelven a irradiar energía electromagnética, de acuerdo con la
teoría electromagnética, a la frecuencia de vibración, es decir, a la de la onda
incidente. A las frecuencias de la luz visible en donde la longitud de onda incidente
es mucho mayor que las distancias interatómicas, la superposición de las ondas
reirradiadas o dispersas en esta forma por los átomos individuales del cristal, produce
solamente los efectos bien conocidos de la refracción y la reflexión ópticas. Sin
embargo, a las frecuencias de los rayos X, la longitud de onda incidente es comparable al espaciamiento interatómico y se puede observar la difracción de la radiación
de los átomos del cristal.
Bragg supuso que los sistemas de planos cristalinos reflejarían especularmente
los rayos X, siempre y cuando se satisficiera la condición para la interferencia
constructiva entre las reflexiones de planos atómicos sucesivos. A continuación se
examinará en detalle la forma en que los rayos X dispersados de diferentes átomos
individuales se pueden recombinar de varias maneras. Primero se examinará la radiación dispersada por dos centros de dispersión idénticos separados por una distancia r.
El vector n 0 se define como un vector unitario en la dirección del haz incidente y
se considera que el vector n 1 es un vector unitario en una dirección arbitraria de
dispersión, como se indica en la figura 2.4. Se supone que la radiación incidente es
un haz paralelo y el haz disperso se detecta en un punto de observación muy
distante. Por tanto la diferencia de trayectoria entre la radiación dispersa en P y la
que se dispersa en O es
PA - OB = r • n0 - r • n 1 = r • (n 0 - n 1 ).
(2.2-3)
El vector n 0 - n 1 =N es la normal a lo que en la representación de Bragg se
denomina plano de reflexión, si n 1 fuera una dirección de difracción, como se
ilustra en la figura 2.5. De acuerdo con esta figura, también es evidente que la
magnitud de este vector es
(2.2-4)
N=2sen0.
p
Figura 2.4.
Geometría de la situación de dispersión de rayo~ X que ~e .mali1a en la ~cc­
ción 2.2.
36 Análisis cristalográfico con rayos X
/
/
/
/
/
/
Plano de
e_
Figura 2.5.
_L_ di~ersión
Relación geométrica del haz incidente y el difractado, la normal de dispersión y el
"plano de dispersión".
La diferencia de fase rl>r entre la radiación dispersa en los dos puntos es, sen·
cillarnente 27T/A veces la diferencia de trayectoria, de donde,
(2.2-5)
Ahora bien, para que haya una difracción máxima en la dirección n cada átomo del cristal debe contribuir a la dispersión en esa dirección, con una diferencia
de fase igual a un múltiplo entero de 27T radianes. Para que esto sea verdad, lo único
que se necesita es que la radiación de los átomos separados por los vectores reticu·
lares primitiJ;os a, b, y e se sumen en fase, ya que en este caso, la contribución de
otros átomos separados del origen por combinaciones enteras de estos vectores se
sumarán en fase obligatoriamente. Si las contribuciones de dispersión de átomos
circunvecinos tuviera una diferencia de fase distinta, siempre sería posible encontrar
un átomo del cristal que contribuyera con una radiación exacta de 1T radianes fuera
de fase con la contribución de un átomo dado; estas contribuciones se cancelarían
átomo por átomo, y no darían un haz difractado. Si se analiza un ejemplo en el
que átomos circunvecinos a lo largo de la dirección a contribuyen con componentes
de radiación en una dirección dada, que están fuera de fase en 1T radianes (o
7T/2, 7T/4, 7T/6, etc.,) se verá con claridad que esta afirmación es fácil de corroborar.
En consecuencia, lo único que se requiere es que se obtenga un múltiplo
entero de 27T (2.2-5), en donde r es igual a a, b o e, es decir, se requiere simultá·
neamente que
2n
-(a· N)= 2nh' = 2nnh
}.
2n
T (b • N) = 'J.nk' = 2nnk
(2.2-6)
2n
-;-(e· N)= 2nl' = 2nnl.
l.
En estas expresiones, h', k', !' pueden ser cualquiera de tres enteros; en general estos tres enteros pueden contener el factor común entero de mayor valor n
superior a la unidad, en cuyo caso se puede escribir h' = nh, k'= nk y !' = nl, en
Factor de dispersión atómica
37
donde h, k y 1 son ahora tres enteros en la misma relación que h', k' y 1 ' sólo que
no tienen un factor común mayor que la unidad. Si h', k', y 1 ', no tienen un factor
común mayor que la unidad, entonces se considera que n es la unidad. Si a,~. y 'Y
son los ángulos entre la normal de dispersión N y los ejes a-, b- y e- del cristal,
respectivamente, entonces, de acuerdo con (2.2-4), a • N= aN cosa= 2a sen() cosa,
etcétera, de donde (2.2-6) se puede expresar también como sigue
2a senO cos oc= h'A. = nh.A.,
2b sen (} cos fJ = k' A. = nk.A.,
(2.2-7)
2c sen (} cos y = l' A. = nl.A..
Estas expresiones se conocen con el nombre de ecuaciones de Laue. Para una
longitud de onda incidente dada, >.., y valores e~pecíficos de los enteros h, k, l y n,
las ecuaciones determinan un cierto valor de () y dos de las tres cantidades (cos a,
cos ~. cos 'Y). No obstante, sólo dos de las trc~ cantidades (a,~. 'Y) son independientes
debido a que una vez que se fijan los ángulos entre un vector y dos de los tres ejes
de coordenadas, la dirección del vector queda fija y el tercer ángulo se puede
determinar trigonométricarnente. Por ejemplo, en un sistema de coordenadas ortogonales, un resultado elemental de geometría analítica es que cos2 a + cos2 ~ + cos 2 'Y =
l. Las tres ecuaciones (2.2-7) sirven, por tanto, para determinar un valor único de ()
y N, definiendo así una dirección de dispersión. Los cosenos de dirección de la
normal de dispersión N son, de acuerdo con la expresión (2.2-7), proporcionales a
h/a, k/b y 1/c. Sin embargo, los planos cercanos cuyos índices de Miller son (hkl), se
intersecan con los ejes a-, b- y e- a intervalos a/h, b/k y c/1; por tanto, los cosenos
de dirección de la normal a la familia de planos (hkl) son también proporcionales a
hja, k/b y ljc, de acuerdo con (1.5-1). La normal de dispersión N es, por ende,
idéntica a la normal de los planos (hkl) y, en consecuencia, los planos (hkl) pueden
tomarse como los de reflexión en la representación de Bragg.
Se puede demostrar que la ecuación de Bragg se sigue de las ecuaciones de
Laue, haciendo que h =a cos ajd, k= b cos ~/d, 1 =ecos 'Y/d, en la expresión (1.5-1),
de acuerdo con lo cual una de las tres ecuaciones de Laue se reduce a
nA.= 2d sen 8,
en donde d es la distancia entre los- planos adyacentes del sistema (hkl) y en donde
el orden n de la difracción es el factor común más alto entre los órdenes de
interferencia h', k' y l '. Por lo general, para referirse a una reflexión de rayos X
observada, se citan los números (h' k' 1 ') que dan el orden de interferencia entre los
átomos circunvecinos a lo largo de los ejes cristalinos; en consecuencia, el máximo
de difracción de primer orden para los planos ( 111) se menciona como la reflexión
(111), el máximo de difracción de segundo orden para el mismo conjunto de planos
(n = 2, h' = 2h, k' = 2k, 1' = 21) es la reflexión (222), el tercer orden es la reflexión
(333), etc.
2.3
FACTOR DE DISPERSION ATOMICA
Los cálculos de la sección anterior se basaron en la supostcton de que los
centros de los puntos de dispersión coincidían con los puntos reticulares. Ahora,
38 Análisis cristalográfico con rayos X
conviene tomar en cuenta que la dispersión, que es el resultado de una interacción
entre los electrones del átomo y un haz de rayos X, puede desarrollarse en cualquier
punto en que se encuentren los electrones. En otras palabras, se desea modificar los
cálculos considerando que la radiación X se dispersa debido a una distribución continua de "densidad de electrones" relacionada con cada punto reticular. Como se
verá más tarde, este concepto concuerda totalmente con el punto de vista de la
mecánica ondulatoria del proceso. Sin embargo, se debe hacer notar que se está
descuidando el efecto de dispersión de los núcleos atómicos que interactuán con
mucha menor fuerza con los rayos X. Se encontrará que, debido a la extensión
finita de la distribución de densidad e.lectrónica, la amplitud de la radiación difractada se multiplica por un factor que incluye la longitud de onda de los rayos X, el
ángulo incidente y la distribución de densidad electrónica asociada con los átomos.
Se principiará inquiriendo sobre la relación entre la amplitud de difracción de
los rayos X, en el ángulo de Bragg, dispersados por un elemento de carga p(r)dv,
ubicado en un elemento de volumen dv alrededor del punto r, y la que dispersa un
electrón de un solo punto en un punto de la red, como se ilustra en la figura 2.6.
En este caso, p(r) es la densidad de electrones, p(r) dv es la probabilidad de que se
encuentre un electrón dentro del elemento de volumen dv. Por supuesto, es necesrio
que
ip(r) dv = Z,
(2.3-1)
en donde Z es el número de electrones por átomo, esto es, el número atómico de
los átomos de los que está compuesto el cristal. La integral anterior se toma sobre todo el
espacio; aunque al hacer los cálculos se supone habitualmente que las "nubes de electrones", relacionadas con diferentes átomos del cristal, no se superponen en forN
Figura 2.6.
Geometría de la situación de dispersión de rayos X que se analiza en la· sección 2.3.
Radiación dispersada en el ángulo ele Bragg por una densidad electrónica contenida
en el elemento de volumen dv en r, que se compara con la que se dispersaría desde un ciPctrón de punto en O.
Factor de dispersión atómica
39
ma apreciable, de donde, dicha nube electrónica de un solo átomo queda confmada
al volumen de una celda unitaria.
La diferencia de fase if>n entre la radiación dispersada en el origen y la que se
dispersa en el elemento dv en r es, de acuerdo con (2.2-5)
cj>, =
2n
T (r • N).
(2.3-2)
Si la amplitud de dispersión desde el electrón del punto a lo largo de la dirección
n 1 se representa mediante Aei(ks-wt), en donde k= 2n/A. y ses una coordenada de
distancia a lo largo de la dirección de dispersión n 1 , entonces, la amplitud de
dispersión a lo largo de tal dirección, a partir del elemento dv, será p(r)dv veces más
fuerte (puesto que será proporcional a la can ti dad de carga en ese elemento) y
estará fuera de fase en una cantidad dada por (2.3-2). La relación de la amplitud de
la radiación que dispersa el elemento dv con la que dispersa un electrón de punto
en el origen que se denominará df, será entonces
dr =
Aei(ks-wt)+i<i>,p(r) dv
.
Ae•<ks wt)
J
.
= pfr)é2n•fA.)(r·N) dv
'
·
(2.3-3)
Si se integra sobre todo el espacio, se encontrará la relación f de la amplitud
dispersa en el átomo entero con la de un electrón de punto, en un punto reticular.
De donde,
1
f=
p(r)e(2ní/A.)(r·N) dv.
(2.3-4)
No obstante, de acuerdo con la expres1ón (2.2-4)
2n
2n
4rr
T (r ·N)= T Nr cos 8' = T r sen() cos ()' = w cos ()',
(2.3-5)
4rr
11 = "T sen 8.
(2.3-6)
en donde
Si la densidad de carga del átomo es esféricamente simétrica y, por tanto, es
una función exclusiva de r, p(r) = p(r) y
f=
f' J: J:n
p(r)eiw cos 8 ' r 2 sen()' dr d()' dc/J.
(2.3-7)
Se pueden evaluar las partes angulares de esta integral, integrando primeramente sobre Q>, luego sobre 8' (haciendo que x = cos 8', dx =sen O' d8'), y expresando finalmente los factores exponenciales como funciones trigonométricas, lo cual da
f(!l) =
l
oo
sen 11r
4rrr 2 p(r) - - dr.
o
(2.3-8)
Jll"
Esta cantidad, es decir, la relación de la amplitud dispersada por el átomo real
con la que dispersa un solo electrón sobre un punto reticular, se denomina factor de
dispersión atómica. Puesto que 8 -+O, Jl-+ O y sen JlY/JlY-+ 1, de donde
!Ímf(tt) =
11~o
Joj 4rrr p(r) dr = fp dv = Z,
00
2
v
(2.3-9)
40 Análisis cristalográfico con rayos X
Los valores de p(r) deben obtenerse, evaluando, de acuerdo con la mecamca
cuántica, las "funciones de onda" de los átomos del cristal. En un capítulo posterior
se verá en qué consiste este proceso. En la práctica, las funciones ondulatorias de los
átomos libres se utilizan muy a menudo en los cálculos del factor de dispersión,
para obtener resultados aproximados para las intensidades esperadas; mientras que las
funciones ondulatorias reales modificadas se emplean para los átomos, cuando éstos
se encuentran en una red cristalina.
2.4
FACTOR GEOMETRICO DE LA ESTRUCTURA
Hasta ahora, se ha supuesto que se trata de celdas unitarias con átomos exclusivamente en los vértices (es decir, celdas unitarias primitivas). Si se desean predecir
las características de la radiación difractada desde cristales con celdas unitarias complejas, que contienen más de un átomo, como sucede en las celdas cúbicas para las
estructuras cúbica centrada en el cuerpo y cúbica centrada en la cara, se debe
explicar la interacción de los haces que se difractan desde los diversos átomos,
dentro de la celda unitaria. Si para la reflexión (h' k'!') se representa la relación de
la amplitud de radiación que dispersa toda la celda unitaria en función a la que
dispersa un electrón de punto en el origen, por medio de F(h' k'!'), entonces
F(h'k'l') = ¿¡;ei4>;.
(2.4-1)
i
En este caso, [¡ es el factor atómico de dispersión para el iésimo átomo de la
celda unitaria y cp¡ se relaciona con la diferencia de fase entre la radiación dispersada
en el origen y la dispersada del iésimo átomo de la celda unitaria. La suma se
obtiene, tomando en cuenta todos los átomos que pertenecen a la celda unitaria. La
diferencia de fase cjJ¡ está dada por (2.3-2), de donde (2.4-1) se puede expresar como
sigue:
F(h'k'l') = ¿¡;e<2xi/.l.)(r;·N>,
(2.4-2)
i
en donde r¡ es un vector desde el origen hasta el iésimo átomo de la celda unitaria.
Si las coordenadas de posición fraccionales del iésimo átomo son (x¡, y¡, z¡), de
acuerdo con lo definido en la sección 1.4, entonces, r¡ se puede expresar así:
f¡
= X¡a + y¡b + Z¡C.
(2.4-3)
Sin embargo, de acuerdo con la ecuacwn (2.2-6), a · N= h'X, etc.; substituyendo la (2.4-3) en la (2.4-2) y utilizando este resultado, se encuentra que
de donde
r; ·N= A(h'x¡ +k' y¡+ l'z;),
(2.4-4)
F(h'k'l') = Lf¡e2xi(h'x;+k'y1 +1'z;).
(2.4-5)
i
Factor geométrico de lo estructura
41
Cuando todos los átomos del cristal son idénticos, el resultado se puede expresar en una forma especialmente simplificada, porque, en ese caso, todas las[¡ tienen
el mismo valor f Por tanto, la ecuación (2.4-5) se convierte en
S=
en donde
F(h'k'l') = fS
(2.4-6)
L
(2.4-7)
e2ni(h'.x¡+k'y¡+l'z¡).
i
Por tanto, la amplitud total dispersada está dada por el producto del factor de
dispersión atómica y un factor S, que está regido por la disposición geométrica de
los átomos, dentro de la celda unitaria y que se conoce como el factor geométrico
estructural. Para los cristales en los que no todos los átomos son idénticos, esta
separación es imposible y, en tales casos, se utilizará la forma más general (2.4-5).
La intensidad del haz difractado es proporcional al cuadrado de la amplitud F
o, más exactamente, dado que F es compleja, al cuadrado del valor absoluto de F,
que es F* F, en donde F* es el conjugado complejo de F Si F(h' k' l '), como lo
expresa (2.4-5), se escribe como el número complejo a+ i{3, entonces, F* =a- i(3 y
(2.4-8)
en donde
a:= Re(F) = L [f; cos 2n:(h'x; +k' y;+ l'z;)],
(2.4-9)
P = Im(F) = L [J¡sen 2n:(h'x; +k' y¡+ l'z¡)].
(2.4-10)
i
y
i
Como ejemplo, se verá el caso de un cristal cúbico centrado en el cuerpo, en
el que todos los átomos son idénticos. En esta estructura, se tienen dos átomos
dentro de la celda cúbica unitaria: un átomo del vértice y otro en el centro del
cuerpo; se procede a asignar arbitrariamente el átomo del vértice cuyas coordenadas
(x¡, y¡, z¡) son (0, O, O) a la celda unitaria y no se consideran los otros átomos de
vértice; el otro átomo de la celda es el del centro del cuerpo, que pertenece exclusivamente a la celda unitaria, cuyas coordenadas son (t.t.t). Por tanto, de acuerdo
con esta situación, la amplitud de difracción para la dirección de difracción (h' k' l ')
es la que señalan las expresiones (2.4-6) y (2.4-7),
F(h'k'l') = fL e2>ti(h'.x,+k'y,+t'••> = f[l + ein(h'+k'+t'>].
(2.4-11)
i
Puede pensarse que la forma en que un átomo de vértice se asignó a la celda
y los otros se excluyeron, es demasiado arbitraria, por lo que se puede proponer un
procedimiento más razonable, en el que i de cada átomo de vértice se asigna a la
celda, dejándolos en sus respectivas ubicaciones~ Esta forma alternativa de proceder
lleva exactamente a la misma expresión que la que se obtuvo en (2.4-11) para el
factor de estructura geométrica. La verificación de esta afirmación quedará como
tarea para el lector. En general, la asignación de los átomos que pertenecen a la
celda unitaria puede hacerse en cualquier forma arbitraria, como antes se hizo, siempre que se le asigne a ésta el número correcto de átomos de cada categoría (cara,
vértice, borde, interior).
42 Análisis cristalográfico con rayos X
De acuerdo con (2.4-11), el factor geométrico de la estructura 1 + exp(hr(h' +
k' + l ')] desaparece para cualquier reflexión (h'k'l ') para la que h' +k'+ l' sea un
número impar, ya que exp(mri) = -1 cuando n es impar. Por tanto, en la estructura
cúbica centrada en el cuerpo, faltan ciertas reflexiones (h'k'l '), que estarían presentes en una estructura cúbica simple, con la misma dimensión lateral del cubo. Por
ejemplo, no existe una reflexión (100), aunque sí se tiene la reflexión (200); del
mismo modo, no hay la reflexión (111) aunque se tiene la (222). Este efecto se
puede comprender físicamente, cuando menos en el caso de la reflexión (100),
observando primeramente que para una estructura cúbica simple, los haces reflejados
desde las caras superior e inferior del cubo de la celda unitaria, difieren 2rr en fase
para la dirección de difracción (1 00). Sin embargo, en la estructura cúbica centrada
en el cuerpo que tiene la misma dimensión lateral del cubo, existe otro plano de
átomos (centros de cuerpos), ubicados paralelamente y a la mitad entre los planos
de las caras superior e inferior del cubo de las celdas unitarias, como put..de verse en
la figura 2.7. La densidad de átomos en estos planos intermedios es la misma que la
de los planos de las caras superior e inferior del cubo y, por tanto, dan origP.n a
haces difractados, con la misma intensidad que los producidos por los planos superior e inferior de la celda unitaria; pero están fuera de fase con estos haces por rr
radianes. Los haces difractados desde los planos superiores y los del centro del
cuerpo interfieren en forma destructiva en pares, sin producir un haz difractado neto
para este conjunto de condiciones. No obst?.nte, la reflexión (200) está presente,
debido a que, en ese caso, los planos superior e inferior dan origen a haces que
están 4rr fuera de fase. Entonces los planos de los centros de cuerpo contribuyen,
con haces que difieren 2rr en fase de las reflexiones obtenidas de los planos superior
e inferior, reforzándolos en lugar de cancelarlos. Las otras reflexiones faltantes para
la estructura cúbica centrada en el cuerpo se pueden explicar físicamente, siguiendo
la misma trayectoria de razonamiento.
Los haces
se refuerzan
(1 00) reflexión
Figura 2.7.
Celda unitaria c.c.c.
reflexión (200)
Relaciones de fase para los ángulos de difracción (100) y (200), en una estructura
cúbica centrada en el cuerpo.
La red reciproca
2.5
43
LA RED RECIPROCA
En este punto, conviene presentar el concepto de la red recíproca, que es una
estructura reticular de puntos, que está relacionada en cierta forma con la red
cristalina real. La condición de Bragg para la difracción de rayos X se puede expresar en una forma muy sencilla con la ayuda de la red recíproca y en uno de
Jos vapítulos posteriores se verá que el comportamiento mecánico ondulatorio de los
electrones en las redes cristalinas periódicas se entiende más fácilmente en relación
con la red recíproca del cristal.
Si a, b y e son los vectores primitivos de translación de una red cristalina real,
los vectores primitivos de translación de la red recíproca, a*, b*, y e* se definen
mediante las relaciones
y
a*· a= b* • b =e*· e= 1
(2.5-1)
a*· b =a*· e= b* ·e= b* ·a =e*· a= e*· b =O.
(2.5-2)
Puesto que, de acuerdo con (2.5-2), a* • b =a* · e= O, el vector a* es perpendicular
al plano determinado por b y c. En consecuencia, es paralelo al vector b x e y se
puede expresar como un múltiplo de ese vector, esto es
a*= A(b X e),
(2.5-3)
en donde A es una constante escalar. Sin embargo, de acuerdo con (2.5-1)
a* ·a= A(b X e)· a= 1,
(2.5-4)
de donde, resolviendo para A y substituyendo el valor así obtenido en {2.5-3),
a* =
b X e
.
a· b X e
(2.5-5)
De igual manera, se puede demostrar que
b* = e X a
a· b X e
* = a-X- be
a· b X e
Si se utiliza el mismo planteamiento general, se pueden obtener las siguientes
transformaciones inversas
b* X e*
a = a* . b* X e*,
(2.5-6)
etcétera.
Como ejemplo, supóngase que se desea determinar la red recíproca de una
estructura cúbica centrada en la cara. Se debe principiar con la celda unitaria pri
44
Análisis cristalográfico con rayos X
mitiva de la figura 1.5(a), para la cual, los vectores de base primitivos a, b y e se
pueden expresar como sigue:
a('lx + .,
.)
a= 2
(2.5-7)
a('
.)
e= 2. •, + •.'
en donde a es el lado de la celda cúbica y en donde el eje de la coordenada x se
toma a lo largo de a, el eje y va sobre b y el eje z pasa por c. Entonce~,
2
*
a4 Ci.x + i.) X (i, + i.)
b X e
a =
=
a· b X e
de igual modo,
1
('
.
. )·
= - •x + •, - •. '
3
a ('lx + IJI
. ) ' [('lx + lz
. ) X ('1)1 + lz
. )]
S
. + lz
. )'
b* = -1 ('lx - IJI
a
a
• + ••.
•)
e * = -1 ( . + .,
a
-•x
(2.5-8)
Es evidente que esos vectores tienen las direcciones cúbicas diagonales, al igual
que los vectores primitivos de la estructura cúbica centrada en el cuerpo, como se
puede ver en la figura 1.5(b). Además, se debe observar que el espaciamiento reticular de la red recíproca es proporcional a 1/a. O sea, que cualquier vector r* que
conecte dos puntos reticulares de la red recíproca, debe tener la forma
r* =la*+ mb* + ne*,
(2.5-9)
en donde /, m y n son enteros; al substituir las expresiones correspondientes a a*,
b*, y e* de (2.5-8) en (2.5-9), es evidente que los puntos de la red recíproca deben
tener (x, y, z) coordenadas de la forma
1
(x,y,z) = - [(l + m - n),
a
(l- m+ n),
( -l +m+ n)],
(2.5-10)
en donde l, m y n pueden tomar cualquier valor entero. En la tabla 2.1 se presenta
una tabulación de estos puntos reticulares posibles; los diversos casilleros de la tabla
corresponden a valores específicos de l y m, esto hace que la forma de las coordenadas indicadas en cada casillero varíe sólo con n, de acuerdo con (2.5-1 0), en
función de los valores correspondientes de l y m, ahí incluidos. En la tabulación que
se da aquí, cualquier punto cuya coordenada x, y o z exceda de 2 (aparte del
factor constante 1/a, que no se incluye en las entradas de la tabla), queda descartado por completo; por tanto, los puntos que se conservan son suficientes para
describir 8 celdas unitarias de la red recíproca. Cuando se grafican estos puntos,
insertando el factor constante 1/a -y se considera la forma que tienen los vectores
primitivos de la red recíproca- es evidente que fa red recíproca resultante es una
estructura cúbica centrada en el cuerpo, cuya dimensión lateral del cubo es 2/a. En
forma similar, se puede demostrar que la red recíproca para una estructura real
cúbica centrada en el cuerpo, es una red cúbica centrada en la cara.
TABLA 2.1.
Puntos reticulares para la red recíproca cúbica centrada en la cara
(Todos los puntos son de la fonna [(/+m- n), (/-m+ n), (-1 +m+ n)])
m= -2
1= -2
1 = -1
1=0
(-n- 4, n, n)
-2, -2, -2
( -n- 3, n +- 1, n- 1)
-2, O, -2
( -n- 2, n + 2, n- 2)
-2, 2, 2
(-n-2,n,n)
-2, O, O
-1, -1, -1
O, -2, -2
(- n - 1, n + 1, n - 1)
-1,1,-1
- 2, 2, O
0,0, -2
(-n-3,n-1,n+1)
m= -1
--2, -2, o
( -n- 2, n- 2, n + 2)
m=O
-2, -2, 2
( -n- 1, n- 1, n + 1)
-1, -1,1
-2, o, 2
O, -2,0
(- n, n - 2, n + 2)
m= 1
m=2
O, -2,2
l= 1
1=2
(- n, n + 2, n - 2)
O, 2, - 2
(1-n,n+ 1,n-1)
1, 1, -1
O, 2,0
2,0, -2
(2 - n, n + 2, n - 2)
(2- n, n, n)
(3-n,n+ 1,n-1)
0,0,2
2, -2, o
2,0,0
1, 1, 1
O, 2, 2
2,2,0
(2 - n, n - 2, n + 2)
2, -2,2
(3- n, n- 1, n + 1)
2,0,2
(-n, n, n)
0,0,0
-1, 1, 1
-2, 2, 2
1, -1,-1
2, -2, -2
(1 - n, n- 1, n + 1)
1, -1, 1
2, 2, -2
(4- n, n, n)
2, 2, 2
46 Análisis cristalográfico con rayos X
Una de las propiedades de la red recíproca es que un vector r* = h'a* +
k'b* +!'e* desde el origen hasta cualquier punto reticular de la red recíproca es
normal al plano (hk[) de la red real. En este caso, la tríada (hkl) es, simplemente, la
tríada (h'k'l') dividida por el factor común mayor, n entre (h'k't'), al igual que se
hizo en la sección 2.2. En otras palabras, h'/h =k'/k= 1'/l = n. Para demostrar este
resultado, se puede observar en la figura 2.8 que el vector AC es igual a - (a/h) +
(e/[), y queda dentro del plano (hkl), al igual que el vector AB, que es igual a
- (a/h) + (b/k). Sin embargo, utilizando las expresiones (2.5-1) y (2.5-2),
h' 1'
r* · [ -(a/h) +(e//)]= (h'a* + k'b* + l'e*) · [ -(a/h) + (ejl)] = - h +-¡=O,
(2.5-11)
puesto que h'/h = 1'/l = n, de acuerdo con (2.2-6). De igual modo,
r* · [ -(a/h) + (b/k)] = (h'a* + k'b* + l'e*) · [ -(a/h) + (b/k)] = -
h'
k'
h +k= O.
(2.5-12)
e
a
Figura 2.8.
Geometría vectorial en la red directa para los cálculos de la sección 2.5.
Por tanto, el vector r* es perpendicular a dos vectores linealmente independientes, AC y AB, que se encuentran dentro del plano (hkl). Luego, debe ser perpendicular al plano propiamente dicho.
Del mismo modo, si n es un vector unitario normal al plano (hk[) de la red
real, se puede escribir n = r*/r*, ya que se sabe que r* es un vector normal a (hkl).
No obstante, si d es la distancia entre los planos adyacentes (hkl), de acuerdo con
(1.5-2), debe ser verdad que
a· n a· r* a· (h'a* + k'b* + /'e*)
n
d=-=-=
-h
hr*
hr*
- r* '
(2.5-13)
por lo que la magnitud de r* está dada por
r* -= n/d,
(2.5-14)
en donde n es un entero que se defme como se indica en la ecuación (2.2-6).
La condición de Bragg
2.6
47
LA CONDICION DE BRAGG EN FUNCION
DE LA RED RECIPROCA
La condición de Bragg se puede expresar como una relación entre vectores en
la red recíproca. En la figura 2.9, el vector AO que tiene una longitud 1/A. está
trazado en la dirección del haz incidente de rayos X y termina en el origen de la
red recíproca. Se observará que el origen del vector AO no debe encontrarse necesariamente en un punto reticular de la red recíproca. Se construye una esfera de radio
lA alrededor del punto A, que es el centro. Supóngase ahora que esta esfera intersecta algún punto (h'k'l ') de la red recíproca en B. Por tanto, el vector OB representa al vector que conecta el origen de la red recíproca con un punto (h'k'l ') de la
red; como tal, debe ser normal al plano (hkl) de la red real y también debe tener la
longitud n/d, donde n es el factor común entero de mayor valor a los tres números
(h'k'l '). Sin embargo, de acuerdo con las relaciones trigonométricas de la figura 2.9,
la longitud de OB se puede expresar también como 2 sen 0/A.. Si se igualan estas dos
expresiones para la longitud del vector OB, se tiene que
n). = 2d sen
e,
y se satisface la condición de Bragg. En relación con la figura 2.9, también es
evidente que el vector OB representa una normal a los planos de reflexión (hkl) y
que el vector AB lo es en la dirección del haz difractado. Esta última proposición se
entenderá con mayor claridad, si se traslada el vector AB paralelo consigo mismo,
hasta que su origen descanse en el punto O, en que se verá que AO, OB y AB están
en la relación familiar de la dirección del haz incidente, así como la dirección
normal de dispersión y del haz de difracción. De acuerdo con esta construcción
geométrica, es evidente que la condición de Bragg se satisfará para una longitud de
onda dada por cada intersección de la superficie de una esfera de tadio 1/A. trazada
alrededor de A, con un punto de la red recíproca. En cada caso, el ángulo apropiado de Bragg estará dado por el ángulo comprendido entre el vector AO y un
plano normal a OB. Cuando la condición de Bragg se satisface en esta forma, los
vectores AO y AB constituyen un triángulo isósceles con un vector OB de la red
recíproca. De acuerdo con esta disposición de los vectores, como se ilustra en la
Figura 2.9.
Geometría vectorial de la reflexión de Bragg en la red recíproca.
48 AniÍiisis cristalográfico con rayos X
figura 2.9, se puede observa~ que AB debe ser la suma vectorial de AO y OB y la
geometría vectorial de la figura 2.9 permite expresar la condición de reflexión de
Bragg, en un forma especialmente sencilla.
Para este fin se supone que todos los vectores de la figura 2.9 se multiplican
por un factor escalar constante de 27T, como se indica en la figura 2.10. Por tanto,
en esta figura, el vector G es simplemente 27T veces el vector OB de la figura 2.9 y
el vector k es 27T veces el vector AO de la figura 2.9. También en este caso, la
disposición de los vectores es tal que el vector A 'B' de la figura 2.1 O debe ser la
suma vectorial de k y G. Puesto que la magnitud de ese vector y la del vector del
8'
Figura 2.10.
Diagrama vectorial de la figura 2.9, ampliado de acuerdo con un factor escalar de
27T y rotulado nuevamente (la notación va de acuerdo con la utilizada por C. Kittel
en /ntroduction to Solid Sta te Physics. J ohn Wiley & Sons, Nueva York (1956).
haz incidente k deben ser iguales, en todos Jos casos en que se satisface la condición
de Bragg, ésta debe implicar que
(k + G) 2 = (k + G) • (k + G) = k 2 ,
(2.6-1)
o bien, desarrollando el producto y simplificando,
2k · G + G2 =O,
(2.6-2)
en donde G es 27T veces un vector desde el origen hasta un punto reticular de la red
recíproca, en donde k es un vector de magnitud 27T/A a lo largo de la dirección del
haz incidente de rayos X. La ecuación (2.6-2) es la forma vectorial de la ecuación
de Bragg. 4
EJERCICIOS
l. l·.n un cristal cúbico se oh~erva una reflexión de primer orden (1 00) a un ángulo
incidente de 18° utilizando una radiación X de longitud de onda de 1 5 A ¿Cuál es la di~tancia
~ntre lo~ planos (1 00) del cristal?
4 Esta construcción la originó Ewald (P.P. Ewald, Zeitschrift für Kristallographie 56, 129
(1921) y se denomina, a veces, construcción de Ewald.
La condición de Bragg
49
2. Para el átomo de hidrógeno en su estado energético más bajo, la función de onda está
dada por
en donde a0 es el radio de la primera órbita de Bohr, h2j4rr2me2 = 0.53
electrónica para este tipo de átomo está dada por 1/Jfs 1/1 19 , por lo que
A. La densidad
e-2rJ•o
p(r) = - - .
7TQ~
Si se utiliza esta función de distribución de densidad electrónica, calcule el factor de dispersión
atómica para un cristal hipotético, compuesto de átomos de este tipo y grafíquela como función
de p. ( = 4rr sen (} (l\).
3. Sea una estructura cúbica centrada en el cuerpo, en la que todos los átomos son
idénticos. Demuestre que asignándole a la celda unitaria un octavo de cada átomo de vértice -en
su ubicación respectiva de coordenada celular- y el ítomo del centro del cuerpo -en la posición
central- se obtiene el mismo resultado para el factor geométrico de estructura de esta red, que
derivando dicho factor de acuerdo con la ecuación (2.4-11 ).
4. Encuentre la amplitud de difracción F(h'k'l ') para la reflexión (h'k'l ') de un cristal que
tiene la estructura del CsC'l, como se ilustra en la figura 1.7(b). ¿Se podría esperar una reflexión
(100) en este cristal? Explique por qué.
5. Encuentre el factor geométrico de estructura para la red cúbica centrada en la cara
(donde todos los átomos son idénticos). ¿Cuál de las siguientes reflexiones de rayos X habrá en
un cristal de este tipo y cuál faltará en él: (100), (110), (111), (200), (220), (222), (211),
(221 ), (123)?
6. Determme el factor geométrico de estructura de la red de diamante. Exprese el resultado como el producto del factor geométrico de estructura para la red cúbica centrada en la
cara por otro factor. Indique cuáles de las reflexiones de rayos X mencionadas en relación con
el problema 5 se encuentran en dicha estructura y cuáles faltarán en ella? Nota: asigne los
átomos a una celda unitaria cúbica, de acuerdo con el diagrama de la figura 1.9.
7. Demuestre que la red recíproca de una estructura cúbica simple es otra red cúbica
simple, de donde, dicha estructura es autorrecíproca.
8. Demuestre que la red recíproca de una red cúbica centrada en el cuerpo es una estructura cúbica centrada en la cara. Haga una tabla de los puntos reticulares y grafíquelos para
formar un diagrama, basándose en sus resultados.
LECTURAS RECOMENDADAS
W. H. Bragg, An Introduction to Crystal Analysis, G. Bell & Sons, Londres (1928).
W. L. Bragg,The Crystalline State, Vol. 1, G. Bell & Sons,.,.Londres (1955).
R. B. Leighton, Principies o[ Modern Phys;cs, McGraw-Hill Book Company, Inc., Nueva York
(1959).
A. Taylor, X-Ray Metallography, John Wiley & Sons, Nueva York (1961).
CAPITULO
3
Dinámica de las
redes cristalinas
3.1
VIBRACIONES ELASTICAS DE MEDIOS CONTINUOS
Ahora se investigarán las características del movimiento elástico vibratorio de
las redes cristalinas. Se encontrará que existen diferencias importantes entre las ondas elásticas, en las estructuras reticulares compuestas de átomos discretos y las ondas
que hay en los medios elásticos completamente continuos y homogéneos. Para entender estas diferencias con toda claridad, primeramente se hará un repaso breve de
algunas características esenciales de las ondas elásticas en substancias elásticas homogéneas, isotrópicas y lineales. Se analizará detalladamente tan sólo el movimiento
ondulatorio unidimensional, pero siempre que sea necesario se tratará de indicar
cómo se pueden generalizar los resultados obtenidos para describir sistemas de dos y
tres dimensiones.
Sea un elemento de una substancia elástica isotrópica y homogénea, de longitud tu y el área transversal uniforme ~Y l:!.z. Cuando no hay deformaciones este
elemento se extiende de x a x + ÁX a lo largo del eje x, como se ilustra en la
figura 3.1, pero al aplicarle un esfuerzo, se produce una deformación elástica, la
I
-u+~u-1
Areo t:J.yt:J.z
(l
\r------t----i-1---.
r-u-
-u-:t:J.u--::___
-
F =ce (x) !:J. y tJ. z .._-------+---+-...J
1
X
Figura 3.1.
F=ce(x+t:J.x)t:J.yt:J.z
t:J.x-----1
x+t:J.x
Desplazamiento y deformación de extensión de un elemento de volumen que originalmente se extendía de x a x + &. En la condición deformada, el elemento se
extiende de x'+u a x + ~x +u+ ~u.
poSictOn de equilibrio del extremo izquierdo del elemento se desplaza una distancia u a lo largo del eje x, y el extremo derecho del elemento se desplaza una distancia
u + &. Si el medio elástico es lineal, el esfuerzo aplicado y la deformación resul51
52 Dinámica de las redes cristaliiUls
tante se relacionan linealmente, mediante la ley de Hooke. La deformación s se
define como la extensión elástica del elemento por unidad de longitud, es decir
, Au ou
s(x)= hm - = - ,
&x--+O Ax
ox
(3.1-1)
mientras que el esfuerzo es la fuerza por unidad de área que actúa sobre el ele·
mento. Por tanto, de acuerdo con la ley de Hooke, si F(x) es la fuerza total que
actúa en el punto x,
F(x) = cs(x)Ay Az,
(3.1-2)
en donde e es el módulo elástico del material. Del mismo modo, en el punto
X+ _ax,
F(x + Ax) = cs(x + Ax)Ay Az.
(3.1-3)
La fuerza total ejercida sobre el elemento se debe relacionar con la aceleración
del elemento, de acuerdo con la ley de Newton, por lo que
F(x + Ax) - F(x) = c[s(x + Ax) - s(x)]Ay Az = ma,
(3.1-4)
en donde m es la masa del elemento y a su aceleración. Desarrollando s(x + & )
como una serie de Taylor, con respecto al punto x, y descartando los términos de
segundo o mayor orden en .ax, que en cualquier caso se perderían en el límite,
conforme .ax -+ O, se encuentra que
os
e ox Ax Ay Az = ma.
(3.1-5)
Sin embargo, la masa del elemento es su intensidad p por el volumen
.ax Lly &, la aceleración es a2 ujat 2 , y la deformación, de acuerdo con la definición
{3.1-1) es au;ax. Al efectuar estas substituciones, (3.1-5) se convierte en
ou
2
p o2 u
ox 2 = ~
ot 2 •
(3.1-6)
Esta es la ecuación de onda para la amplitud de ondas elásticas en un medio
lineal homogéneo, en función de x y t, en donde la deformación elástica se limita a
la dirección x.
Las soluciones a esta ecuación se pueden escribir en la forma
u(x,t) = Aei<wr-znxt.l.l = Aei<wr-kx>,
(3.1-7)
k= 2nfA.
(3.1-8)
en donde,
La solución (3.1-7) representa una perturbación sinusoidal de frecuencia w y longitud de onda X, que se propaga a lo largo del eje x positivo. Por lo general, es más
conveniente expresar los resultados de un cálculo relativo a las vibraciones armónicas,
en términos de la constante de propagación k, que en función de X propiamente
Velocidad de grupo de trenes de ondas armónicas
53
dicha. La dirección de propagación de la onda se invierte, cambiando el signo de k.
Si la solución (3.1-7) se diferencia y se substituye de nuevo en la ecuación ondulatoria (3.1-6), se verá que, para satisfacer (3.1-6), w y k deben relacionarse mediante
ro= kJcfp.
(3.1-9)
La velocidad de fase de una onda es la razón de avance de un punto de fase
constante a lo largo de la dirección de propagación de la onda. Para determinar la
velocidad de fase, se puede examinar el movimiento de un punto de fase constante
y, para mayor facilidad, se utilizará un punto de fase cero. Puesto que el ángulo de
fase es wt- kx, de acuerdo con (3.1-7), la ecuación de movimiento del punto de
fase cero es,
rot- kx =O
o bien,
(3.1-10)
Como se puede ver, el punto de fase avanza a una velocidad constante de fase
igual a w/k. De acuerdo con la ecuación (3.1-9), la velocidad de fase para estas
ondas se puede expresar como
vP
vP = wfk = Jcfp,
(3.1-11)
de donde, es evidente que la ecuación de onda (3.1-6) se puede escribir como sigue
(3.1-12)
Para este caso en particular, la velocidad de fase es independiente de la frecuencia y la longitud de onda, y sólo depende de las constantes físicas e y p,
relacionadas con el medio elástico.
3.2
VELOCIDAD DE GRUPO DE TRENES DE ONDAS ARMONICAS
Ahora se investigará lo que sucede cuando se superponen dos trenes de ondas,
uno de frecuencia w y constante de propagación k el otro con una frecuencia
ligeramente distinta, w + dw y constante de propagación k+ dk. Para mayor facilidad, se supondrá que las amplitudes máxima de los dos trenes de ondas son
idénticas, en cuyo caso, ambas amplitudes se expresan como sigúe:
u 1 =A cos (wt- kx)
u 2 =A cos [(ro+ dro)t- (k+ dk)x].
(3.2-1)
La amplitud de la superposición es, entonces,
u 1 + u 2 = A[cos (rot- kx) + cos [(ro+ dro)t- (k+ dk)x]] = A[cos a+ cos p].
(3.2-2)
54 Dinámica de los redes cristalinas
Sin embargo, tomando como base la trigonometría elemental,
cos ex+ cos p = 2 cos t(ex - p)cos !(ex + p),
(3.2-3)
y, de acuerdo con (3.2-2), se tiene que
ex+ P= 2rot - 2kx + tdro- xdk ~ 2(rot - kx),
(3.2-4)
y
ex -
p = xdk - tdro.
(3.2-5)
En (3.2-4), los términos diferenciales tdw y xdk se pueden hacer a un lado,
teniendo en cuenta que son pequeños, en comparación con los otros términos; en
(3.2-5) no hay términos "grandes" y los términos diferenciales son importantes. Al
substituir (3.2-4) y (3.2-5) en (3.2-2), se tiene que
u 1 + u 2 = 2A cos (rot- kx) cos (tx dk- !t dro).
(3.2-6)
Esta superposición representa una onda caracterizada por los valores originales
de w y k, multiplicados por una envolvente sinusoidal con una longitud de onda
mucho más larga, 21T/dk, denominada "envolvente de pulsaciones", como se ilustra
en la figura 3.2. Se puede examinar el movimiento de esta envolvente y, sobre todo,
2,.
k
Figura 3.2.
Tren de ondas formado al superponer dos ondas sinusoidales cuyas frecuencias son
w y w +dw y con constantes de propagación de k y k +dk.
la velocidad de fase de la envolvente (correspondiente a la velocidad de los grupos o
"pulsaciones", a lo largo de la dirección de propagación) determinada mediante el
mismo procedimiento que se utilizó para una onda armónica simple, en la sección 3.1. La ecuación del movimiento del punto de fase cero de la envolvente es
x dk - t dw = O,
o bien,
dw
x=-t=vt
dk
g
o
(3.2-7)
Por tanto, se ve que la envolvente o los grupos de ondas se desplazan con una
velocidad dw/dk; que se denomina velocidad de grupo, v.rr, asociada con las ondas.
Se puede demostrar que la velocidad con que la onda transmite energía a lo largo
de la dirección de propagación es idéntica a esa velocidad de grupo. 1 Como puede
1 L. Brillouin, Wave l'ropa!!;ation in Perwdic Structures, Dover Publications, lnc., Nueva
York (1953)
Movimiento ondulatorio en redes atómicas unidimensionales
SS
verse, esto es lógico desde el punto de vista físico, por ejemplo, en el tren de ondas
de la figura 3.2, no puede fluir energía más allá de un nodo, ya que el medio en el
punto nodal está totalmente inmóvil. Por consiguiente, la energía se debe transmitir
a la velocidad a la que se mueven los nodos, es decir, a la velocidad de grupo. En el
caso de una onda estacionaria, la velocidad de grupo es cero y es evidente que no
puede haber un flujo neto de energía.
Para las ondas elásticas en un medio homogéneo, que se estudiaron en la
sección 3.1, la velocidad de fase y la de grupo son iguales, de acuerdo con la
ecuación (3.1-9). Esto es cierto debido a que w es una función lineal de k, de
donde, w/k y dw/dk son iguales. El mismo resultado se aplica también a las ondas
electromagnéticas en vacío, dado que también en este caso, la velocidad es una
constante independiente de la frecuencia y la longitud de onda. La velocidad de fase
y la velocidad de grupo sólo pueden diferir cuando la primera w/k es una función
de la frecuencia w, y por tanto, cuando la misma w no es una función lineal de k.
Por ejemplo, esta situación se presenta cuando hay una luz que pasa por un medio
en el que el índice de refracción (y, por ende, la velocidad de fase) es una función
de la frecuencia; el fenómeno se conoce como dispersión y dicho medio se denomina medio dispersivo o de dispersión. Como ¡,~ verá en breve, también sucede en el
caso de ondas elásticas, en un medio compuesto de átomos discretos enlazados por
las fuerzas de la ley de Hooke, sobre todo cuando las longitudes de onda de que se
trata no son mucho mayores que las distancias interatómicas.
3.3
MOVIMIENTO ONDULATORIO EN REDES ATOMICAS
UNIDIMENSIONALES
Ahora se examinará el movimiento vibratorio longitudinal de una cadena unidimensional de átomos idénticos de masa m, que están unidos entre sí mediante
fuerzas lineales, como se indica en la figura 3.3. En estado de equilibrio, los átomos
estarán situados en puntos de equilibrio igualmente espaciados; pero en estado de
excitación producido por el movimiento vibratorio, los átomos realizan movimientos
periódicos alrededor de estas posiciones de equilibrio, en este caso, la amplitud Un
representa el desplazamiento real del nésimo átomo, desde su posición de equilibrio.
n-2
En reposo: ~a
Vibrando
~
+
~t
Un-1
Figura 3.3.
n
n-1
a
n+l
+
~t
un
a
+
n+2
a----4
~ t
t
Un+ 1
Geúmetría de la red lineal monoatómica de la sección 3.3.
Se supone que las fuerzas entre los átomos circunvecinos son las de la ley de
Hooke, y que los átomos se comportan como si estuviesen unidos por medio de
resortes ideales, suponiéndose también que las únicas interacciones de fuerzas significativas, son las que se ejercen directamente entre los átomos más cercanos. De
donde la influencia directa de los átomos n + 2, N+ 3, n + 4 ... sobre el átomo n
56 Dinámica de las redes cristalinos
se considera despreciable, aunque el comportamiento del átomo n + 2, por ejemplo,
puede influir indirectamente en el átomo n en el sentido de que afecta directamente
al átomo n + 1 que, a su vez, actúa sobre n. De acuerdo con estas suposiciones, la
fuerza neta que actúa sobre el nésimo átomo se puede expresar en términos de la
extensión de dos "resortes" que lo unen a los átomos n + 1 y n - l. Así:
= {3(u.+ 1 + !1
11 _
1 -
2u,).
(3.3-1)
en donde (3 es la constante de la ley de Hooke, que expresa la proporcionalidad
existente entre la fuerza requerida para producir un desplazamiento atómico y el
desplazamiento propiamente dicho.
De acuerdo con la segunda ley de Newton, esta fuerza se puede expresar como
el producto de masa m del nésimo átomo por su aceleración, de donde, se obtiene
la ecuación del movimiento
(3.3-2)
Se buscan soluciones periódicas a esta ecuación y se puede esperar que tengan
la forma
(3.3-3)
en analogía con (3.1-7). Sin embargo, en la expresión (3.3-3) se debe representar el
coeficiente de k del exponente como la coordenada x ael nésimo átomo de la
cadena, es decir, na. De acuerdo con esto. se puede esperar que
un+l
= Aei[wt-k(ll+l)aJ
Un-l
= Aei[wt-k(n-l)•J.
y
(3.3-4)
Si la solución (3.3-3) se diferencia dos veces con respecto al tiempo y, junto
con la (3.3-4) se substituye de nuevo en la ecuación de movimiento (3.3-2), el
resultado es
= 2{3(cos ka - 1).
(3.3-5)
1 -cosO= 2 sen~ !0,
(3.3-6)
Sin embargo, dado que
esto se puede expresar en la forma
01
= ,./4fJ/m lsen-!kal.
(3.3-7)
Movimiento ondulatorio en redes atómicas unidimensionales
51
Los signos de valor absoluto se requieren en (3.3-7), por la única razón de que
la frecuencia se debe considerar como una cantidad esencialmente positiva, sin importar de que k sea positiva o negativa, es decir, sin importar que la onda se
propague hacia la derecha o la izquierda, a lo largo de la cadena.
En consecuencia, se observa que existen soluciones de la forma (3.3-3), a
condición de que w se relacione con k, mediante (3.3-7). Es obvio que, en este
caso, w no es una función lineal de k, de modo que aquí se trata un medio de
dispersión; una relación del tipo de (3.3-7) que presenta a w en función de k, se
conoce como relación de dispersión. En la figura 3.4 se muestra una gráfica de w
en función de k, como se da en (3.3-7). De acuerdo con esto (y (3.3-7)), se
observará que, si se restringen los valores de k, mucho menores que rrja, y, por
ende, a valores de "A que son mucho mayores que el doble de la distancia interatómica a, w es aproximadamente lineal, con k, ya que, en ese caso, sen-!- ka~-!- ka y
(3.3-8)
En este límite de longitud de onda larga, la velocidad de fase será esencialmente constante, ya que
vP = wfk = aJ{3/m = v0.
(3.3-9)
En este mismo límite, la velocidad de grupo es
(3.3-10)
y, por tanto, constante e igual a la velocidad de fase en esas condiciones. En
consecuencia, para longitudes de onda muy largas, los efectos de dispersión son
desechables y el medio se comporta como si fuera elástico, continuo y homogéneo.
Por supuesto, esto es plausible desde un punto de vista físico, ya que, para este tipo
de longitudes de onda largas, la naturaleza "atómica" de la cadena tiene poca importancia en lo que respecta al comportamiento dinámico del sistema. No obstante, al
aumentar k, los efectos de dispersión se hacen cada vez más importantes y w deja
w(k)
_,------------~------------r--k
-7T
o
Figura 3.4.
o
1T
o
Relación de dispersión de red lineal monoatómica de la sección 3.3.
58
Dinámica de las redes cristalinas
de variar en forma lineal, en función de k. En estas circunstancias, se observa que,
de acuerdo con (3.3-7),
vP = wfk = v0
!ka
lsentkal
(3.3-11)
y
v9 = dwfdk = v0 leos tkal,
(3.3-12)
en donde v0 =a .Jlflm es el límite de longitud de onda larga, tanto de vP como de
vg, como lo demuestran (3.3-9) y (3.3-1 0). En las figuras 3.5 y 3.6 se presentan las
gráficas de vp y Vg, como funciones de k.
En la figura 3.6 se observa que vg-+ O conforme k-+ rr/a y, por tanto, conforme A-+ 2a; en este caso, la fase de vibración de los átomos adyacentes difiere en
rr radianes y la naturaleza del movimiento es sencillamente una onda estacionaria.
Esta condición corresponde también a la reflexión de Bragg de las vibraciones elásticas de átomos sucesivos del cristal; para esta geometría, el ángulo 8 de Bragg de la
ecuación de Bragg (2.1-1) es rr /2 correspondiendo a la incidencia normal, en cuyo
caso, la ecuación de Bragg se reduce a A = 2d para el primer orden de reflexión. La
naturaleza física real del movimiento se ilustra en la figura 3.7, para el caso de una
longitud de onda larga y para la condición A = 2a, en la que se establecen las ondas
estacionarias. En estas figuras, los desplazamientos atómicos se representan como
movimientos transversales, para facilitar la ilustración, aunque, por supuesto, los movimientos atómicos reales que se analizan aquí son de tipo longitudinal, en el que
Vp
-6,.
o
-
o
-2,.
o
-.,
o
o
.,.
2rr
a
o
-4rr
o
-6a...
Figura 3.5. Velocidad de fase en función de la constante de propagación k, correspondiente a la
red lineal monoatómica. [Tomado, con permiso, de Wave Propagation in Periodic
Structures, McGraw-Hill (1946). J
Figura 3.6.
Vcloddad de grupo como una función de la constante de propagación k para la
red lineal monoatórnica.
Movimiento ondulatorio en redes atómicas unidimensionales
~j
Figura 3.7.
59
i j ¡---¡-_,__
Desplazamientos atómicos en la red monoatómica lineal (a) para una longitud de
onda mucho mayor que el espaciamiento interatómico, (b) en el límite en donde
'A= 2a. Para mayor claridad, los desplazamientos se representan como transversales,
pero se debe tener presente que los desplazamientos reales estudiados en este texto
son longitudinales. [De acuerdo con Brillouin.]
los desplazamientos atómicos reales se efectúan a lo largo de la cadena y no en
sentido normal a ésta.
Como se ilustra en la figura 3.8, para cualquier valor de k en la región - rr/a
<k< rr/a, se tendrá un movimiento vibratorio comprendiendo ciertos desplazamientos atómicos posibles. Sin embargo, como se indica también en dicha figura, el
mismo conjunto de desplazamientos de átomos que hay en esta onda, se puede
asociar asimismo con una onda de k mayor (y por ende, de una menor 'A), e incluso
Figura 3.8.
Un solo grupo de desplazamientos atómicos representados por varias ondas sinusoidales de diferentes longitudes de onda. [Tomado de Brillouin, Wave Propagation in
Periodic Structures, McGraw-Hill, Nueva York, (1946).]
con otra de k aún mayor. En otras palabras, pueden existir muchas representaciones
del mismo patrón de desplazamiento átomico en el que se incluya un valor distinto
de k y, en consecuencia, un valor diferente de 'A. Se puede demostrar que estas
representaciones disímbolas están asociadas con diferentes periodos de la gráfica de
w en función de k. Cada una de las representaciones posibles debe tener el mismo
valor de w por lo que, en una gráfica de w en función de k, en la que aparezcan
varios periodos de la curva, como sucede en la figura 3.9, puede haber muchos
valores de k que correspondan al mismo valor de w. En la región central, que se
extiende desde - rr/a hasta rr/a, se tiene sólo dos posibilidades, una onda que se
propaga hacia la derecha, con la constante de propagación k 1 y otra que se desplaza
hacia la izquierda, con una constan te de propagación k_ 1 = - k 1 • Las regiones marcadas en esta figura con los números 2 y 2', que con tienen otras dos soluciones
posibles, k 2 y k_ 2 = - k 2 , se pueden superponer en la región central, desplazando
la región 2 hacia la izquierda una distancia 2rr/a y moviendo la región 2' una
distancia 2rr/a. El carácter de las soluciones posibles en la región 2 es el mismo que
60 Dinámica de las redes cristalinos
"'
Figura 3.9.
Varios periodos de la relación de dispersión para una red lineal monoatómica. Se
observará que muchos valores de k se pueden asociar con cualquier frecuencia dada
dentro del rango permitido.
el de las soluciones posibles de la región 1' excepto por una diferencia en los valores
k de 2rr/a; lo mismo puede afirmarse de las regiones 2' y l. Del mismo modo, las
regiones 3 y 3', que contienen dos soluciones posibles para las que k = k 3 y k =
k_ 3 = - k 3 , se pueden superponer sobre la región central - rr/a <k< rr/a, desplazando la región 3 hacia la izquierda una distancia 4rr/a y la 3', a la derecha, una
distancia 4rr/a; la naturaleza física de las soluciones en esta región coincide, por
tanto, con la de la región central, excepción hecha de las diferencias de los valores k
de 4rr/a. Se pueden observar relaciones similares en zonas superiores. El hecho
físico importante es que cualquier arreglo posible de posiciones atómicas, que sea
compatible con una solución sinusoidal de cualquier longitud de onda, por más
pequeña que sea, se puede representar o reducirse a una solución sinusoidal para la
que - rr/a <k< rr/a. y que, por ende, pertenece a la zona central. Por consiguiente
en este caso, no es necesario considerar las vibraciones que no pertenezcan a la zona
central -rr/a <k< rr/a. Esta región central (1 y 1' de la figura 3.9) se denomina
primera zona de Brillouin; las regiones 2 y 2', y 3 y 3', etc., para las que el
carácter físico de las soluciones es el mismo que el de la primera zona, exceptuando
la traslación que se hace a lo largo del eje k, en una distancia igual a un múltiplo
entero de 2rr/a, se citan como la segunda, tercera, etc., zonas de Brillouin, respectivamente. Más adelante, se representará la ocasión de utilizar el concepto de las zonas
de Brillouin, en relación con el comportamiento de la mecánica cuántica de los
electrones en las estructuras reticulares periódicas. 2
También se debe determinar cuántos modos nonnales posibles de vibración (en
otras palabras, cuántas soluciones independientes de la ecuación de onda que satisfagan un conjunto de condiciones de frontera) se pueden asociar con una cadena
lineal de átomos. Por ejemplo, supongamos que se tiene una cadena rígidamente fija
en ambos extremos. Si dicha cadena, que tiene una longitud L, fuera un medio
homogéneo y continuo, cualquier vibración de la forma
u(x,t) = A sen knx sen wt
(3.3-13)
kn = nrr.JL,
(3.3-14)
con
en donde, n es un entero, satisfaría las condiciones de frontera de que el desplazamiento u en ambos extremos de la cadena en x =O y x = L, debe ser cero y, por
2 Debe hacerse notar que las velocidades de fase de ondas equivalentes en diferentes Zonas
de Brillouin son distintas; pero este hecho no tiene un efecto físico directo.
Movimiento ondulatorio en redes atómicas unidimensionales
61
~
,
Figura 3.10.
n =4
Conjunto de desplazamientos sinusoidales de una cuerda con vibración transversal,
que satisfacen la condición de frontera de que el desplazamiento desaparece en
ambos extremos. Estas diversas configuraciones sinusoidales se pueden considerar
como modos normales para el sistema en esta condición particular de frontera.
tanto, se calificaría como modo normal de vibración del sistema. Esta situación se
ilustra en la figura 3.1 O. Sin embargo, si la cadena se compone de átomos discretos,
el valor máximo de k está dado por rrja, y corresponde a un valor mínimo de la
longitud de onda de 2a, como se puede ver en la figura 3. 7(b ). Cualquier valor
grande de k o cualquier valor pequeño de A. corresponde simplemente a una repeti·
ción de cierta configuración que se puede describir mediante un valor de k dentro
de la zona central. De acuerdo con (3.3-4), los valores posibles de k para un sistema
de ese tipo son, k= rr/L, 2rr/L, 3rr/L, • • • rrja. No obstante, si hay N átomos en una
cadena de longitud L, cada uno de los cuales está separado de su vecino por una
distancia a, entonces, a= L/(N- 1) y, por tanto los valores permitidos de k para
vibraciones normales de esta índole es k = rr/L, 2rr/L, 3rr/L • • • (N - 1)rr/L, dando
un total de N- 1 modos. Sin embargo, para k= (N- l)rr/L, (A.= 2a) se debe excluir
en este caso, dado que no se puede excitar a menos que se muevan los átomos del
extremo, lo cual está prohibido por las condiciones de frontera. El número de
modos reales de vibración, en estas condiciones de frontera, es, por tanto N- 2, o
sea, el número de átomos de la cadena menos dos. Por supuesto, si N es un número
muy grande, no importa si el número de modos normales se considera como N- 2
o, simplemente, como N.
Conviene hacer notar que las condiciones físicas de frontera que se imponen al
sistema son las que limitan los valores posibles de k a cierto número finito de
valores, tomados del continuo de valores posibles entre - rr/a y rrja que permiten las
soluciones de las ecuaciones diferenciales de movimiento del sistema. Como lo demuestra la exposición anterior, cuando los extremos de la cadena se mantienen
rígidamente fijos, se seleciona un conjunto de N- 2 valores posibles de k, correspondientes a las soluciones que satisfacen esas condiciones de frontera, de entre este
grupo infinito de valores posibles. Sin embargo, en cualquier problema real se deben
seleccionar ciertas condiciones de frontera en las ondas elásticas y, en lo que respecta al número de modos normales posibles, se encuentra que no importa mucho
cuál de los conjuntos de condiciones se escoja, siempre que sea físicamente aceptable. En cada caso, se tendrán básicamente N modos normales posibles de vibración,
que satisfagan las condiciones de frontera que se hayan seleccionado, a condición de
que el número de átomos N sea mucho mayor que la unidad. Se encuentra que este
resultado se aplica también en sistemas bidimensionales y tridimensionales.
En muchos casos, será útil seleccionar como condición de frontera, el requisito
de que la amplitud de vibración del Nésimo átomo sea precisamente la misma que la
del primer átomo. Desde el punto de vista físico, esto correspondería a una cadena
lineal, que se dobla para obtener la forma de un anillo, en el que el Nésimo átomo
se une al primero para cerrar la cadena. Las condiciones de frontera de esta naturaleza se conocen con el nombre de frontera periódica; la aplicación de estas condiciones a las soluciones (3.3-3) de las ecuaciones de movimiento, producirá el mismo
62 Dinámica de redes cristalinos
resultado, a saber: que pueden existir esencialmente N soluciones de las ecuaciones
de movimiento, que satisfagan también las condiciones de frontera periódicas. Más
adelante, la demostración de este resultado se le asignará al lector como tarea y
ejercicio.
3.4
ESTRUCTURAS DIATOMICAS UNIDIMENSIONALES
Hasta ahora el examen de las propiedades dinámicas de las redes cristalinas se
ha concretado al caso en que todos los átomos de la red son idénticos. Puesto que
muchos cristales comunes son compuestos diatómicos, que contienen átomos de dos
especies químicas diferentes y, dado que las característic~s dinámicas de sus estructuras difieren en varias formas importantes de los cristales monoatómicos, conviene
proceder al de las vibraciones elásticas en cristales de este tipo.
Sea una red en la que los átomos de dos especies están dispuestos en forma
alternada y cada átomo está separado de los dos átomos adyacentes por una distancia a, como se muestra en la figura 3.11. La masa del átomo ligero se representa
mediante m, y la del átomo pesado es M. También aquí se aplicarán las suposiciones
de la sección 3.3 en relación con las fuerzas de la ley de Hooke y sólo se tomarán
en cuenta las interacciones entre los átomos adyacentes. Aquí se hace necesario
escribir ecuaciones independientes para el átomo ligero y el pesado; lo cual se hace
siguiendo una analogía exacta del procedimiento de la sección 3.3, teniendo como
resultado
(3.4-1)
También ahora se deben buscar soluciones de la forma (const.)ei(wt-kx), representando la coordenada x del átomo, de acuerdo con su posición a lo largo de la
cadena, como en (3.3-3) y (3.3-4).
m
m
M
~o-i-o~
---- 2 n-2
Figura 3.11.
M
•
o
m
M
•
o
m
M
2n-l
2n
2n+l
2n+2
2n+3 ---
•
m
o
M
•
Geometría de la red diatómica lineal de la sección 3.4.
Puesto que Jos dos tipos de átomos tienen masas distintas, por lo normal, sus
respectivas amplitudes de vibración, también, serían diferentes. Además, en este
punto, no se puede f>aber que sus frecuencias son iguales -aunque, como se verá
Estructuras diatómicas unidimensionales 63
más adelante, esto es lo que sucede en este caso en particular. Por tanto, se suponen
soluciones de la fórmula
y
(3.4-2)
Si u 2 n y u2n+i están dadas por estas expresiones, de acuerdo con la regla de
que el coeficiente de k en el exponente debe representar la coordenada x del átomo
en cuestión, también debe ser cierto que
(3.4-3)
Si las soluciones (3.4-2) se diferencian dos veces con respecto al tiempo y se
substituyen de nuevo en las ecuaciones de movimiento (3.4-1), utilizando (3.4-3)
para expresar todos los desplazamientos en términos de u 2 n y u 2 n+i, se tiene que
(3.4-4)
Al resolver la segunda de estas ecuaciones para u 2 n+i, se observa que
p(l + e-2ika>
U2n+ 1 =
2 p _ Mw~
U2n·
(3.4-5)
Las ecuaciones de movimiento requieren que esta relación se satisfaga para
todos los valores de tiempo. No obstante, si los valores de u 2 n y u 2 n+l tal y como
los da (3.4-2), se substituyen en (3.4-5), es evidente que este requisito se puede
satisfacer para todos los valores de t, sólo cuando w 1 y w 2 son iguales. De acuerdo
con esto, tomando
(3.4-6)
y substituyendo (3.4-5) en la primera de las ecuaciones (3.4-4), expresando los
exponenciales de acuerdo con las funciones trigonométricas y simplificando, es evidente que
(3.4-7)
Al reacomodar esta ecuación y reunir las potencias de w, se tiene, por último,
4
w -
2P(m +M) 2 4P 2 sen 2 ka
mM
w +
mM
= O.
(3.4-8)
64
Dinámica de redes cristalinos
Esta ecuación cuadrática en w 2 se puede resolver fácilmente mediante la fórmula cuadrática a fin de obtener dos soluciones para w 2 , que se designarán como
w~ y w~, según se escoja el signo + o el - en la fórmula cuadrática. El resultado es
2 _
c.o± -
P(m + M) [
1±
mM
J_
1
4mM sen2 ka]
( m+ M)2 .
(3.4-9)
w(k)
l /2~/M
1
1
1
-4--------------~--------------~k
l-..!:.
2o
Figura 3.12.
o
1
;o
Relación de dispersión correspondiente a la red diatómica lineal, donde se muestran las ramas Óptica y acústica.
En la figura 3.12 se muestra una gráfica de este resultado. En donde se pueden ver dos ramas de la curva w en función de k, una para el caso en que se tome
el signo + y la otra, el signo -, en (3.4-9). La rama superior, w+(k), se conoce con
el nombre de óptica, en tanto que la inferior, w_(k), se denomina la rama acústica.
La importancia de esta terminología se aclarará más detalladamente a su debido
tiempo. Para valores pequeños de k, sen ka:::: ka, y las dos raíces se convierten en
(3.4-10)
y
w_(k)=ka
J
2p
-m+M
(ka ~ ;r/2).
(3.4-11)
Para obtener la expresión (3.4-11) se debe escribir la raíz cuadrada de (3.4-9)
en forma de una expansión binomial para valores pequeños del argumento.
La longitud de onda más pequeña posible de la primera zona de Brillouin es
dos veces la distancia de la celda unitaria de la red que, en este caso, es 2a. Esto
proporciona una longitud de onda mínima de 4a, correspondiente a un valor máximo de k de Tr/2a en la frontera de la primera zona. Para este valor de k (3.4-9) da
Región de frecuencia prohibida
65
(3.4-12)
y
w_ = )l/3/M.
Las características físicas del movimiento se pueden entender mejor, observando lo que sucede cuando k~ O. En este caso, para obtener la relación de la
amplitud B/A la expresión (3.4-5) es la más conveniente, siendo el resultado
2{3
!~~~=A= 2{3- Mw~
,
U2n+ 1
B
(3.4-13)
Para la rama acústica, w = w_, como se indica en (3.4-11) y conforme
de donde B/A = l. En consecuencia, para el modo acústico de vibración, los dos tipos de átomos se mueven en la misma dirección, con igual amplitud,
como se muestra en la figura 3.13(a).
k~ O, w_ ~O,
(a) Rama acústica
(b) Rama óptica
Figura 3.13.
Desplazamientos físicos asociados con vibraciones de longitud de onda larga propios de (a) la rama acústica y (b) la rama Óptica.
Para 1~ rama óptica, w = w+ en (3.4-13) y utilizando (3.4-10) se ve claramente
que, en este caso, B/A = - m/M. Por tanto, para la rama óptica en k= O, las
vibraciones de los átomos tienen direcciones opuestas y las amplitudes, una relación
inversa con las masas, de manera que el centro de la masa de la celda unitaria
permanece fijo durante el periodo de movimiento, como se observa en la figura 3.13(b). Por lo general, esas características son típicas de las ramas óptica y
acústica. Las vibraciones de modo óptico en cristales iónicos, donde dos tipos de
átomos tienen cargas opuestas, se pueden excitar mediante un campo eléctrico que
tiende a hacer que los iones se muevan en diiecciones contrarias. Sobre todo en las
substancias iónicas, este modo se puede excitar mediante un campo eléctrico asociado con una onda lumínica, debido a lo cual se usa el término de vibraciones de
modo óptico.
3.5
REGION DE FRECUENCIA PROHIBIDA
De acuerdo con la mencionada figura 3.1 '2, existe una banda de frecuencias
2(3/M < w 2 < 2(3/m en la que no hay soluciones de la forma (3 4-2). Pues sucede que
las frecuencias de este rango simplemente. no pueden propagarse como vibraciones
armónicas continuas no amortiguadas de la red. Si se intenta excitar vibraciones de
una frecuencia que queda dentro de esta banda. las vihmciones ~on at<'lllltlllas o
66 Dinámica de redes cristalinas
amortiguadas por la propia red, dependiendo el coeficiente de atenuación de la
frecuencia, las masas atómicas y la constante de fuerza.
Para ver esto con mayor claridad, la ecuación (3.4-7) se puede escribir en la
siguiente forma
(3.5-1)
Puesto que en la regwn 2(3/M < w 2 < 2(3/m, el primer factor en la parte superior de la ecuación de (3.5-1) es positivo y negativo el segundo, es evidente que
cos ka debe ser imaginario en esta región de frecuencias, por lo que ka debe ser un
número complejo. Si la raíz cuadrada se escribe en la segunda forma que se indica
arriba, cos ka se expresa como una cantidad imaginaria if>, en donde 6 es un número
real dentro del rango de frecuencias de interés.
El coseno de un número complejo se puede expresar como la suma de partes
reales o imaginarias mediante un simple cálculo, utilizando el teorema de Euler como
sigue:
COS Z = COS (x + iy) = COS X COSh y- Í sen XSenh y.
(3.5-2)
Si esto se iguala a if>, como lo requiere (3.5-1), y se igualan las partes reales e
imaginarias de la ecuación resultante, se obtiene
cos x cosh y = O,
(3.5-3)
sen x senh y= -~.
(3.5-4)
En (3.5-3), coshy no es nunca cero para cualquier valor de y, de donde
cos x = O y x = ± rr/2, por tanto, sen x = ± l. Al substituir este valor en (3.5-4), es
obvio que
y = :¡: senh- 1 ~.
(3.5-5)
en donde,
7l
z = ka = x + i y = ± l
+ i senh- e)
1
(3.5-b)
y las soluciones de la ecuación de onda (3.4-2) se convierten en
(3.5-7)
Estas son oscilaciones atenuadas o amortiguadas; el signo menos del exponente
se debe seleccionar para los casos físicamente reales de-ondas amortiguadas (el signo
m:ís representa ondas crecientes cuya amplitud aumenta exponencialmente a lo largo
Excitación óptica de vibraciones reticulares en cristales iónicos
67
de la cadena). La constante de atenuación K, definida al escribir la solución (3.5-7)
como
(3.5-8)
está dada por
1
K = - senh - l ó,
a
(3.5-9)
en donde o, a su vez, está dada por (3.5-1). Esta misma situación general predomina
para valores de w que exceden w+(O), según han sido dados por (3.4-1 0), y también
en el caso de la cadena monoatómica para valores de w que se sobrepasen de
y4[3/m; en cada caso se encuentra que la red cristalina no puede propagar frecuencias en estos rangos y que la red misma debe amortiguar o atenuar cualquier perturbación de esta índole.
Hasta ahora sólo se han visto ondas longitudinales en redes unidimensionales;
sin embargo, también se pueden excitar vibracwnes transversales en las que los desplazamientos atómicos son perpendiculares a la cadena y no a lo largo de ella. Las
características de estas ondas transversales son, en general, muy similares a las de las
ondas longitudinales; el fenómeno de dispersión, los modos de vibración acústico y
óptico para las estructuras diatómicas y las bandas de frecuencias prohibidas, se
producen más o menos en la misma forma que en las ondas longitudinales. Puesto
que las ondas transversales implican desplazamientos atómicos normales a los que
tienen lugar en las vibraciones longitudinales, las ondas transversales y longitudinales
se pueden excitar en forma simultánea (como primera aproximación) e independientemente entre sí. De igual manera, puesto que existen dos direcciones posibles de
desplazamiento ortogonal e independiente para las ondas transversales, se pueden
excitar de un modo simultáneo dos oscilaciones transversales independientes.
3.6
EXCITACION OPTICA DE VIBRACIONES RETICULARES
EN CRISTALES IONICOS
En un cristal iónico, por ejemplo, el de NaCl, los átomos de sodio y cloro
están ionizados; el átomo de sodio lleva una carga e y el de cloro una carga -e. En
estos cristales, el vector eléctrico de una onda lumínica puede excitar vibraciones de
un modo óptico, ya que un campo eléctrico ejerce fuerza sobre las cargas positiva
y negativa que tienen direcciones opuestas. En esta exposición, se supondrá que se
trata de redes diatómicas lineales de átomos de cargas opuestas que se extienden a
lo largo de la dirección x y que la luz incide perpendicularmente a la cadena
atómica, de tal modo que el vector eléctrico de la onda oscila a lo largo del eje x. En estas condiciones, en cualquier instante dado, todos los átomos del cristal están sometidos
al mismo campo eléctrico, y sobre los iones adyacentes, positivos y negativos, se
ejercen fuerzas exactamente iguales, pero opuestas. El efecto que produce un campo
de excitación de esta naturaleza consistirá en establecer vibraciones longitudinales
forzadas en la red cristalina, a la frecuencia de la fuente de excitación, es decir, la
onda de luz incidente. Puesto que el campo eléctrico es idéntico en todas las partes
de la red, en un momento dado, el tipo de vibración que se excitará será el de la
figura 3.13(b), o sea, una vibración óptica de una longitud de onda infinitamente
larga, en la que k = O.
68 Dinámica de redes cristalinas
En presencia de este tipo de campos, la fuerza ejercida sobre un ion positivo
es eE0 eíwot y en el ion negativo, -eE0 eiwot, en donde w 0 es la frecuencia de la luz
y E 0 es la magnitud del vector eléctrico de la onda de luz. De acuerdo con esto, se
debe agregar un término de fuerza eE0 eiwot al lado derecho de la primera ecuación
de movimiento (3.4-1) y el término - eE0 eiwot al segundo. Si ahora se suponen
soluciones de la forma
u 2n+ 1 = Bei(coor-[2n+ 1JkaJ
(3.6-1)
Las vibraciones que se han supuesto a la frecuencia de fuerza y, si se repiten los
pasos que llevan a las ecuaciones (3.4-4), se obtiene
- mw~u2n = p[(l + éika)u2n+ 1 - 2u2nJ + eE 0 eiwot
2
R[(l +e - 2ika) U2n- 2U2n+1 J -eE oeiwot·
- M WoU2n+1=P
(3.6-2)
Puesto que desde el punto de vista físico la vibración óptica que se excita por
medio de la onda de luz es tal que k= O, el conjunto de ecuaciones anteriores se
reduce a
(2P- mw~)u 2 n- 2Pu2n+1 = eEoeiwor
-2Pu2n + (2P- Mw~)u2n+1 = -eEoeiwor.
(3.6-3)
Este grupo de ecuaciones simultáneas se puede resolver para las amplitudes de
vibración u 2 n y u 2 n+l, y el resultado es
- (- eEo/m) iwor
U2n- Wo2
w+2(0)e
(3.6-4)
_ (eEo/M)
iw 0 t,
U2n+ 1 - w 2 -w+2 (O) e
0
en donde w+{O) es el límite de longitud de onda larga de la frecuencia de rama
óptica, como está dado por (3.4-10).
De acuerdo con estos resultados, cuando la frecuencia de la luz incidente es
igual a la frecuencia natural de la red para vibraciones de modo óptico de longitud
de onda larga, w+{O), por lo normal, se observaría un efecto de resonancia ya que
las amplitudes de vibración aumentarían mucho. Es de esperarse que al producirse la resonancia, las amplitudes muy grandes de vibración de los iones cargados den origen a una
fuerte rerradiación de energía electromagnética a la frecuencia resonante. De hecho,
este fenómeno se observa en cristales iónicos en los que se produce un solo pico
fuerte en la reflexividad óptica del cristal en la región infrarroja lejana del espectro,
sobre todo en la región de 40 a 1OOJ.L de longitud de onda. Si se conocen las
constantes de elasticidad del cristal, se puede hacer un cálculo de la constante de
fuerza {3; sí luego se conocen las masas atómicas m· y M, se puede calcular y
comparar la frecuencia de resonancia w+(O) según la predice (3.4-1 O), con la frecuencia óptica a la que se observa experimentalmente la máxima reflexividad. De
esta manera se encuentra que en la mayoría de los cristales iónicos simples, los dos
valores concuerdan con bastante exactitud.
Energía de enlace de estructuras cristalims iónicos 69
Si un cristal iónico dado refleja varias veces la radiación de una fuente infrarroja de espectro continuo, la radiación residual resultante será una luz casi monocromática de la frecuencia de resonancia de la red, ya que a otras frecuencias, la
reflexividad del cristal será más bien pequeña y, después de varias reducciones, este tipo
de luz se atenuará enormemente. Este efecto ha llevado a la terminología de rayos residuales o bien, como se dice en alemán, Reststrahlen, refiriéndose a la radiación reflejada desde un cristal iónico al pico de reflexividad. El efecto característico de Reststrahl,
según se produzca o no, puede indicar si el cristal es iónico o bien covalente, ya que el
modo de vibraciones ópticas no se puede excitar así en un cristal covalente, eP el que
los átomos no llevan una carga neta. La intensidad del pico de Reststrahl en un cristal
mixto iónico-covalente, también proporciona una estimación cuantitativa de la fuerza
relativa del componente iónico del enlace del cristal.
Por supuesto, en relación con el pico de reflexividad, se tiene un mínimo en la
transmisión óptica del cristal. Aunque en el cálculo sencillo que se hizo se pasaron
por alto los términos de amortiguamiento en la ecuación del movimiento, y no se
incluyó ningún otro para explicar las pérdidas de energía del cristal, en realidad, sí
se registra una pérdida de energía. Esta pérdida se debe no sólo a la rerradiación del
haz reflejado, sino también a otras razones entre las cuales la más importante es la
de la inarmonía de las vibraciones reticulares que se origina a las amplitudes grandes,
producidas cerca de la resonancia, originando, a su vez, la excitación de otros modos
de vibración de la estructura reticular.
3.7
ENERGIA DE ENLACE DE ESTRUCTURAS
CRISTALINAS IONICAS3
En un cristal iónico, las fuerzas que mantienen unido el cristal se ongman
principalmente en interacciones electrostáticas simples entre los iones positivos y
negativos del cristal. Para este tipo de enlace, es bastante sencillo calcular la energía
de enlace de la red cristalina sobre una base semiempírica. El planteamiento original
de este tema se debe a Madelung y Born. 4 ,S,6
A continuación se verá el ejemplo específico de un cristal de la estructura del
NaCl, como se ilustra en la figura l. 7(a); U¡¡ es la energía potencial de interacción
entre los iones i y j del cristal. El total de energía de interacción entre el ion i y
todos los demás iones del cristal es, entonces,
(3.7-1)
La prima de la suma indica que el término para el que j = i se debe excluir de
la suma, ya que evidentemente, no existe una interacción de enlace entre el ion i y
él mismo. Además de la energía coulómbica de interacción ± e2 jr¡¡, en donde r¡¡ es
la distancia entre los iones i y j, se debe suponer q•1e existe una fuerza de repulsión
la cual crece sólo en distancias interiónicas muy pequeñas. En efecto, esta fuerza de
repulsión de corto alcance se origina debido a que cuando los átomos están cerca,
3 Esta sección sigue, en forma general, el planteamiento que le dio C. Kittel en IT'troduction to Solid State Physics, John Wiley & Sons, Nueva York (1956).
4 E. Madelung, Physik, Zeitschr, 11, 898 (1910).
S M. Born, Atomtheorie des Festen Zustandes, Teubner, Leipzig (1923).
6 M. Born y M. Goppert-Mayer, Handbuch der Physik, 24/2, 623 (1933).
70 Dinámica de redes cristalinas
resisten cualquier intento adicional para obligarlos a ocupar el mismo espacio. Si no
existiera esta fuerza, el cristal tendría siempre una energía coulómbica de atracción neta
entre iones de cargas opuestas, que sería mayor que la energía coulómbica de repulsión entre iones de cargas iguales, y el cristal simplemente se derrumbaría reduciéndose a un volumen igual a cero. La energía de interacción entre los iones i y j
debida a esta fuerza, se representa empíricamente mediante el término A/1/¡. Si el
exponente n es un número razonablemente grande, esta interacción de repulsión será
muy pequeña a grandes distancias y se hará apreciable sólo en espaciamientos interatómicos bastante reducidos.
La energía total de interacción entre los dos iones i y j, se puede expresar
como la suma de las interacciones de repulsión de Coulomb y de corto alcance, en
la forma
(3.7-2)
Se debe observar que la fuerza originada en la interacción de repulsión a corto
alcance, está dada por la derivada negativa de la energía de interacción correspondiente con respecto a r¡¡, nA/1¡}+ 1 • En (3.7-2) el signo + se aplica a interacciones
entre iones de signos iguales y el signo - se refiere a las interacciones entre iones de
cargas opuestas. La constante A se limita a expresar la proporcionalidad entre la
energía de repulsión a corto alcance y rij 11 • Si el cristal se considera como un elemento compuesto de N iones positivos y N iones negativos, la energía total de enlace de
la red, U, se puede expresar como sigue:
U=NU;.
(3.7-3)
Ahora bien, el número total de iones del cristal es 2N, pero, al determinar la
energía total de enlace, sólo debe tomarse una vez la energía aportada por cada par
de interacciones ij; si se escribiera (3.7-3) con un factor de 2 en el lado derecho, las
interacciones U¡¡ y U¡¡ de (3.7-1) se hubieran contado erróneamente como si fueran
entidades independientes. La energía U¡¡ dada por (3. 7-2), viene a ser la suma de la
energía necesaria para separar los iones i y j situados a una distancia inicial r¡¡, hasta
que estén infinitamente separados; la energía reticular total U es, entonces, la energía requerida para convertir un cristal cuyos átomos vecinos más cercanos se encuentran inicialmente a una distancia r, en iones separados, cada uno de los cuales está
infinitamente lejos de los demás.
Si ahora las cantidades X¡¡ que no tienen dimensiones se definen en tal forma
que
(3.7-4)
en donde r es la distancia entre los átomos adyacentes del cristal, entonces, (3. 7-2)
se puede expresar como sigue:
(3.7-5)
y
(3.7-6)
Energía de enlace de estructuras cristalinas iónicas
71
No obstante, en (3.7-6), r es ahora independiente del índice de suma j, por lo
que
A , 1 e2
1
U-(r)
= -""
""'1
n¿ - n+¿
'
X¡i
r
(3.7-7)
B
r"
ae 2
(3.7-8)
r
i
i
xii
que se puede escribir así:
U-(r)=....!! _ _
'
con
r '
B" = A L' 1/x'&
(3.7-9)
L.' + 1/xii.
(3.7-10)
j
y
a=
j
En la figura 3.14 se muestra una gráfica de la relación (3.7-8), dando a U¡
como una función de la distancia al átomo más cercano r. Si la distancia entre los
U; (r)
r =o (Separación del
ion en equilibrio)
7::7
:;."
:í'
'/'
U; (o)+--........::~_.,1
(Energía de enlace)
1
1
/
Energía de Coulomb- ae 2/r
1
Figura 3.14.
Energía potencial de un ion de un cristal iónico en función de la distancia interatómica r. El cristal está en equilibrio cuando dicha energía está en un mínimo,
o sea cuando existe una separación interatómica igual a la distancia reticular de
equilibrio a.
átomos adyacentes es grande, la repulsión de alcance corto se puede omitir y la
energía de enlace es esencialmente el exceso de la energía coulómbica de atracción,
que se acerca a cero conforme r tiende a infinito. A distancias más cortas, la energía positiva de repulsión de corto alcance adquiere importancia y sobrepasa la energía
negativa de Coulomb, aumentando con gran rapidez conforme disminuye r. Existe
72
Dinámica de redes cristalinos
una posición de energía mínima para el sistema, como lo indica el diagrama, y este
punto representa la posición de equilibrio del cristal. El valor de r asociado con
este punto es, sencillamente, la distancia interatómica de equilibrio a del vecino más
cercano. En este punto, la fuerza coulómbica de atracción entre los iones mantiene
un difícil equilibrio debido a la repulsión de corto alcance, siendo igual a cero la
fuerza neta ejercida sobre un átomo, dada por - au;;ar.
La constante a de la ecuación (3.7-8) que se denomina constante de Madelung,
es un número que está determinado completamente por la estructura reticular del
cristal. La constante B depende del coeficiente de energía de repulsión A, así como
de la estructura reticular. Sin embargo, se puede determinar en términos de la
distancia de equilibrio a del vecino más cercano. Para hacer esto, se debe evaluar la
derivada de U;(r), a r =a que, de acuerdo con la exposición anterior, debe ser igual
a cero, ya que el punto mínimo de la curva de energía potencial se produce a r = a
Por tanto, se tiene que
nBn
cxe 2
- n:tr + - 2 = O,
a
a
de donde,
(3.7-11)
Al substituir este valor de Bn en (3. 7-8), si se usa (3. 7-3) se encontrará que
para la energía total de enlace en equilibrio,
2
1)
U 0 = NU¡(a) = - -Ncxe
a - ( 1- ~ .
(3. 7-12)
En esta fórmula no se conoce inicialmente a o n. No obstante, en principio, se
puede calcular a evaluando la suma (3. 7-10) en todos los átomos del cristal. En esta
ecuación, el signo superior se refiere a las interacciones entre cargas iguales y el
signo inferior, a las interacciones entre cargas opuestas. Por tanto, si el origen se
escoge como un punto de ion negativo, el signo positivo de (3.7-10) corresponderá a
las interacciones con iones positivos y el signo negativo a las interacciones con iones
negativos. Para una cadena unidimensional de átomos cargados, alternados, en donde,
cada átomo está separado de sus vecinos por una distancia a, se tiene que, al escoger
un ion negativo como origen y al usar (3.7-10),
(3.7-13)
El factor 2 es necesario porque las cantidades aportadas por los átomos a la
izquierda del origen y por los átomos a la derecha del mismo, se deben incluir
igualmente en la suma. De acuerdo con la expansión de serie,
x2
x3 x4
In (1 + x) = -x- -2 +--+ ···
3
4
(3.7-14)
la serie de (3.7-13) se puede obtener haciendo que x = l, de donde, para este caso,
ex= 2ln 2.
(3.7-15)
Energía de enlace de estructuras cristalinas iónicas 73
La evaluación de la constante de Madelung resulta un ejercicio fácil para este
ejemplo sencillo. Sin embargo, cuando estos mismos métodos se aplican a estructuras
cristalinas reales de tipo tridimensional, se descubre que la suma converge en forma
tan lenta que es muy difícil evaluar a directamente en esta forma. Resulta ilustrativo
escribir la suma de Madelung para los vecinos más cercanos, los que le siguen en
segundo lugar, en tercero, etc., para la estructura del NaCl, con el fin de demostrar
la naturaleza de estas dificultades de convergencia. Existen varios patrones matemáticos que se pueden utilizar para contrarrestar estas dificultades, el mejor de los
cuales ha sido creado por Evjen 7 y Ewald. 8 En esta obra no se entrará en los
detalles de estos métodos, sino que sólo se mencionarán los resultados correspondientes a algunas estructuras de interés. Se ha encontrado que para la
estructura de NaCl
oc= 1.7476
estructura de CsCl
1.7627
estructura de la zincblenda
1.6381
La tendencia de los compuestos iónicos a cristalizar en estructuras que poseen
constantes de Madelung grandes es por demás conocida. Esto se debe a que un valor
máximo de a, de acuerdo con (3.7-12), minimiza la energía del sistema dando un
cristal con la máxima energía de enlace (negativa). En consecuencia, los cristales
muy iónicos raramente cristalizan en estructuras como la de la zincblenda.
La constante n de (3. 7-12), que es en realidad el exponente asociado con el
potencial de repulsión a corto alcance, se puede expresar en términos de la compresibilidad adiabática del cristal, que se puede medir en forma experimental. Para hacer
esto, se puede comenzar con la Primera Ley de Termodinámica que establece que
dQ = dU + p dV = T dS,
(3.7-16)
en donde los símbolos tienen su significado termodinámico acostumbrado. Se considera que la energía interna U se compone totalmente de la energía potencial de
interacción entre los iones del cristal, según se expresa en (3.7-12). Esto significa
que se supone que la temperatura es mucho menor que la de fusión en una escala absoluta, ya que al aumentar la temperatura, los iones adquieren, además de su energía potencial, cada vez más energía cinética de vibración, que al llegar al punto de fusión excede la energía potencial de interacción entre los iones y con ello se destruye la estabilidad de la estructura reticular. En el caso de un proceso adiabático, dQ = O, en
donde dS = O y dU = - p dV, dando
p = -(dU)
dV S
y
(3.7-17)
La compresibilidad adiabática (compresibilidad medida en tales condiciones que no
se intercambie calor con el medio), se puede definir como
K=_.!._ (dV)
V dp .'
7 H. M. Evjen, Phys.
Rev. 39, 675 (1932).
8 P. P. Ewald, Ann.d.Physik 64, 253 (1921).
(3.7-18)
74
Dinámica de redes cristalinas
en cuyo caso, de acuerdo con (3.7-17),
.!.= -v(dp) =v(dz~)K
dV •
dV
•
(3.7-19)
De igual manera,
dU dU dr
dV=drdV
y
(!!!:)
2 d2 U
_ dU d 2 r
- dr dV 2 + dV
dr 2 •
.
(3.7-20)
Sin embargo, el volumen de la celda unitaria de NaCl, con 4 átomos de Na y
4 átomos de Cl, como se ilustra en la figura 1.7(a), es 8r3 ; el volumen por átomo
de Na (o por átomo de Cl) es, por tanto, 2r 3 , y el volumen total de un cristal
grande con N iones de Na y N iones de Cl, será
(3.7-21)
de donde,
dr
1
dV = 6Nr 2
(3.7-22)
y
(3.7-23)
De acuerdo con (3.7-20), (3.7-22) y (3.7-23), se tiene que
d2U
-1 dU
1 d2U
2
2
5
dV = 18N r dr + 36N 2 r4 dr 2 '
(3.7-24)
Como ya se vio antes, dU/dr =O a r =a, por tanto, de acuerdo con (3.7-24),
se de be tener
(3.7-25)
de donde, recordando (3.7-19)
(3.7-26)
Energía de enlace de estructuras cristalinas iónicas
15
A partir de (3.7-8), U(r) se puede expresar como sigue:
B
U(r) = NU¡(r) = N [ ;
2
a.e ]
---¡:
,
(3.7-27)
en donde,
(3.7-28)
Bn está dada por (3.7-11). Al substituir Bn de la última ecuación, en (3.7-28),
y simplificando, haciendo que r =a, se obtiene finalmente,
Na.é(n- 1) 18Na
a3
=~·
(3.7-29)
de donde, resolviendo para n,
18a 4
n = l + - -2 •
Ka.e
(3.7-30)
Para el NaCl, el valor medido de la compresibilidad adiabática k, es aproximadamente 4 x I0- 12 cm 2 /dina, en tanto que a= 2.8 x I0- 8 cm. Cuando se substituyen
estos valores en la expresión (3. 7-30), se obtiene el resultado n e:: 8, por lo que en
este caso, de acuerdo con (3.7-12), se debe esperar que U0 e:: -0.9Nae 2 ja. Entonces,
parecería que aproximadamente el 90 por ciento de la energía de enlace de la red
está representado por el primer término de (3.7-12), que simboliza el exceso de
energía de atracción coulómbica entre iones de cargas opuestas, en relación con
la energía de repulsión de Coulomb entre iones de cargas iguales, en tanto que el
segundo término, que representa la parte aportada de repulsión a corto alcance,
constituye sólo aproximadamente el 1O por ciento del total. El hecho de que n
resulta ser un número bastante grande, coincide con las suposiciones originales relacionadas a la forma del potencial de repulsión a corto alcance y, en efecto, sirve
para validar hasta cierto punto dichas suposiciones.
La energía de cohesión de casi todos los cristales altamente iónicos de tipo
I-VII calculados así a partir de (3.7-12) y (3.7-30), concuerdan muy bien con los
valores determinados de un modo experimental, como se indica en la tabla 3.1. 9
Esta coincidencia con el experimento no es tan buena en el caso de los compuestos
completamente iónicos II-VI, como podría esperarse. Se debe tener en cuenta el
hecho de que estos cálculos son, hasta cierto grado, empíricos, y que relacionan un
conjunto de cantidades determinadas en forma experimental (espaciamientos reticulares y compresibilidad) con otras (exponentes del potencial de repulsión y energía de
enlace). Un cálculo verdaderamente fundamental de la energ:a de enlace del cristal,
se etectuará a partir del conocimiento de las propiedades mecánicas ondulatorias de
los iones positivos y negativos, y predeciría más que utilizaría, los valores de la
constante de red y las compresibilidades; las únicas cantidades medidas que aparecerían en una formulación de esta clase serían e, m, h, etc. Lowdin 10 llevó a cabo
9 Los valores aquí citados fueron tomados de F. Seítz, Modern Theory of Solids, McGrawHill, Nueva York (1940), tablas XXIV y XXVI, páginas 80-83.
10 P. Lowdin, Ark.Mat.
Astron. Fysik 35A, Nos. 9, 30 (1947).
76 Dinámico de redes cristalinas
TABLA 3.1.
Energías de enlace teóricas y experimentales
de cristales iónicos
Substancia
Uo (cale.)
kcal./mol
U0 (exp.) Exponente
kcal./mol de repulsión, n
LiCI
NaCI
KCI
RbCI
CsCI
193.3
180.4
164.4
158.9
148.9
198.1
182.8
164.4
160.5
155.1
7.0
8.0
9.0
9.5
10.5
NaBr
KBr
N al
KI
Rbl
171.7
157.8
160.8
149.0
144.2
173.3
156.2
166.4
151.5
149.0
8.5
9.5
9.5
10.5
11.0
ZnS (Zincblenda)
ZnSe
PbS
PbSe
819.0
790.0
705.0
684.0
851.0
845.0
731.0
735.0
9.0
9.5
10.5
11.0
cálculos de este tipo, cuyos resultados concuerdan bastante con el experimento. Sin
embargo, el análisis detallado de este tema está fuera del alcance de esta obra.
A pesar de todo, la teoría más sencilla de Born-Madelung tiene un valor considerable,
debido a que verifica el simple modelo conceptual del enlace iónico con el que
principiamos y porque permite que se entienda con facilidad el papel que desempeñan las fuerzas de repulsión Coulomb y de corto alcance en la determinación de
la energía de enlace en las substancias iónicas.
EJERCICIOS
l. Para la red lineal monoatómica de la sección 3.3, encuentre el coeficiente de atenuación
de ondas de frecuencias mayores que Y4fJ!m.
2. Derive la ecuación de movimiento para ondas transversales en la red monoatómica lineal
de la sección 3.3. Compare sus resultados con la ecuación de movimiento para ondas longitudinales.
3. Determine la velocidad de fase y la de grupo para ondas de las ramas óptica y acústica,
para la red diatómica de la sección 3.4. Grafique sus resultados en función de k.
4. La red de la zincblenda se puede considerar como una serie de planos (111) con
espaciamiento alternado a, a/3, a, a/3, a, a/3, • • • , en donde a es 1/4 del lado de una celda
unitaria cúbica. Cada plano contiene átomos de un solo tipo, de modo que los espacios atómicos
en planos sucesivos son alternados: Zn, S, Zn, S, Zn, • • • . Los planos se mantienen unidos alternativamente mediante un enlace covalente por átomo, normal al plano (111), y 3 enlaces de este
tipo por átomo a un ángulo con la dirección [111] cuyo coseno es 1/3, de tal modo que se
utiliza la misma cantidad de fuerza por unidad de desplazamiento para estirar un solo enlace o
un sistema de tres enlaces dispuestos a este ángulo, cuando un átomo se desplaza a lo largo de
la dirección angular [111]. Estudie la red diatómica del tipo que se ilustra en la figura que sigue,
con una constante de fuerza {3 que es la misma para cualquier desplazamiento, y luego defina y
resuelva las ecuaciones de movimiento para ondas longitudinales en la dirección (111) en la
zincblenda, y grafique la relación resultante de w en función de k en la primera Zona Brillouin.
¿Cuál es el borde de esta primera zona? Nota: para la zincblenda, b =a/3, m =/=M en la fJ.gura
antcri'-;r.
Energía de enlace de estructuras cristalinas iónicas
m
Zn-3
2n-2 2n-l
M
tf
2n 2n+l
m
11
M
tt
2n+2 2n+3
5. Resuelva el problema 4 para obtener las relaciones de w en función de k para ondas
longitudinales en la dirección [111] para la red de diamante. Diga si el hecho de que el
diamante sólo tiene átomos de una especie es la causa de que no existe una rama "óptica" para
esta estructura. Sin entrar en detalles compare resultados obtenidos con los del problema 4.
6. Si el coeficiente de rigidez elástica e para NaCl es 5 X 1011 dinas/cm2, encuentre la
constan te de fuerza {j y calcule la frecuencia de Reststrahl de este cristal.
7. Suponga que las vibraciones longitudinales de una cadena lineal de N átomos idénticos,
se limitan a obedecer las condiciones periódicas de frontera, de tal manera que el movimiento
del primero y el último átomos es idéntico. Encuentre el número de modos normales de vibración para este sistema.
8. Determine la constante de Madelung para la cadena lineal del problema 4, suponiendo
que los átomos de masa m tienen carga positiva y los de masa M tienen la misma carga; pero
negativa.
9. Suponga que un fluido isotrópico homogéneo con una constante dieléctrica K, se derrama en los espacios interatómicos de un cristal iónico, de tal manera que la interacción coulómbica se reduce por un factor de 1/K. Suponiendo que el potencial de repulsión de corto alcance
no varía, calcule el nuevo espaciamiento reticular y la nueva energía de enlace en términos de la
energía de enlace y el espaciamiento antiguos.
10. Analice las características de reflexión óptica de Ge, CdS, KBr y GaAs en la región
infrarroja lejana del espectro. Finalmente explique sus predicciones desde el punto de vista de la
física.
11. La imposición de condiciones periódicas de frontera a una cadena unidimensional de
átomos, corresponde físicamente al caso en que el principio y el fin de la cadena se unen para
formar un anillo continuo de átomos. ¿A qué sistema físico corresponde una red cuadrada
bidimensional de átomos que obedecen a condiciones periódicas de frontera en los bordes opuestos de la red? Explique el significado topológico de una red cúbica tridimendional que obedece
a condiciones periódicas de frontera en las caras opuestas de la muestra.
LECTURAS RECOMENDADAS
M. Born y M. Goppert-Mayer, Handbuch der Physik, Vol. 24/2, J. Springer Verlag, Berlín
(1933), p. 623.
M. Born y K. Huang, Dynamical Theory of Crystal Lattices, Oxford University Press, Oxford
(1956).
L. Brillouin, Wave Propagation in Periodic Structures, Dover Publications, Nueva York (1953).
C. Kittel, Introduction to So/id State Physics, 2.a edición, John Wiley & Sons, Nueva York
(1956), capítulo 3.
F. Seitz, Modern Theory of Solids, McGraw-Hill Book Co., Inc., Nueva York (1940), capítulo 2.
R. A. Smith, Wave Mechanics of Crystalline Solids, Chapman & Hall, Ltd., Londres (1961),
capítulo 3.
J. M. Ziman, Electrons and Phonons, Oxford University Press, Nueva York (1960), capítulos 1 y 3.
CAPITULO
4
Mecánica cuántica.
Generalidades
4.1
INTRODUCCION
Durante los últimos años del siglo diecinueve y los primeros del presente, los
científicos se encontraron con un gran número de hechos observados en su experimentos que no se podían explicar debidamente basándose en la mecánica y la
electrodinámica clásicas. Entre los fenómenos poco comprendidos se incluían algunas
de las propiedades térmicas y eléctricas fundamentales de los sólidos. Por ejemplo, el
hecho de que algunos sólidos son muy buenos aisladores, con resistividades específicas
mayores de 10 12 ohm-cm, y otros son conductores excelentes con resistividades del
orden de 10- 5 ohm-cm, no se podía explicar en absoluto desde el punto de vista de
la teoría clásic.-. Sin embargo, a partir de 1901 gracias a la explicación dada por
Max Planck sobre la distribución espectral de radiación proveniente de cuerpos calientes incandescentes, se pudo demostrar que casi todos estos resultados experimentales hasta entonces inexplicables, demostraron estar de acuerdo con las predicciones de una nueva mecánica la cual difiere en muchos aspectos importantes de
la mecánica newtoniana, aunque concuerda con ella en el límite en que las masas y
las energías de las partículas se hacen relativamente grandes. Esta nueva y ampliada
forma de la mecánica, que resultó especialmente útil en la descripción de acontecimientos que se desarrollan a una escala atómica, se denominó mecánica cuántica.
Aunque es imposible presentar en esta obra una relación extensa sobre el tema, se
analizarán algunos de sus aspectos más importantes, a fin de proporcionar al lector
los conocimientos necesarios para resolver problemas dinámicos simples desde el punto de vista de la mecánica cuántica, y para apreciar los resultados de los cálculos
concernientes a sistemas más complejos que se dan más adelante, al explicar el
comportamiento físico de cristales reales.
4.2
RADIACION DEL CUERPO NEGRO
En la figura 4.1 se ilustra la distribución espectral de la intensidad de radiacwn emitida por un radiador incandescente ideal, llamado "cuerpo negro" detemlinada experimentalmente. Hacia fines del siglo pasado, se realizaron varios intentos
para explicar estos resultados a base de la mecánica clásica y la teoría electromagnética, tratando al campo de radiación como si fuera un fluido con propiedades
79
80 Mecánica cuántica. Generalidades
termodinámicas tales como temperatura, presión, entropía, etc., que se determinaban
mediante las leyes de la electrodinámica y la termodinámica clásicas Se supuso que
este fluido estaba en equilibrio con los átomos de la substancia radiante y éstos se
consideraban como osciladores armónicos dásicos. Ninguno de estos intentos tuvo
éxito para describir la parte de las curvas, correspondiente a longitudes de onda
corta, aunque se obtuvieron coincidencias aceptables con los datos experimentales en
el límite o sea, para las longitudes de onda largas (la Ley de Rayleigh-Jeans). Los
cálculos clásicos que se basaron siempre en la idea de que los osciladores atómicos
podían absorber o emitir continuamente energía en cualquier cantidad, grande o
pequeña, predijeron invariablemente intensidades espectrales infinitas en el límite de
las longitudes de onda corta. Esto dio como resultado la emisión de una energía de
radiación total infinita por unidad de tiempo, lo cual constituye un resultado obviamente absurdo.
3000 °K
I(X)
o
1
2
3
x (micrones)
Figura 4.1.
Representación esquemática de la distribución de frecuencia de la radiación emitida
por un radiador incandescente ideal o "cuerpo negro" a varios valores diferentes de
temperatura.
En 1901, Max Planck logró explicar la forma de las .curvas de intensidad de
radiación espectral correspondientes a la radiación de un cuerpo negro, formulando
la hipótesis de que los osciladores atómicos podían radiar o absorber energía sólo en
paquetes o grupos discretos (denominados fotones) cuya energía está dada por
e= hv = nw,
(4.2-1)
n = hj2n.
(4.2-2)
en donde,
En este caso, v es la frecuencia del oscilador (o de la radiación absorbida o
emitida), w = 2nv, y h es la constante atóm1ca universal (constante de Planck) de
magnitud
h = 6.625 x 10- 27 erg-sec
n = hj2n = 1.054 X 10- 27 erg-sec.
Efecto fotoeléctrico
81
Así pues, se supone que los osciladores poseen sólo ciertos estados de energía permisibles de una energía total O, líw, 2líw, 3líw, • • • nlíw, • • • , en donde las transiciones entre estos estados permisibles se efectúan mediante la absorción o emisión de
fotones cuya energía es líw.
A ciertos científicos de esa época, la hipótesis cuántica les pareció muy extraña, ya que estaban acostumbrados a las ideas de la mecánica clásica; pero la
coincidencia que se obtuvo a partir de entonces con los datos experimentales fue
excelente y el valor de h que usó Planck para lograr que su teoría concordara con
los datos experimentales (6.55 x I0- 27 erg-seg), es solamente uno por ciento menor
del valor que en la actualidad se acepta como correcto. Además, es muy importante
observar que los éxitos subsecuentes de la teoría cuántica para explicar fenómenos
muy diferentes, no dejaron ninguna duda respecto a su validez esencial. A la luz de
los conocimientos actuales, no es difícil aceptar el hecho de que la energía, al igual
que la materia, puede estar compuesta de partículas discretas e indivisibles.
4.3
EFECTO FOTOELECTRICO
Cuando se deja que la luz caiga sobre la superficie de un metal, éste puede
expulsar electrones hacia un vacío, en donde los puede recoger un ánodo, como se ilustra
en la figma 2.4(a). La máxima energía inicial de estos fotoelectrones emitidos se
puede medir insertando un rejilla entre el fotocátodo y el ánodo, y determinando el
potencial retardador que se debe aplicar entre la rejilla y el cátodo para reducir la
fotocorrriente a cero, como se indica en la figura 4.2{b). Se puede demostrar en
esta forma que, si la luz incidente tiene una frecuencia menor que la de una
frecuencia de umbral dada (¡Jo, no se produce ningún efecto fotoeléctrico en absoluto, sea cual fuere la intensidad de la luz. Para una radiación incidente de una
frecuencia mayor que w 0 , los fotoelectrones se· emiten en una can ti dad proporcional
Luz
Anodo colector
+
Foto corriente
Iluminación interna
Fotocátodo metálico
Iluminación leve
Potencial de rejilla
(o)
Figura 4.2.
( b)
(a) Diagrama esquemático del aparato usado para estudiar los efectos fotoeléctricos
en los metaies, (b) una gráfica de la fotocorriente observada en función del potencial retardador para varios niveles de intensidad de la luz incidente.
82 Mecánico cuántico. Generalidades
a la intensidad de la iluminación incidente, haciendo que fluya en el circuito externo
una fotocorriente proporcional a la intensidad de la luz. La máxima energía inicial
de estos electrones, medida por el método del potencial retardador, es estrictamente
proporcional a w- w 0 , en donde w es la frecuencia de la luz incidente.
La existencia de la frecuencia de umbral no se puede explicar a base de la
física clásica, y no fue sino hasta después de 1905, cuando Einstein describió la
naturaleza física del efecto fotoeléctrico basándose en la hipótesis cuántica de
Planck. De acuerdo con la explicación de Einstein, los electrones que están dentro
del metal deben poseer una energía potencial menor que la de los electrones que
están en reposo dentro del vacío, fuera de la superficie metálica; de lo contrario, el
metal podría emitirlos espontáneamente en la obscuridad. Este hecho lleva al cuadro
conceptual de un metal tal como se ilustra en la figura 4.3. Para que los electrones
del metal puedan convertirse en fotoelectrones, deben superar una barrera de energía
potencial de una magnitud de por lo menos ecp 0 • El potencial cp0 , denominado
función de trabajo en vacío, es una propiedad característica del material del cátodo
emisor. De acuerdo con las ideas cuánticas de Planck, la absorción de un fotón cuya
energía es menor que ecp 0 por parte del metal, no puede excitar a un electrón hacia
el vacío, sino que sólo le imparte cierta energía cinética que finalmente se disipará
dentro del metal en la forma de calor por medio de colisiones.
Por otro lado, si el fotón absorbido tiene una energía ecp 0 , puede excitar un
fotoelectrón hacia el vacío con una energía cinética cero y, si la energía del fotón
\
Frecuencia incidente
del fotón "'o' etf>0 111
Energía
f _ ___,
Fotoelectrón emitido al vacío
con un E.C. cero
e <Po
_L~~~~~~~~
Electrones
Vacío
Figura 4.3.
Vacío
Metal
Modelo conceptual simplificado de un metal, representado como un pozo de po·
tencial que contiene electrones libres y en el que se basa la teoría de Einstein
sobre los efectos fotoeléctricos.
es mayor que ecp 0 , puede excitar a un fotoelectrón hacia el vacío con un exceso de
energía cinética que puede ser de la magnitud hw - ecp 0 , siendo hw la energía del
fotón incidente. La máxima energía de los fotoelectrones emitidos es, entonces,
(4.3-1)
en donde la frecuencia de umbral w 0 debe estar dada por
W0 =
e</> 0 /h.
(4.3-2)
Todo esto concuerda con los hechos experimentales que se describieron previamente. Además, la ecuación (4.3-1) predice que la pendiente de la curva que da Em
en función de w, será la constante de valor h. ¡Cuándo esta pendiente se evalúa
basándose en datos experimentales, se encuentra, en efecto, que es una constante y
da un valor de h que concuerda exactamente con el valor derivado por Planck de los
datos experimentales corrrspondientes a la radiación de cuerpo negro! El efecto
Calor específico de los sólidos
83
fotoeléctrico proporcionó así, en unos cuantos años, una confirmación notable de la
teoría cuántica, en un campo muy alejado de su aplicación original.
4.4
CALOR ESPECIFICO DE LOS SOLIDOS
La física clásica considera que un cristal sólido es un conjunto de átomos que
se mantienen unidos en un arreglo periódico por medio de ciertas fuerzas de atracción. Se supone que los átomos son libres para vibrar alrededor de sus posiciones de
equilibrio bajo el efecto de las fuerzas presentes y, para lograr una primera aproximación, las fuerzas y los desplazamientos átomicos se relacionaron por medio de la
ley de Hook. Entonces, el efecto de la energía térmica consistiría en hacer que estos
átomos vibraran como osciladores armónicos alrededor de sus posiciones de equilibrio. Un resultado elemental de la teoría cinética clásica consiste en que si las
energías de un conjunto de osciladores clásicos se distribuyen de acuerdo con la ley
de Boltzmann en equilibrio térmico, la energía promedio de un oscilador es kT para
cada grado de libertad vibratoria, en donde T es la temperatura absoluta y k la
constante de Boltzmann (igual a 1.380 x 10- 16 erg¡oK). En una sección posterior se
verá cómo se derivó este resultado. Entonces, de acuerdo con la física clásica, puesto
que hay tres grados de libertad de vibración independiente, por átomo, se debe
esperar que la energía interna térmica total de un cristal compuesto de N átomos
idénticos sea
U= 3NkT.
(4.4-1)
La capacidad calórica a volumen constante, Cv, es por definición, la razón de
aumento de la energía interna por unidad de incremento de la temperatura, medidas
en condiciones de volumen constante o, en este caso.
c. = (oUfoT). = 3Nk.
(4.4-2)
De acuerdo con la fórmula clásica (4.4-2), la capacidad calórica debe ser independiente de la temperatura. Si en (4.4-2) N es igual al número de Avogadro NA
(igual a 6.025 x 10- 23 mol- 1 ), se puede ver que la capacidad calórica molar de
todos los elementos químicos sólidos debe tener el mismo valor 3NAk, igual o
aproximadamente 6 cal °K-- 1 mol- 1 . Este resultado se conoce como la ley de Dulong
y Petit, y concuerda bastante con el experimento para muchos elementos a la temperatura ambiente y por encima de ésta. A temperaturas bajas, el resultado clásico
no concuerda con l::t experiencia, ya que los datos experimentales indican que la
capacidad calórica se acerca a .;ero, conforme la temperatura tiende a cero en la
escala absoluta, según se indica en la figura 4.4. Por supuesto, estas mismas observaciones generales se aplican al calor específico a volumen constante cv, que se define
sencillamente como
c.= (oU/oT)vfV.
(4.4-3)
En 1911, Einstein explicó las discrepancias entre la teoría clásica y la experiencia, y en 1912, Debye propuso una explicación más exacta basándose en la teoría
cuántica. De acuerdo con la hipótesis original de Planck, un oscilador armónico
puede poseer sólo ciertos estados de energía discreta que tienen los valores
(4.4-4)
84
Mecánica cuántica. Generalidades
c.
3Nk
Figura 4.4.
ley clásica de Dulong • Petit
_____
1_ _______~
Datos experimentales típicos· para el calor específico de una substancia sólida, en
función de la temperatura, en comparación con el resultado clásico de Dulong-Petit.
en donde w 0 es la frecuencia clásica del oscilador. Como se verá más tarde, esto da
como resultado un promedio de energía de oscilador diferente del resultado clásico,
y capacidades calóricas que concuerdan con los datos experimentales a todas las
temperaturas. También en este caso, la teoría cuántica ha proporcionado una explicación sencilla de un efecto que no podía analizarse de acuerdo con los métodos
clásicos, siendo también este campo muy distinto del de la aplicación original.
4.5
EL ATOMO DE BOHR
Uno de los aspectos más desconcertantes del comportamiento atómico al que
se enfrentaron los físicos del siglo diecinueve, consistió en los espectros de emisión y
absorción de los elementos. Las líneas espectrales claras y discretas que se observaron, no podían entenderse en absoluto a la luz de la mecánica clásica y la teoría
electromagnética. No obstante, en 1913, Niels Bohr propuso un modelo del átomo
del hidrógeno basado en la hipótesis cuántica de Planck, que describe con precisión
sorprendente las principales características del espectro del hidrógeno atómico.
En el modelo de Bohr, que se basó en el concepto del átomo nuclear propuesto por Rutherford en 1910, se supone que un electrón de masa m y carga -e
se desplaza en un órbita alrededor de un núcleo mucho más masivo, de carga + Ze,
en donde Z es un entero. La introducción del factor Z permite explicar no sólo el
hidrógeno (Z = 1), sino también otros iones parecidos a éste, tales como He+ (Z =
2), u++ (Z = 3), Be+++ (Z = 4), etc., que se componen de un solo electrón y un
núcleo pesado.
De acuerdo con la electrodinámica clásica, las cargas aceleradas siempre irradian
energía, y un sistema como el que propuso Bohr, en donde el electrón está sometido siempre a una aceleración central, perdería energía constantemente en forma de
radiación y el electrón giraría en espiral acercándose gradualmente hacia el núcleo.
Sin embargo, Bohr supuso que el electrón podía existir en órbitas estacionarias
alrededor del núcleo sin irradiar energía en absoluto, a condición de que la cantidad
de moPimiento angular relacionada con este movimiento estuviera cuantizada en tal
forma que sólo se tuvieran los valores permitidos nh, en donde n es un entero
positivo. Entoncc~. b~ transiciones entre los estados estacionarios permitidos n y m
El átomo de Bohr
85
se relacionan con la emisión o absorción instantánea de un fotón de frecuencia Wmn
tal que
(4.5-1)
en donde Em es la energía asociada con el estado de la cantidad de movimiento
angular mh y En de energía correspondiente al estado de la cantidad de movimiento angular nh.
Por supuesto, desde el punto de vista de la dinámica, la órbita del electrón
alrededor del núcleo podía ser circular o elíptica; pero para facilitar las cosas, se
supondrá que es circular. Los valores permisibles de la cantidad de movimiento
angular L están restringidos a enteros múltiplos de h, de tal manera que
(n = 1,2,3, ···),
(4.5-2)
en donde rn es el radio de la órbita con un momento angular nh y Wn es la
velocidad angular del electrón dentro de dicha órbita. Para una órbita estacionaria, el
radio rn debe ser tal que la fuerza electrostática de atracción entre el electrón y el
núcleo, Ze 2 /r~, es justamente la fuerza centrípeta mvMrn necesaria para mantener al
electrón dentro de la órbita circular, de donde,
(4.5-3)
Las ecuaciones ( 4.5-2) y ( 4.5-3) se pueden resolver ya como ecuaciones simultáneas para r n y W 12 , dando
n21i2
r =-" Zme 2
(4.5-4)
y
(4.5-5)
La energía cinética del sistema, ek> está dada por
Z l me4
_ 1
2 _
2 2 _
¡;k- "lmv"- !mr"w" - - -2- 2 •
2n li
(4.5-6)
La energía potencial eP, es
¡;P =
2
Z 2 mé
-Ze ft"n = - -2-2-.
n li
(4.5-7)
Por tanto, la energía total del sistema es
(n = 1,2,3, ···).
(4.5-8)
Como se puede ver, la energía del sistema está limitada a ciertos valores discretos o niveles de energía correspondientes a n = 1, 2, 3, •••. Si Z = l, el sistema
86 Mecánica cuántica. Generalidades
l
Energía •
o
¡¡-
~
114'1
-
11
Serie
de Paschen
•3= 1
Serie
de Balmer
Serie
de Lyman
me 4
Figura 4.5.
Niveles de energía del átomo de hidrógeno según lo pll'dlc ho por la teoría de
Bohr. Se indican las transiciones correspondientes a cierta~ lmcas espectrales prominentes.
correspondiente al átomo de hidrógeno y el diagrama de niveles de energía resultante
se ilustra en la figura 4.5. Las transiciones entre los niveles de energía se logran
mediante la absorción o la emisión de un fotón cuya frecuencia está dada por
(4.5-1), correspondiendo cada transición de este tipo a una línea posible del espectro. La teoría de Bohr explica con claridad y precisión el espectro del hidrógeno y
de los iones semejantes a él, y se puede ver que las frecuencias espectrales predichas
y las observadas son muy semejantes.
En la exposición anterior se supuso que las órbitas de los electrones son
circulares. En general, las órbitas pueden ser elípticas y, en efecto, se puede demostrar que existen series regulares de órbitas elípticas permitidas que satisfacen la
condición cuántica ( 4.5-2). Sin embargo, estas órbitas elípticas no establecen nuevos
niveles energéticos, sino que sólo representan órbitas para las que la cantidad de
movimiento angular tiene un valor mh en donde m es un entero menor que n, así
pues, el sistema posee una energía En de acuerdo con lo que determine (4.5-8); pero
su cantidad de movimiento angular, aunque sigue siendo un entero múltiplo de h, es
menor que el valor máximo nh que corresponde a una órbita circular. También se ha
considerado que el núcleo está fijo, lo cual es cierto sólo en el límite en que la
relación de la masa nuclear a la electrónica se hace infinita. Para una masa nuclear
finita, el núcleo y el electrón girarán alrededor de un centro común de masa. Este
efecto se explica fácilmente y el resultado es que la cantidad m de las ecuaciones
anteriores se debe substituir por una masa reducida J1 dada por
(4.5-9)
siendo M la masa nuclear. En el caso del átomo del hidrógeno, la masa reducida
difiere de la electrónica en aproximadamente 1 parte por 1850.
La hipótesis .te De Broglie
87
Se hicieron numerosos intentos para generalizar el modelo de Bohr con el fin
de explicar los espectros del helio y átomos más complejos; durante la década que
siguió a la presentación del modelo, todos los esfuerzos fracasaron debido a que no
se encontró una forma sencilla para describir las órbitas. En general, los resultados
de los cálculos hechos no concordaron con la experiencia, ni se logró que la teoría
de Bohr explicara por qué algunas transiciones entre estados electrónicos en átomos
complejos, aparentemente, estaban prohibidas. No obstante, el modelo de Bohr proporcionó por vez primera una explicación simple, coherente y exacta de los espectros de átomos monoelectrónicos así como un marco conceptual que permitía entender ciertos aspectos del comportamiento atómico y que resulta útil incluso hasta
hoy.
4.6
LA HIPOTESIS DE DE BROGLIE Y LAS
PROPIEDADES ONDULATORIAS DE LA MATERIA
En 1924, De Broglie sugirió que a una partícula con cantidad de movimiento
p, se le podría asociar una onda de longitud de onda A tal que
h
h 2n
p = ¡ = 2n T = ñk.
(4.6-1)
La condición cuántica de Bohr se sigue directamente de esta hipótesis, si se
supone que las órbitas permitidas de la sección anterior alojan un número entero de
longitudes de onda de la partícula, definidas por (4.6-1 ). Puesto que la longitud de
trayectoria de la órbita es 21Trn, de acuerdo con este concepto, se debe determinar
o bien,
(4.6-2)
Davisson y Germer demostraron experimentalmente que los electrones podían,
en efecto, difractarse de los cristales, obteniéndose el mismo patrón para un cristal
dado que el que producen los rayos X de longitud de onda A = h/p, según propuso
De Broglie. La condición para la difracción de electrones de planos cristalinos es,
precisamente, la condición de Bragg siendo A igual a h/p,
nA. = nh/ p = 2d sen 9.
(4.6-3)
Posteriormente se ha demostrado que los átomos neutros, los protones, los
iones positivos y otras partículas, presentan el mismo comportamiento ondulatorio, y
en cada uno de estos casos se satisface la relación de De Broglie ( 4.6-1 ).
4. 7
MECANICA ONDULATORIA
En 1926, Schrbdinger desarrolló un patrón unificado para la mecamca, basándose en las ideas físicas de la teoría cuántica de Planck, y utilizando los conceptos
de De Broglie sobre la naturaleza ondulatoria de la materia. Este patrón, que se
denomina mecánica ondulatoria, constituye una versión muy general de las leyes de
la mecánica, diseñada especialmente para abarcar el campo de los fenómenos ató-
88 Mecánica cuóntictl. Generalidades
micos y nucleares. Este planteamiento ha tenido un éxito rotundo y, hasta donde se
puede afirmar en la actualidad, constituye una forma correcta de describir el comportamiento físico de la materia en una escala atómica o en cualquier escala, ya que
la mecánica ondulatoria proporciona los mismos resultados qu¡; la mecánica newtoniana clásica para los sistemas relativamente grandes y masivos que se pueden
observar en forma macroscópica. Casi al mismo tiempo, Heisenberg diseñó otro sistema de mecánica cuántica denominada mecánica de matrices, basada en las mismas
ideas físicas que la mecánica ondulatoria. Aunque su formulación matemática difiere
bastante de la mecánica ondulatoria de Schrodinger más tarde se demostró que, en
realidad, las dos mecánicas constituyen sistemas equivalentes. La exposición de esta
obra se confirmará mayormente a la descripción de la mecánica ondulatoria de
Schrodinger, que es más sencilla y se relaciona con mayor facilidad a las situaciones
físicamente observables.
En la formulación de Schrodinger de la mecánica cuántica, una cantidad compleja '11, denominada función de onda, se relaciona con un sistema dinámico. Esta
cantidad es una función de tres coordenadas espaciales para cada partícula del sistema, y el tiempo. Las propiedades dinámicas del sistema están íntimamente relacionadas con las propiedades de la función '11 y el comportamiento dinámico del
sistema se puede determinar cuando se conoce la función '11 del sistema. Para un sistema de una sola partícula, que será el tema general de este libro, las propiedades
de la función de onda '11 se pueden expresar de acuerdo con los siguientes cinco
postulados: 1
l. Se tiene una función de onda compleja relacionada con la partícula,
'11 (x, y, z, t), en donde x, y, z, son las coordenadas espaciales y t es el
tiempo.
2. La expresión clásica correspondiente a la energía total e del sistema (que se
conoce con el nombre de Hamiltoniano clásico del sistema) dado por
p2
2m + V(x,y,z) =e,
(4.7-1)
en donde p es la cantidad de movimiento de la partícula, m es su masa y
V(x, y, z) es la energía potencial, se pueden convertir en una ecuación ondulatoria por medio de ciertos operadores de asociación con las cantidades
dinámicas clásicas, y permitiendo que estos operadores se apliquen a la
función de onda como lo indica (4.7-1). Los operadores correspondientes a
las cantidades dinámicas pertinentes son:
dynamical variable
associated operator
X, y, O Z
f(x,y,z)
~
X, y, O Z
~
f(x,y,z)
p
~
~V
'
e
~
(4.7-2)
ha
; ot ·
1 C. W. ShNwin, lntrodur·tion to Quantum Mechanics, Holt, Rinehart and Winston, Nueva
'orl.. (1959). p;Í¡:ina 14. pJ¡•ina\ li2-63 Con'>Ílltcs<' también respecto a la ampliación de estos
P<"tul.ld<" a ~~~ll'llla~ de m..Í\ de una partícula
Mecánica ondulatoria
89
Puesto que las componentes cartesianas de operador son (3/3x, 3/3y, 3/3z),
es evidente que los operadores correspondientes a las componentes de la cantidad de movimiento Px• Py· Pz son (h/iX3/3x), {h/iX3/3y) y (h/iX3/3z), respectivamente. Así también, puesto que p2 = p • p, el operador correspondiente p 2 debe ser - tJ2( V· V) o - fi2 V2 , de donde, V2 representa al operador
laplaceano 32 ¡ax2 + 3 2 /3y 2 + 32 /3z 2 , Al reemplazar las cantidades dinámicas
p 2 , V(x, y, z) y e en ( 4.7-1) con sus operadores correspondientes y al permitirles que operen sobre la función de onda '11, se obtiene la ecuación ondulatoria
h2
ñ a'l'
2
- 2
- V 'Y + V(x,y,z)'l' = - 7 - .
m
1
at
(4.7-3)
Esta es la ecuación de Schrodinger para la función ondulatoria, que con
frecuencia se expresa en la forma
ha'Y
Jt"'Y = - - ¡
en donde
ot '
(4.7-4)
Jlf representa el operador hamiltoniano
h2
Jt" = - 2 m V2 + V(x,y,z).
(4.7-5)
3. Las cantidades 'IF(x, y, z, t) y V'll deben ser finitas, continuas y de un solo
valor para todos los valores de x, y, z y t.
4. La cantidad '11*'11, en donde '11* es el conjugado complejo de '11, es siempre
una cantidad real. Esta cantidad se interpreta como la densidad de probabilidad en el sentido de que '11*'11 dv es la probabilidad de que las partículas se encuentren dentro del elemento de volumen dv en el instante t. Esta
es toda la información respecto a la ubicación real de la partícula, que se
puede obtener de la función de onda; en cuanto al sitio exacto en donde se
encuentra la partícula en un momento dado y cuál es su trayectoria, esto
no se puede determinar en forma precisa de acuerdo con la mecánica cuántica. Por supuesto, para un objeto grande o masivo, '11*'11 es grande sólo
dentro de las fronteras clásicas del objeto y se mueve en el tiempo según lo
predicen las leyes de Newton; pero, en una escala atómica, será imposible
localizar una partícula en forma exacta y seguir su trayectoria con minuciosidad. Puesto que '11*'11 dv es una densidad de probabilidad y, puesto que la
probabilidad de que la partícula se encuentre en algún punto en el espacio,
es la unidad, es necesario que la función de onda sea normalizada de tal
manera que
i
'Y*'I'dv=1,
(4.7-6)
tomándose la integral sobre todo el espacio.
S. El promedio o valor esperado (a.) de cualquier variable dinámica a con la
que se asocia un operador a 0 p.• se define mediante
(01) =
i
'1'*01op '1' dv,
tomándose la integral sobre todo el espacio.
(4.7-7)
90 Mecánica cuántica. Generalidades
Las características esenciales de toda la mecánica ondulatoria están contenidas
en estos cinco postulados. Lo que resta de este análisis estará dedicado a examinar
las implicaciones de la misma y a aplicarlas a problemas específicos. No se puede
demostrarlas, sólo se puede enunciar que los resultados obtenidos, siempre que se
han sometido a prueba por medio de experimentos, han coincidido con las observa·
ciones dentro de los límites de la incertidumbre experimental que, en muchos casos,
ha sido extremadamente pequeña. Por supuesto, se tratará de demostrar que los
resultados de la mecánica ondulatoria son paralelos con los dictados de la intuición
y coinciden con los resultados de la mecánica clásica cuando puede esperarse que
esto suceda.
En relación al último punto, se puede demostrar que la mecánica ondulatoria
proporciona los mismos resultados que la mecánica clásica en los que se relaciona
con los valores promedios o esperados de cantidades dinámicas. Para hacer las cosas
más sencillas, sea una situación unidimensional en la que el sistema dinámico está
confinado al eje x. El valor esperado de la cantidad de movimiento Px, de acuerdo
con (4.7-7), es, entonces,
f
oo
<Px) =
li a
'l'*(x,t) · - -:--a 'l'(x,t) dx,
(4.7-8)
X
1
_ 00
por lo que, al tomar una derivada de tiempo y diferenciarla bajo el signo de la
integral de la derecha,
d(px)
dt
li
-- = -
i
f"" -a'I:'* -a'I:' dx + -li f"" '1' *8- '1' dx
2
-ro
at ox
i
- 00
oxot
.
(4.7-9)
Ahora, el valor de a\f! jat está dado por la ecuación de onda (4. 7-3) y el valor
de a\f!* jat se puede expresar en forma similar escribiendo la ecuación de onda en
función de \f!* en lugar de hacerlo en función de \f!. Esto se logra escribiendo la
función compleja \f!(x, t) como la suma de partes reales e imaginarias
'l'(x,t) = u(x,t) + iu(x,t),
(4.7-10)
substituyendo esta forma de \f! en (4.7-3) e igualando las partes reales e imaginarias
de ambos lados de la expresión resultante, para obtener dos ecuaciones de la forma
li 2 2
au
--Vu+uV=ñ-.
2m
ot
(4.7-11)
Si se multiplica la segunda de estas ecuaciones por - i y se suma a la primera,
se obtiene una ecuación de onda para \f!* ( =u - iv) de la forma
li 2
* ñ D'l'*
- - vzll'* + Vtl' = - - - .
2m
' it
(4.7-12)
Dependencia del tiempo de la función de onda
En la ecuación ( 4. 7-9), si se expresa
mediante (4.7-12), se obtiene
91
a\lt j"ot por medio de (4. 7-3) y a\lt* jat
d(px) = - ~ foo [azq¡* o'l' -'V* o3'!1] dx + foo [ V'!l* o'V- '1'* ~ (V'I')] dx
2m -oo ox 2 ax
ox 3
-oo
OX
ax
dt
= -
~ f<X) [~
2m
= -
(a'!l o'V* - '1'* azq¡)] dx- Joo 'V* av '1' dx
-ac ox ox OX
-oo '
ox 2
ox
~ [o'V* o'V- 'V* az~]oo - Joo 'V* av 'V dx.
2m
ox ax
OX
o
-oo
-oo
(4.7-13)
ax
De acuerdo con el postulado ( 4) anterior, la integral de la cantidad \lt*\lt =
u 2 + v 2 sobre el rango de oo a - oo, debe existir; esto significa que tanto u y v,
como sus derivadas, deben tender a cero conforme x se acerca a oo ó - oo. Por tanto,
\lt y a\lt jax tienden a cero dentro de estos límites, y el primer término de la
expresión (4.7-13) desaparece. No obstante, de acuerdo con el postulado (5) anterior, el segundo término de ( 4. 7-13) representa el valor esperado de la cantidad
- aV/ ax, que es la fuerza clásica ejercida sobre la partícula. En consecuencia, se
tiene que
(4.7-14)
que es, sencillamente, la ley del movimiento de Newton. Por tanto, es evidente que
en lo que respecta a los valores esperados, la mecánica ondulatoria concuerda con
las ecuaciones de la mecánica clásica.
4.8
DEPENDENCIA DEL TIEMPO DE LA FUNCION DE ONDA
Se supondrá que la ecuación de Schrodinger (4.7-3) se puede resolver mediante
las técnicas matemáticas usuales o sea, separando las variables. Así pues, se supondrán soluciones de la forma
'V(x,y,z,t) = 1/J(x,y,z)r/J(t),
(4.8-1)
en donde 1/1 depende sólo de las coordenadas espaciales y 41 depende sólo del tiempo.
Al derivar (4.8-1) y al substituirla nuevamente en (4.7-3), es evidente que
n
2
--rjJV
2m
2
n dr/J
1/1+ Vr/Jl/1= ---:1/1-.
z
dt
(4.8-2)
Si se dividen ambos lados de la ecuación entre \lt = 411/J, se tiene que
¡¡z vzlf¡
1i 1 dr/J
2m 1/J
i </> d t
- - - + V(x,y,z) = - - - - =e.
(4.8-3)
92 Mecánica cuántica. Generalidades
En ( 4.8-3), el lado izquierdo es una función exclusiva de las coordenadas
espaciales, en tanto .:¡ue la expresión central está en función del tiempo solamente.
La única forma en que esta igualdad se puede aplicar a todos los valores de las
variables, es que cada expresión por separado sea igual a una constante denominada
constante de separación y representada por e en ( 4.8-3). En realidad, son dos ecuaciones separadas, una para cp(t), y la otra para ¡J;(x, y, z), de donde,
ie
d</Jfdt = - - </J(t)
h
(4.8-4)
2m (e- V(x,y,z)) 1/1( x,y,z ) -O.
_
.1 2 lj¡ + ""j;2
(4.8-5)
y
La ecuación ( 4.8-4) se puede integrar de tal modo que dé
(4.8-6)
La constante de integración que normalmente aparecería como un factor multiplicativo ( 4.8-6) se iguala arbitrariamente a la unidad. Al hacer esto, no se pierde la
generalidad que se ha venido sosteniendo. De acuerdo con ( 4.8-1), la función de
onda dependiente del tiempo, '11, se puede expresar ahora como
I.JI(x,y,z,t) = ¡f¡(x,y,z)e-ietfn,
(4.8-7)
en donde ¡J;(x, y, z) es una solución de ( 4.8-5).
La expresión ( 4.8-5) se denomina ecuación independiente del tiempo, de
Schrodinger, y sus soluciones ¡J;(x, y, z) se llaman funciones de onda independientes
del tiempo o de estado estacionario. La ecuación ( 4.8-5) se puede expresar también
como sigue
(4.8-8)
en donde ;jf es el operador hamiltoniano expresado por (4.7-5). Normalmente conviene, siempre que sea posible, resolver las ecuaciones independiente del tiempo
( 4.8-6) y utilizar lo más que se pueda sólo las funciones de onda independientes del
tiempo. Las dependencias del tiempo, siempre que se necesiten, se pueden expresar
utilizando ( 4.8-7).
Para lograr esto en forma correcta, se deben observar ciertos resultados que se
obtienen cuando la función de onda tiene la forma ( 4.8- 7). En primer lugar, si la
función de onda tiene esta forma, entonces,
(4.8-9)
y '11*\lf propiamente dicha es independiente del tiempo e igual a ¡J;*¡J; -; la terminología de funciones de onda de estado estacionario, se aplica a funciones de onda de
esta índole. Como consecuencia de este resultado, ¡J¡*¡J¡ tiene la misma interpretación
de densidad de probabilidad con respecto a las funciones de onda independientes del
tiempo, que la que tiene \lf*\lf con respecto a las dependientes del tiempo. Además,
de acuerdo con ( 4.8-9), se sigue que
1
•p*•p dv =
1
¡f¡*¡f¡ dv = 1,
(4.8-10)
Dependencia del tiempo de la función de onda 93
y que la condición de normalización para las funciones independientes del tiempo
(4.8-7) es, por tanto, la misma que la que corresponde a las funciones dependientes
del tiempo. Por último, si las funciones de onda tienen la forma (4.8-7) y si a 0 p.
depende sólo de las coordenadas y no explícitamente del tiempo, el valor esperado
de ia variable dinámica representado por el operador CXop. se puede expresar como
(4.8-11)
ya que los factores exponenciales de tiempo se anulan al igual que sucede en
(4.8-9), si CXop. no tiene una dependencia explícita del tiempo. Si a 0 p. depende
explícitamente del tiemp<', entonces las funciones de onda dependientes del tiempo
se deben emplear normalmente para evaluar (a).
Se debe observar que estos resultados pueden aplicarse sólo cuando la función
de onda total tiene la forma (4.8-7). Si la función de onda total - ('ñ/iXo/ot), es
una superposición de funciones de la forma ( 4.8-7) -como puede suceder aun cuando se satisfaga la ecuación ondulatoria dependiente del tiempo- estos tres resultados
ya no son válidos y, para calcular las propiedades del sistema, se deben utilizar las
funciones de onda dependientes del tiempo.
Se puede demostrar fácilmente, usando la función de onda (4.8-7) en (4.7-7),
con el operador de energía dependiente del tiempo - (h/i)(o/ot), que el valor esperado de la energía de un sistema en un estado representado por una función de
onda de esta clase es, sencillamente, el valor de la constante de separación e. Por
supuesto, se puede prever este resultado gracias a la notación seleccionada para la
constante de separación. También se puede demostrar, a partir de (4.8-8), que el valor
esperado del operador hamiltoniano :tf para un sistema en un estado representado
por este tipo de función ondulatoria (el cual, puesto que :tf es un operador independiente del tiempo, se puede calcular empleando la función de onda independiente
del tiempo de acuerdo con (4.8-11)), es igual a e, el valor esperado de la energía.
Las expresiones (4.8-4) y ( 4.8-5) no imponen ninguna restricción en el valor de
e, ya que para cualquier valor de e existe una \}1 que satisface estas ecuaciones. Sin
embargo, los requisitos de continuidad, el aspecto finito y el valor único, pueden
seleccionar, de entre el continuo infinito de soluciones posibles, sólo ciertas soluciones individuales que satisfagan estas condiciones, que corresponden a ciertos valores discretos de la constante de separación (y, por tanto, la energía) e. De esta
manera se puede encontrar que sólo un grupo determinado de soluciones 1/ln(x, y, z)
que se relaciona con un conjunto asociado de niveles energéticos En es aceptable
como funciones de onda para el sistema, debido a que sólo estas funciones satisfacen
la ecuación de onda y, a la vez, las condiciones de frontera. Las funciones de onda
aceptables se denominan funciones propias del sistema (tomado del alemán eigen,
que significa propias o características), y los niveles de energía correspondientes se
llaman valores propios de energía. Los niveles discretos de energía del oscilador de
Planck y el átomo de Bohr son, en realidad, valores propios de esta naturaleza. De
acuerdo con ( 4.8-6), se puede ver claramente que la frecuencia de la función de
onda obedece siempre a la relación de Planck
e = liw.
(4.8-12)
En algunos casos, tanto la ecuación de onda como las condiciones de frontera
asociadas con ella se pueden satisfacer para cualquier valor de e, o, cuando menos,
para cualquier valor de e dentro de un intervalo finito dado. En tales casos existe
un rango continuo de energías permisibles o un continuo de niveles energéticos. Más
94
Mecánica cUJÍntica. Generalidades
adelante se verá en qué circunstancias particulares se presentan estas situaciones
posibles.
4.9
LA PARTICULA LIBRE Y EL PRINCIPIO
DE INCERTIDUMBRE
A continuación se examinará la función de onda de una partícula libre, es
decir, que no está sujeta a fuerzas y que, por tanto, se mueve en una región de
potencial constante. Este estudio se limitará a una geometría unidimensional en la
que el movimiento está restringido al eje x. Por conveniencia y, para no perder
generalidad, el potencial se puede considerar con un valor de cero, en cuyo caso la
ecuación ( 4.8-5) se convierte en
(4.9-1)
en donde
k= J2mejh2.
(4.9-2)
La ecuación (4.9-1) es de un tipo diferencial ya conocido que tiene soluciones de la
forma
t/J(x) = Ae±ikx,
(4.9-3)
en donde A es una constante arbitraria. Estas soluciones satisfacen todos los requisitos de las funciones de onda excepto, en un sentido estricto, la integrabilidad en el
intervalo - oo < x < oo. Sin embargo, será necesario aceptarlas aunque, como se verá
más adelante, se pueden originar ciertas dificultades para satisfacer los requisitos de
normalización. Las funciones de onda dependientes del tiempo del sistema, de acuerdo con (4.8-7), serán
'l'(x,t) = Aei(lkx-wt),
(4.9-4)
en donde, de acuerdo con (4.9-2),
flk2
w = efñ = - .
2m
(4.9-5)
Las soluciones dependientes del tiempo ( 4.9-4) representan ondas progresivas; si
se escoge el signo +, la dirección de propagación es a lo largo del eje + x; si se
selecciona el signo --, la dirección de propagación es en sentido opuesto. Por tanto,
se puede hacer la misma selección de signo para las funciones independientes del
tiempo (4.9-3) para representar ondas que se propagan (en el tiempo) en estas
direcciones respectivas. El valor esperado de la cantidad de movimiento de la partícula, de acuerdo con ( 4.8-11 ), está dado por
(4.9-6)
La partícula libre y el principio de incertidumbre
95
No obstante, de acuerdo con (4.9-3), se puede ver que a¡J¡¡ax = ± ikl/l, por lo
que (4.9-6) se convierte en
(p}) = ±ñk
f 1/1*1/1 dx = ±ñk = ± -:;.h
oo
-oo
(4.9-7)
A
Esta expres10n es, sencillamente, un enunciado de la relación de De Broglie (4.6-1);
por tanto, la relación de De Broglie para partículas libres está contenida implícitamente en los postulados de la mecánica ondulatoria. Además, por lo que establece
(4.9-5), es evidente que
iz2k2
(p2)
B=--=--
2m
2m'
(4.9-8)
lo cual concuerda con el resultado clásico.
Al intentar normalizar la función de onda ( 4.9-3) de acuerdo con los requisitos
de (4.8-10), se encuentra que el valor de A*A debe escogerse en tal forma que sea
infinitesimalmente pequeño a fin de que no diverja la integral (4.8-10). Puesto que,
de acuerdo con (4.9-3), la probabilidad 1/1*1/1 dx de encontrar la partícula dentro de
un intervalo dx alrededor de un punto x es la misma en todos los puntos e igual a
A*A dx y, puesto que la probabilidad clásica a priori de encontrar una partícula
libre dentro de una región finita específica de una línea infinita, es infinitesimalmente pequeña, no es sorprendente que esta situación se haya presentado. En efecto,
esto coincide con lo que se podía haber esperado desde el punto de vista físico. No
se intentará resolver esta dificultad de un modo muy riguroso, sólo se observará que
no existen problemas graves al aplicar la condición de normalización (4.8-1 0), siempre que se reconozca la naturaleza singular de las circunstancias que determinan la
magnitud de A*A y no se intente evaluar esta cantidad explícitamente en términos
numéricos.
Las soluciones de la ecuación de Schrodinger independiente del tiempo ( 4.8-5)
dan funciones de onda de la forma (4.9-3) o (4.9-4), que representan ondas planas
que se propagan a lo largo de la dirección ± x. Puesto que la densidad de probabilidad '11!*'11! asociada con estas funciones es independiente del tiempo, las soluciones
(4.9-3) son funciones de onda de estado estacionario. Cada función de onda de
estado estacionario se relaciona con un valor único de energía E y, por ende, de
acuerdo con (4.9-8) y (4.9-7), representa un estado cuya constante de propagación
tiene un valor único k y cuya cantidad de movimiento tiene un valor único Px ( = lik).
No obstante, puesto que la amplitud de las ondas es constante, éstas se desplazan
de un modo uniforme desde oo a - oo, y, en consecuencia, no tienen una ubicación
única en el espacio. Dado que las condiciones de frontera de continuidad, de lo
finito, de unicidad, etc., se satisfacen igualmente para cualquier valor de E o k, existe
un rango continuo de valores permitidos para estos parámetros.
Mediante la superposición de soluciones de este tipo, cada una de las cuales
corresponde a un valor diferente de E y k, se pueden construir funciones de onda de
la forma
(4.9-9)
Debido a la linealidad de la ecuación dependiente del tiempo de Schrodinger,
este tipo de funciones de onda superpuestas son soluciones perfectamente adecuadas
para la ecuación dependiente del tiempo (4. 7-3); en cambio, no satisfacen la ecua-
96 Mecánica cuántica. Generalidades
ción independiente del tiempo ( 4.8-3) debido a que no tienen la forma ( 4.8-7). La
amplitud de probabilidad asociada con esta clase de soluciones, no es independiente
del tiempo, como sucede con las soluciones de estado estacionario. El método de
superposición se puede aplicar en forma más amplia de manera que un número
infinito de soluciones de estado estacionario se combine en una función de onda de
la forma
'l'(x,t) = L Anei(kn.x-mntl.
(4.9-10)
n
Los valores de kn se pueden escoger muy cerca unos de otros, separados sólo por
intervalos dk, y los valores An pueden asumir la magnitud de cualquier función dada
de k en estos puntos, en cuyo caso, la superposición ( 4.9-1 O) se puede convertir, en
el límite, en una integral de la forma
'l'(x,t) = f~00 A(k)ei<kx-mt) dk.
(4.9-11)
Como ejercicio, el lector puede verificar fácilmente el hecho de que ésta constituye
todavía una solución a la ecuación dependiente del tiempo de SchrOdinger (4.7-3).
La función A(k) de (4.9-11), puede ser cualquier función de k en tanto exista la
integral.
Supóngase ahora que, en algún instante de tiempo, por ejemplo, t = O, se trata
de formar una función de onda cuya densidad de probabilidad '11*'11 se localiza en
una región particular del eje x, por ejemplo, entre los puntos x = a/2 y x =- a/2,
como se ilustra en la figura 4.6. Esto se puede lograr construyendo una superposición de soluciones de la forma de estado estacionario (4.9-4), perteneciendo a
diferentes valores de k, de acuerdo con (4.9-11). Por ejemplo, se puede escoger
A( k) =
e sen !(k - k 0 )a
t(k- k 0 )a
'
(4.9-12)
en donde e y k 0 son constantes. Se verá directamente que esta selección de A(k) es
la correcta si '11*'11 es como se representa en la figura 4.6. Si se substituye (4.9-12)
en (4.9-11) y t se hace igual a cero, es evidente que
'll(x,O) = e
f"' sen t(k - ko)a eikx dk.
-=o
t(k- k 0 )a
(4.9-13)
'11*'11 (/=O)
Figura 4.6.
La función de densidad de probabilidad de una partícula que, de alguna manera,
debe encontrarse forzosamente a lo largo de la región del eje x que se extiende
entre a/2 y +a/2.
La partícula libre y el principio de incertidumbre
91
Si se hace que
(4.9-14)
q =k- k 0 ,
esto se puede escribir en la forma
.k
'l'(x,O) =Ce' o.c
foo sen
!qa .
- - - e'q" dq.
-oo !qa
(4.9-15)
Ahora, de acuerdo con el teorema de la integral de Fourier2, una función arbitraria
f(x) se puede expresar como una integral de Fourier mediante
1 JO()
.
f(x) = e'q" dq
2n _ oo
JO() f(x')e-•qx
. , dx'.
- oo
(4.9-16)
Si la función representada como 'lt*'lt en la figura 4.6, es decir,
(x) = 1/a
(- a/2 < x < a/2)
=O
(x > a/2; x < -aí2)
(4.9-17)
se expresa en forma de integral utilizando (4.9-16), se puede demostrar de un modo
directo que
Joo
1
sen fqa .
f(x) = - - - e'q" dq = 1/a
2n _ oo tqa
(- a/2 < x < a/2)
(4.9-18)
(x > a/2; x < -a/2).
=O
Utilizando este resultado para expresar la integral en (4.9-15) con mayor sencillez, se
encuentra que 3
2nC .k
'l'(x,O) = -- e' 0 "
a
( -a/2 < x < a/2)
(4.9-19)
=0
(x > a/2; x < -a/2).
La constante de normalización C se debe escoger en tal forma que satisfaga (4.7-6),
según lo cual
4n2;2
a
f!a dx = 4n2C2 = 1
-!a
a
2 Véase, por ejemplo, R. V. Churchill, Fourier Series and Boundary Value Problems,
McGraw-Hill Book Co. Inc., Nueva York (1941), capítulo V.
3 Aunque todas las funciones de superposición A(k)ei(kx-wt) satisfacen el requisito de
continuidad de las funciones de onda, la suma real, según lo expresa (4.9-19), no satisface este
requisito para x =±a. Esta violación de los requisitos formales no introduce, por tanto, ningún
error en los cálculos ya que, evidentemente, la función del pulso cuadrada (4 9-19) se puede
"redondear" muy cerca de x =±a para satisfacer la condición de continuidad sin introducir
ninguna alteración significativa en la forma de la función A(k).
98 Mecánica cuántica. Generalidades
o bien,
e = .J~/(2rr).
(4.9-20)
Entonces,
1 'k
'P(x,O) = J~ e' ""'
=0
(- a/2 < x < a/2)
(4.9-21)
(x > af2;x <- a/2)
En otras palabras, si A(k) se escoge como en ( 4.9-12), con e= ,jíi/(2rr), la
función de onda en el instante t = O, dada por ( 4.9-15), se puede expresar en la
forma sencilla (4.9-21). La amplitud de probabilidad 'lt*(x, O)'lt(x, O) existente en
t = O es, entonces, la de la figura 4.6 y la "partícula" se localiza dentro de una distancia & = a alrededor del origen. Sin embargo, para lograr esta localización, es
necesario introducir una superposición de funciones de ondas estacionarias correspondientes a varios valores de k y, por ende, a varios valores de can ti dad de movimiento lík. Las amplitudes relativas de las diversas componentes en la sup~osición,
están dadas por la función A(k) y, por tanto. por (4.9-12) siendo e=ya/(2rr). En
la fi~ura 4. 7 aparece una gráfica de estas amplitudes de contribución en función de
ka. Las principales contribuciones provienen de la región cercana a k = k 0 y la
contribución desciende rápidamente para componentes con valores de k mucho mayores o mucho menores que k 0 • Se puede considerar que las contribuciones a la
superposición de valores de k mayores que k 0 ++~ y menores que k 0 -+~ son
despreciables, siendo ~ un parámetro que expresa la anchura efectiva de la parte de
la curva de A(k), en donde A(k) asume valores que no son pequeños en comparación al valor máximo A(k 0 ). Si arbitrariamente se escoge un valor tal de ~ que
t:J...ka) = 8rr, o sea, una posición correspondiente al segundo cero de la curva a ambos
lados de k= k 0 , -siendo ésta una selección ;azonable de acuerdo con el criterio
anterior- se tiene que
Ak = 8rrfa.
(4.9-22)
A(k)
Figura 4. 7.
lli~trihudón de la amplitud de la cantidad de movimiento correspondiente a la
·'lnplltud de (Hl'h.lhilida<l fl<' la figura 4 6.
La partícula libre y el principio de incertidumbre
99
El producto de la distancia Ax dentro de la cual se puede considerar que se localiza
la partícula, y la incertidumbre !lk en la cantidad de movimiento que se introduce
mediante la superposición de estados requerida para lograr esta localización, es
8n
ó.k · ó.x =-·a= 8n,
a
o bien, puesto que k = p/h,
ó.p · ó.x = 8nli.
(4.9-23)
Olvidando los valores numencos que se obtienen de la selección arbitraria de un
punto de corte para !::k, y utilizando el símbolo - para indicar "del orden de'', se
puede escribir
(4.9-24)
ó.p . ó.x - li.
Para una partícula libre cuya cantidad de movimiento se caracteriza por un
valor único singular de k, la "partícula" se extiende a lo largo de todo el espacio. Si
la partícula debe estar dentro de una región dada del espacio, entonces, su función
de onda, que ahora se debe considerar como una superposición de funciones de
estado estacionario con diferentes valores de k, se caracteriza por un "despliegue" de
valores de cantidad de movimiento tal que se obedezca a (4.9-24), según se ilustra
en la figura 4.6. Fste es un ejemplo específico de un efecto conocido con el nombre de Principio de incertidumbre de Heisenberg, el cual es una consecuencia muy
general deducida de la descripción de la naturaleza en términos de la mecánica
ondulatoria. El principio de incertidumbre establece que la posición de una partícula
y su cantidad de movimiento no se pueden definir simultáneamente con precisión
arbitraria; cualquier experimento que se realice para asegurar que la partícula se
localizará dentro de una región dada del espacio, introducirá inevitablemente una
mcertidumbre en su cantidad de movimiento, que estará dada por (4.9-24). Se debe
recalcar el hecho de que este efecto es independiente de la precisión experimental
con que se pueden medir las cantidades de que se trata y, en realidad, es una
propiedad que tiene la materia en observación.
Por lo general, se puede demostrar que las relaciones de incertidumbre tales
como ( 4.9-24) existen entre todos los pares de variables dinámicas conjugadas que se
podrían usar clásicamente para especificar por completo el estado de movimiento del
sistema. Powell y Craseman 4 han escrito un análisis completo y detallado de este
tema. Si en (4.9-24) se escribe Ax = v t:.t, en donde v es la velocidad, se obtiene
V Ó.p Ó.t "' Ji.
(4.9-25)
Puesto que, para una partícula libre, E= p 2 /2m, ÁE = p fjp/m = v fjp, (4.9-25) se puede expresar como sigue
ó.e · ó.t - li.
(4.9-26)
Por tanto, la relación de Heisenberg (4.9-24) también se puede expresar como la
incertidumbre de energía del tren de ondas multiplicada por la duración de éste.
Conviene observar que el comportamiento del "paquete de ondas" que se estudió con anterioridad, se puede expresar como una función del tiempo por medio
Powell y B, Craseman, Quantum Mechanics, Addison-Weslcy, Reading. Mas~, (1961)
69-76; páginas 182-184,
4 J, L.
pág~nas
100 Mecánica cuántica. Generalidades
de (4.9-11), con A(k) según la da (4.9-12). Se puede demostrar que el máximo de la
amplitud de probabilidad "11'*"11' se mueve a la velocidad constante hk0 fm, correspondiendo a una cantidad de movimiento constante hk0 según lo predice la m'ecánica
clásica. Además de este movimiento clásico del paquete como un todo, también se
sabe que el paquete se despliega conforme transcurre el tiempo, en tal forma que
siempre se satisface la relación de incertidumbre ( 4.9-24). En los casos de paquetes
de ondas que representan objetos grandes o masivos localizados dentro de distancias
macroscóp;r ente observables, este efecto de despliegue es tan pequeño que es
indetectabh: a una escala de tiempo razonable. s
4.1 O UNA PARTICULA EN UN POZO DE POTENCIAL
UNIDIMENSIONAL E INFINITAMENTE PROFUNDO
En este ejemplo se examinará el comportamiento de una partícula ubicada en
el pozo de potencial unidimensional que se ilustra en la figura 4.8. Para este sistema, se tiene que
V(x) =O
=00
(O< x <a)
(x <O; x >a).
(4.10-1)
En la región (O <x <a), en donde V0 , la ecuación de Schrodinger independiente del
tiempo (4.8-5) se puede reescribir como sigue
(4.10-2)
en donde
k= J2me/1i 2 •
V(x) ..
'
(4.10-3)
.
V=O-L....--~-x
X=O
1
Figura 4.8.
Prt:'~~.
X=o
1
Un "pozo" de potencial infinitamente profundo.
s L Ikcnherry, Quantum Mechanics for Mathematicians and Physicists, Oxford University
Nut>va York (1962}, r:ígina 64.
Una partícula en un pozo de potencial unidimensional
101
En esta región, la partícula es libre y la solución ( 4.1 0-2) se puede expresar en la
forma (4.9-3). Sin embargo, es más conveniente escribirla en la forma equivalente
t/J(x) =A sen kx + B cos kx
(0 < x <a),
(4.10-4)
en donde A y B son constantes arbitrarias. Puesto que la partícula está limitada por
barreras de potencial infinitamente altas en x = O y x =a, se supondrá que
t/J(x) =O
(x <O; x >a).
(4.10-5)
Esta suposición, que parece ser físicamente razonable, se justificará más tarde en la
siguiente sección.
Si se requiere que t/l(x) sea continua en las fronteras del pozo de potencial
en x =O y x =a, entonces, (4.10-4) se debe reducir a cero en esos puntos. Si se
substituyen los valores x = O y x =a en (4.1 0-4) y el resultado se hace igual a cero,
es evidente que B =O y que
A sen ka= O.
(4.10-6)
Esta condición se puede satisfacer sólo cuando
(n = 1,2,3, ... ),
ka= nn
(4.10-7)
de donde, sólo para una secuencia discreta de valores de k, que se identifican como
kn, en donde
k. = nnfo
(n = 1,2,3, ... ).
(4.10-8)
Puesto que k está relacionada con la energía por medio de (4.10-3), esta
condición se define como un conjunto discreto de valores propios de energía permisibles
li2k! n2n21i2
e=--=--•
2m
2ma 2
(n = 1,2,3, ... ).
(4.10-9)
En la figura 4.9 se muestra un diagrama de los niveles de energía de este
sistema. En vista de los requisitos establecidos en ( 4.1 0-8), las funciones de onda del
sistema deben tener la forma
nnx
t/l.(x) = A. sena
=0
(O< x <a),
(x<O;x>a),
(4.10-10)
en donde las constantes An están determinadas por los requisitos de normalización
( 4.8-1 0), de acuerdo con los cuales,
J
oo
-oo
t/l:t/1. dx = A!
f" sen nnx dx = 1
o
2 -
a
(4.10-11)
lo cual da
A.= 1/j~.
(4.10-12)
102
Mecánica cuántica. Generalidades
·¡
25<¡
+-------
16<¡
+------- .•
4<¡
+------- •2 7T2h2
E5
o -:l=======~·~~'_2_m_u_2
Figura 4.9.
Niveles de energía permisibles para una partícula que se encuentre dentro del pozo
de potencial ilustrado en la figura 4.8.
La dependencia del tiempo de las funciones de onda se determina fácilmente a partir
de ( 4.8-7). Por supuesto, las funciones ( 4.10-1 O) son funciones propias de estado
estacionario para las que '1'*'1' es independiente del tiempo.
Para este sistema, se sabe que existe un sistema de niveles discretos de energía,
dados por ( 4.1 0-9). La ecuación de Schrbdinger ( 4.1 0-2) dentro de la región permitida de movimiento es la misma que para una partícula libre (4.9-1) para la que se
permite un rango continuo de valores de energía, y las soluciones ( 4.1 0-1 O) son
simplemente combinaciones lineales de las soluciones para la partícula libre de la
forma ( 4.9-3) pertenecientes a la misma energía. La diferencia entre los dos casos se
basa únicamente en las condiciones de frontera las cuales, en el pozo de potencial,
se pueden satisfacer sólo para un conjunto discreto de energías.
La condición de continuidad de la pendiente de las funciones de onda
(4.10-10) se viola abiertamente en x =O y x =a. Esta situación se origina debido a
la singularidad de la función de potencial V(x) en estos puntos y no produce
dificultades en la interpretación física de los resultados. Ei comportamiento de la
función de onda en estos puntos se puede inferir como un caso límite de los
resultados, que se verá en la siguiente sección, en donde se confirman los cálculos
que condujeron a ( 4.10-1 0).
Las funciones de onda ( 4.10-1 0), se pueden representar como sigue
(4.10-13)
en la región (O< x <a), vienen a ser superposiciOnes de ondas estacionarias de
soluciones de ondas planas para las que k= mr/a y - mrja, es decir, superposiciones
de una onda que se propaga en la dirección + x y otra de igual amplitud que va en
dirección opuesta. Puesto que las dos componentes de la superposición poseen la
misma energía, la combinación lineal ( 4.1 0-13) es una solución de la ecuación de
Schródinger independiente del tiempo ( 4.1 0-2) y, por tanto, representa todavía un
estado estacionario del sistema. El cuadro físico correspondiente es el de una partícula que se refleja elásticamente en las paredes de un pozo de potencial, en x = O
y x =a, y oscila rápidamente hacia un lado y otro dentro del pozo de potencial. La
función de onda y la amplitud de probabilidad para la partícula en el estado energético más bajo y en un estado de energía más alto, se ilustran en la figura 4.10. De
acuerdo con la amplitud de probabilidad, cuántica la probabilidad de encontrar la
partícula en ciertos puntos correspondientes a ceros de 1/1*1/1 (que, en este' ejemplo,
Partícula en un pozo unidimensional de profundidad finita
103
.¡,•.¡,
.¡, (x)
ljl(x)
n
(\
"-
(\
o
o
o _K
-x
n~1
V
V
V
n~a
(a)
Figura 4.10.
V
(b)
Funciones de onda y amplitudes de probabilidad de dos determinados estados de
energía permisibles de una partícula que se encuentra dentro de un pozo infinitamente profundo.
es igual a l/; 2 , ya que ¡!; ('S real), se hace infinitamente pequeña. La amplitud de
probabilidad cuántica para lo~ estados de energía más bajos no concuerda con la
amplitud de probabilidad constante que se podría esperar desde el punto de vista
clásico y que en la figura se ilustra por medio de las líneas punteadas. Sin embargo,
para estados de energía más altos, además de la rápida oscilación de la amplitud
cuántica alrededor del valor clásico como un promedio, la coincidencia es aceptable
en el sentido de que el valor medio de la amplitud de probabilidad cuántica tomada
sobre cualquier intervalo de longitud apreciable es casi igual a la amplitud clásica.
4.11
UNA PARTICULA EN UN POZO UNIDIMENSIONAL
DE PROFUNDIDAD FINITA
El comportamiento de una partícula dentro de un pozo unidimensional de
profundidad finita se puede calcular, siguiendo las líneas generales del planteamiento
utilizado en la sección 4.1 O. En este caso se supondrá un pozo de potencial de la
forma ilustrada en la figura 4.11, en donde la profuncidad del po:w es V0 . Se
deben resolver ecuaciones por separado para la función de onda en las regiones
(x<-a), (-a<x<a) y (x>a), y las funciones de onda en estas regiones se
denominará, respectivamente, l/1-(x), l/1 0 (x) y l/l+(x). En primer lugar, se tratará el
caso de una partícula que está limitada clásicamente a permanecer dentro del pozo,
es decir, una partícula para la que - V0 <e< O.*
En las regiones fuera del pozo (x < -a; x >a), la ecuación (4.8-5) se convierte en
(x<-a;x>a)
* N. de T. La partícula posee en esta región los estados ligados.
(4.11-1)
104 Mecánica cuántica. Generalidades
V(x)
o
-a~
(x)
-x
-a-
'~'o(x)
-Vo
Figura 4.11.
Un pozo de potencial de profundidad finita.
en donde
(4.11-2)
mientras que, en el pozo, en donde V(x) =- V0 , (4.8-5) se convierte en
d2r/Jo
2
-d
2 + k 0 r/1 0 (x) = O
(-a<x<a)
(4.11-3)
X
en donde
(4.11-4)
Como se ha definido, en la condición (- V0 < € <O), k y k 0 son cantidades
reales. Las soluciones generales de (4.11-1) y ( 4.11-3) se pueden expresar como sigue
(x > a)
(4.11-5)
r/1 0 (x) = A 0 sen k 0 x + B 0 cos k 0 x
(-a<x<a)
(4.11-6)
rf¡_(x) = A_ekx + B_e-kx
(x <-a).
(4.11-7)
Las condiciones de frontera de la función de onda requieren que dicha función
y su derivada sean continuas en x =±a y que la función de onda tienda a cero
conforme x "* ± oo. Por tanto, es necesario que
r/1 0 ( - a) = rf¡ _ ( - a)
r/ló(a) = rf¡~(a)
(4.11-8)
r/ló( -a)= rf¡'_( -a)
(4.11-9)
1/J_(- oo) =O,
(4.11-10)
en donde las primas indican las derivadas con respecto a x. En la expresión (4.11-10), es evidente que A+= B_ =O. Los cuatro coeficientes restantes se
Partícula en un pozo unidimensional de profundidad finita
1OS
pueden evaluar mediante la substitución de las soluciones (4.11-5,6,7) en las cuatro
condiciones de frontera (4.11-8) y ( 4.11-9), de donde se obtiene un grupo de cuatro
ecuaciones simultáneas de la forma
=0
- A 0 sen k 0 a + B 0 cos k 0 a
(4.11-11)
A 0 k 0 cos k 0 a + B 0 k 0 sen k 0 a
-A_ ke -ka = O.
Para resolver completamente el problema, se deben determinar los valores de
las cuatro constantes arbitrarias A 0 , B 0 , A_ y B+. Las expresiones (4.11-11) forman
un conjunto de cuatro ecuaciones homogéneas con estos coeficientes desconocidos.
Un resultado elemental de la teoría de las ecuaciones algebraicas lineales es que un
conjunto de ecuaciones de esta naturaleza no pueden tener otra solución que no sea
A 0 = B 0 =A_ = B+ = O, a menos que desaparezca el determinante de los coeficientes del sistema. 6 Esto significa que no existen soluciones de significado físico, a
menos que
e
- 2ka
sen k 0 a
-sen k 0 a
k 0 cos k 0 a
k» cos k 0 a
cos k 0 a
cos k 0 a
-k 0 sen k 0 a
k 0 sen k 0 a
o
o -1 =0.
k
o
o k
-1
(4.11-12)
Para obtener esta expresión, la can ti dad e- ka se sacó por factorización de las
columnas tercera y cuarta del determinante de los coeficientes de (4.11-11). Puesto
que e-2ka no desaparece para ningún valor real de ka, el determinante debe hacerlo
·a fin de satisfacer ( 4.11-12). El determinante se puede expresar como menores para
dar la ecuación
que se puede escribir también como
(k sen k 0 a + k 0 cos k 0 a)(k 0 sen k 0 a -k cos k 0 a) =O.
o, dividiendo entre cos 2 k 0 a,
(k tan k 0 a + k 0 )(k0 tan k 0 a- k)= O.
(4.11-13)
Esta ecuación se satisface si desaparece cualquiera de los factores. Si se hace
que
(4.11-14)
6 Véase, por ejemplo, N. B. Conkwright, lntroduction to thc Theory of Equations, Ginn
and Co., Boston (1941), páginas 144-145.
106 Mecánica cuántica. Generalidades
entonces, de acuerdo con (4.11-4) y (4.11-2),
(4.11-15)
Al substituir esto en ( 4.11-13) e igualando cualquiera de los factores a cero, se
tiene que (4.11-13) se satisface si
( 4.11-16)
o bien,
1
1
1
1
1
1
1
1
t-- Curvas punteadas
1 y =-k0 ctn k0 o
1
1
1
1
1
Figura 4.12.
Diagrama que ilustra la solución de las ecuaciones trascendentales de los valores
propios de energía asociados con el pozo de potencial mostrado en la figura 4.11.
Una de estas dos ecuaciones quedará satisfecha sólo para un conj,mto dado de
valores de k 0 , que se puede representar mediante k 01 , k 02 , k 03 , • • • kon, •••. Existe un conjunto de valores propios de energía Erz que se relacionan con estos valores
de k 0 , de acuerdo con (4.11-4), por medio de
(4.11-17)
Los valores propios kon se pueden obtener gráficamente encontrando las intersecciones de las curvas y = - k 0 ctn k 0 a y y = k 0 tan k 0 a con el círculo y =
yp. 2 - k~, como se ilustra en la figura 4.12. Para cada punto de intersección se
satisface cualquiera de las dos ecuaciones (4.11-16). Por tanto, existe un grupo finito
específico de valores kon y un número finito de niveles discretos de energía asociados a estos valores, a través de (4.11-17). El radio del círculo y = yp. 2 - k~ de la
figura 4.11 es, sencillamente, p. que está directamente relacionado con la profun-
Partícula en un pozo unidimensional de profundidad finita
107
di dad del pozo de potencial por medio de (4.11-14). Para un pozo poco profundo,
J1 ~O, y únicamente habrá un solo nivel de energía en el rango - V0 <e< O. Para
pozos más profundos, aumenta el número de estados energéticos y para pozos muy profundos, este número es muy grande. Como se ilustra en la figura 4.12, en un pozo muy
profundo, los niveles que están en la parte más baja se caracterizan por valores de kon
que están espaciados equidistantemente, correspondiendo muy de cerca a los valores de
kn del pozo infinito de la sección 4.10. y dando origen a niveles de energía que, con respecto a la base del pozo...,son semejantes a los del pozo infinito. En la figura 4.13 se
proporcionan los diagramas de niveles de energía para varios pozos fmitos.
--J
-----
-------
----------------------
Estados de energía para un pozo infinito----Estados de energía para un pozo finito
-----
----
--Figura 4.13.
Representación esquemática de los niveles de energía correspondientes a pozos de
potencial de distintas profundidades.
Una vez se han determinado los valmes kon para los que ( 4.11-11) tiene
soluciones físicamente significativas, es necesario encontrar los coeficientes A 0 , B 0 ,
A_ y B+. Puesto que para los valores de kon que satisfacen (4.11-16) desaparece el
determinante del sistema homogéneo (4.11-11 ), las ecuaciones (4.11-11) ya no son
independientes linealmente y, por tanto, lo único que se puede obtener directamente
de (4.11-11) son las relaciones de los coeficientes. Sin embargo, las magnitudes reales
de los coeficientes se pueden encontrar imponiendo la condición de que
Una vez que se conocen los coeficientes, las funciones de onda se obtienen de
(4.11-5,6,7). El cálculo exacto de los coeficientes es un procedimiento laborioso y
no se presentará en detalle. No obstante, se analizarán algunas de las propiedades de
las funciones de onda que se obtienen de este modo.
Las funciones de onda para los estados energéticos ligados de este problema se
ilustran en la figura 4.14. Antes que nada, se observará que la función de onda
como un todo es una función par o bien, una función impar de x. En el ejemplo
de que se trata, el estado energético más bajo es par, el siguiente es impar, el que le
sigue es par, y así sucesivamente de un modo alternado. Esto se debe al hecho de
que el potencial V(x) es en sí mismo una función para de x; se puede demostrar de
108
Mecánica cuántica. Generalidades
un modo general que, cuando esto sucede, las funciones propias deben ser funciones
pares o impares de x. 7
Figura 4.14.
Diagramas esquemáticos de las funciones de bnda de los estados energéticos más
bajos del pozo de potencial finito de la figura 4.11.
De acuerdo con la figura 4.14 y las ecuaciones (4.11-5) y (4.11-7), se puede
nr que a pesar de que la energía total de la partícula es negativa y, por tanto, de
acuerdo con la representación clásica dicha partícula nunca podría sobrepasar la
barrera de potencial para aparecer fuera del pozo, de hecho, la función de onda de
la partícula se extiende más allá de los límites del pozo. Por tanto, de acuerdo con
la mecánica cuántica, existe una probabilidad definida de que la partícula se encontrará en la región clásicamente prohibida, más allá de las fronteras reales del pozo.
La función de onda de la partícula se atenúa exponencialmente en esta región y se
acerca a cero en la parte que está lejos del pozo. Este fenómeno, que se conoce
como penetración de barrera, es un aspecto común del comportamiento cuántico de
la materia. Una partícula que se acerca a una barrera de potencial, de altura y
espesor finitos, como se ilustra en la figura 4.15, tiene una probabilidad determinada
de penetrar la barrera y aparecer en el otro lado, aun cuando esto pueda estar
prohibido de acuerdo con la teoría clásica. La función de onda se atenúa dentro de
la barrera, y si ésta es muy alta o gruesa, la atenuación se hace muy marcada y la
probabilidad de penetración se reduce mucho. En mecánica cuántica este efecto se
denomina túnel y se ha observado experimentalmente en dispositivos semiconductores y en capas aisladoras delgadas. Los efectos de reflexión semiconductores y en
capas aisladoras delgadas. Los efectos de reflexión se pueden predecir también de
acuerdo con la mecánica cuántica, para las partículas incidentes sobre una barrera,
7 Véase, por ejemplo, E. Merzbacher, Quantum Mechanics, John Wiley and Sons, Nueva
York (1961), página 53.
Partícula en un pozo unidimensional de profundidad finita
109
•t
Vlxl
·- n
-+X
(O)
(b)
Figura 4.15.
Representaciones hechas de acuerdo con la mecánica clásica (a) y cuántica (b), de
una partícula que interactúa con una barrera de potencial cuya altura es mayor
que la energía inicial de la partícula. La representación cuántica (b) ilustra el
efecto túnel.
por ejemplo, como las que se muestran en la figura 4.15, aun cuando poseen más
de la energía necesaria para sobrepasar la barrera clásicamente. El efecto túnel proporciona las explicaciones generalmente aceptadas sobre la ruptura eléctrica que se
produce en aisladores, la ruptura inversa en rectificadores semiconductores y la desintegración radiactiva de Jos isótopos a-emisores.
Hasta ahora, este estudio se ha basado exclusivamente en la suposición de que
la energía total e es negativa, dentro del rango - V0 <e< O. En el caso en que e
sea positiva, es fácil apreciar en la expresión (4.11-1) que las soluciones 1/1± fuera
del pozo tienen una naturaleza oscilatoria, como sucede con la solución 1/1 0 en su
interior. En este caso, se encuentra que la ecuación de Schrodinger y todas las
condiciones de frontera se pueden satisfacer para cualquier valor positivo de e. Por
tanto, existe un rango continuo de estados energéticos permisibles y funciones propias correspondientes que se extiende en forma ascendente desde e= O en la figura 4.13. Esos estados se denominan "estados del continuo".
Para ver cómo sucede esto, supóngase que las funciones propias de este rango
de energía son funciones pares o impares de x; como se vio antes, esto es válido si
V(x) es una función par. De dor.de, para funciones propias pares, es necesario que
t/1 0 (x) = A 0 cos k 0 x
(-a<x<a)
(x >a)
(4.11-19)
(x < -a)
en donde k se define ahora como
k= J2me/ñ 2
(e> 0).
(4.11-20)
Las condiciones de frontera (4.11-8) y (4.11-9) deben aplicarse todavía, de tal manera que los valores y las pendientes de 1/1 0 (x) y 1/J+(x) sean iguales en x =a. De
11 O Mecánica cuántica. Generalidades
acuerdo con ( 4.11-19), esto requiere que
A 0 cos k 0 a =A+ cos ka+ B+ sen ka
(4.11-21)
y
-k 0 A 0 sen k 0 a = -kA+ sen ka+ kB+ cos ka.
Si se dividen ambas ecuaciones entre A 0 y se resuelve el grupo resultante de ecuaciones simultáneas para A+/A 0 y B+/A 0 , se tiene que
A+/A 0 = cos k 0 a cos ka+~ sen k 0 a sin ka
(4.11-22)
ko
B+/A 0 = cos k 0 a sen ka- k senk 0 a cos ka.
Por tanto, siempre se pueden encontrar valores perfectamente adecuados para A+ y
B+ en términos de A 0 , cuyo valor, a su vez, queda determinado por los requisitos
de normalización. Esto significa que cualquiera que sea el valor inicial que se escoja
para e o k, se puede encontrar una solución para l/1 0 , W+ y ¡J¡_ que satisfaga todas
las condiciones de frontera, como se aseguró antes. Se puede realizar un cálculo
similar principiando con las funciones propias impares y se obtendrá el mismo resultado. En la figura 4.16 se ilustra el carácter general de las funciones de onda para
los estados del continuo.
(O)
Figura 4.16.
(b)
(a) Representación e~quemática de la función de onda de una partícula cuya
energía tan grande que, en la representación clásica, sobrepasa los límites del pozo
de potencial ilustrado. (b) División de los niveles de energía permisibles para el
pozo de potencial finito, en un grupo de niveles discretos correspondientes a
una partícula clásicamente ligada y a un continuo de niveles correspondientes a
una partícula clásicamente no ligada. La función de onda representada en (a)
pertenece al último grupo de niveles.
El oscilador armónico unidimensioanl
111
Este l.stado de cosas ejemplifica un principio mucho más general. Si la energía
total del sistema es tal que la partícula esté limitada clásicamente por medio del
potencial V(x) para moverse en una región finita dada del espacio, se tendrá un
grupo discreto de funciones propias y niveles de energía que satisfagan todos los
requisitos, de las funciones de onda. Por otro lado, para partículas con energías lo
suficientemente grandes para que una partícula clásica pueda escapar de cualquier
mínimo de potencial del sistema, al infinito en, cuando menos, una dirección, existe
también un continuo de estados energéticos y funciones propias correspondientes. 8
Los resultados de la sección 4.1 O para el pozo de potencial infinitamente profundo se pueden obtener a partir de los resultados de esta sección, si se deja que
V 0 tienda a infinito. En particular, se puede ver a partir de (4.11-5) y (4.11-7) con
A+= B_ =O, que si k se hace indefmidamente grande, como debe suceder para
cualquier estado con un energía finita superior a la base del pozo, conforme
V 0 ~ c..o, ia función de onda fuera de los límites del pozo tiende a cero. Conforme
el pozo se hace cada vez más profundo, la curvatura de la función de onda se hace
sumamente grande cerca de x = a y x = - a, en donde las soluciones 1/J +(x) y 1/J _ (x)
se unen a la solución 1/J 0 (x), se hace aunque para una profundidad finita de pozo, la
pendiente es siempre continua. Sólo en el límite, conforme la profundidad del pozo
se acerca a infinito, es cuando se presenta la discontinuidad en la derivada de la
función de onda en estos punto, como se mencionó en la sección 4.10.
4.12
EL OSCILADOR ARMONICO UNIDIMENSIONAL
El oscilador armónico es una partícula que está ligada a una postcwn de
equilibrio por medio de una fuerza proporcional al desplazamiento desde dicha posición; esta fuerza .:;e puede expresar como
F = -kx = -dV(x)fdx.
(4.12-1)
Entonces, el potencial V(x) debe ser una parábola de la forma
(4.12-2)
De acuerdo con ( 4.12-1 ), la ecuación clásica de movimiento para una partícula
de masa m sometida a una fuerza de este tipo es
(4.12-3)
cuya solución es una función oscilatoria que se puede escribir como
x(t) =A sen (w 0 t- 15),
(4.12-4)
en donde
(4.12-5)
8 Una simple prueba de estas afirmaciones se puede encontrar en la obra de L. Pauling y
E. B. Wilson, lntroduction to Quantum Mechanics, McGraw-Hill Book, Co., Inc., Nueva York
(1935).
112
Mecánica cuántica. Generalidades
es la frecuencia clásica del oscilador y en donde A y o son constantes. Siguiendo
este resultado clásico, se puede usar ( 4.12-5) para expresar la constante de fuerza k
en función de w 0 y m, y volver a escribir el potencial V(x) como
(4.12-6)
A continuación se procederá a resolver la ecuación de Schrodinger ( 4.8-5)
utilizando esta función de potencial; en este caso, (4.8-5) se convierte en
d21/1 2m
2 2
dx2 + hl [e- tmw 0 x ]1/J(x) =O.
(4.12-7)
Para resolver esta ecuación, primeramente es necesario que
(4.12-8)
P = 2ef(ñw 0 )
(4.12-9)
e= x.j~.
(4.12-10)
Entonces, de acuerdo con ( 4.12-8) y ( 4.12-9), es obvio que
d21/J
dx2 + (cx.p- cx.2x2)1/J(x) =O,
(4.12-11)
y, por lo que indica (4.12-10) observando que d2 1/f/dx 2 =cx.d 2 1/1/d~ 2 ,
d21/J
2
de+ <P-e >1/Jce> =o.
(4.12-12)
Para valores grandes de 1~1, tales que ~2 ~ (3, (3 se puede despreciar y (4.12-12)
se escribe como
(4.12-13)
Esta ecuación se satisface aproximadamente, para un valor grande de ~. por
medio de
(4.12-14)
puesto que d 2 1/1/de = (~ 2 - l)exp(- ~ 2 /2), lo cual satisface aproximadamente (4.12-13)
si ~ 2 ~ l. Esto sugiere que las soluciones 1/1(~) para (4.12-12) podrían expresarse
de manera más simple escribiendo
(4.12-15)
Y transformando (4.12-12) en una ecuación para la función H(~). Esto se logra
substituyendo la forma ( 4.12-1 S) en la ( 4.12-12) y como resultado, ( 4.12-12) se
convierte en
d2 H
dH
--2e-+<P-t)H<e>=O.
de
de
(4.12-16)
El oscilador armónico unidimensional
113
Esta ecuación diferencial se puede resolver mediante una técnica de series de
potencias, suponiendo inicialmente que
00
H(') =
L ak'k'
(4.12-17)
k~o
por lo que
(4.12-18)
•
00
(p- 1)H(') = L (p- 1)ak'k·
k=O
Si estas tres ecuaciones se suman se observa que el resultado es cero de
acuerdo con (4.12-16), y se encuentra que
oc
O= I. [(k+ 1)(k + 2)ak+l + [(p- 1)- 2k]ak],k.
(4.12-19)
k=O
Esta ecuación debe ser aplicable para todos los valores de ~. y, por tanto, el
coeficiente de cada potencia ~ debe desaparecer por separado. (Esto se podrá ver
con mayor claridad evaluando los coeficientes para la expansión de la función .f(~) =
O en la serie de potencia de McLaurin; todas resultan ser cero.) Este requisito
establece inmediatamente una relación de recursión entre los coeficientes ak+ 2 y ak,
en donde
p - l - 2k
ak+2 = -(k+ l)(k + 2) ak.
(4.12-20)
En la solución de cualquier ecuación diferencial de segundo orden, debe haber
dos constantes arbitrarias. Por tanto, sean a0 y a 1 las constantes arbitrarias fundamentales que deben determinarse de acuerdo con las condiciones de frontera, en la
expresión de la serie (4.12-17) para H(~), y expresar todos los demás coeficientes en
función de estos dos mediante la aplicación repetida de la relación de recursión
t.4.12-20). En esta forma, es fácil ver que
P-l
<P- 3)
a 3 =- - - - a 1
al= - - - a o
2!
p- 5
a4 = - -¡-:-J a2 =
a6 = -
3!
<P - 1><P - 5)
4!
(p- 1)(p- 5)(p - 9)
6!
ao
etc.,
ao
as=
a1 =
<P- 3)(p- 7)
5!
<P - 3)(p - 1)(P - 11)
7!
etc.
(4.12-21)
a¡
al
114 Mecánica cuántica. Generalidades
De acuerdo con (4.12-17), se de be tener
H(~) = ao[1- ((J- 1) e+ ((J- 1)((J- 5) ~4- ((J- 1)((J- 5)((J- 9) ~6 + ... ]
2!
4!
+a¡[~_ {J- 3
3!
6!
e+ ({J- 3)({J- 7) ~S_ ({J- 3)({J- 7)({J- 11) e+ •••]
5!
7!
.
(4.12-22)
Si en la relación de recursión (4.12-20) {3- 1 - 2k debe ser cero para algún
valor del índice k, entonces, ak+l = O. Sin embargo, puesto que ak+4 es un múltiplo
de ak+l y ak+ 6 es un múltiplo de ak+ 4 , etc., todos los coeficientes subsecuentes
que se relacionan con ak por medio de la fórmula de recursión deben desaparecer, y
cualquiera de las dos series entre paréntesis rectangulares en (4.12-22) terminaría por
convertirse en un polinomio de grado k. Este fenómeno se puede producir sólo para
ciertos valores enteros de {3, en efecto, de acuerdo con (4.12-20), sólo ocurre cuando
{3 _ 1 es igual al doble de un entero, es decir, cuando
(J- 1- 2n =O
o bien,
p = 2n + 1
(n = 0,1,2,3, ... ).
(4.12-23)
Al examinar (4.12-22), se ve fácilmente que esta terminación de una u otra serie
para producir un polinomio se realiza efectivamente cuando {3 = 1, 3, 5, 7, . . . como
lo predice (4.12-23). De esto resulta que las únicas soluciones de (4.12-16), que llevan a
funciones de onda aceptables a través de (4.12-15), SO;'l estas soluciones polinómicas.
Para entender el porqué de esto, primero se considerará la expansión en serie
para la función et 2 , que se puede escribir
(4.12-24)
Para valores grandes de t las contribuciones de Jos términos iniciales de esta serie
son despreciables en comparación con aquellos para los que k es grande. Por supuesto, esto es cierto también en la serie de (4.12-22) para H(~). En la serie
( 4.12-24), la razón del coeficiente bk+l al coeficiente bk es
y para valores grandes de k,
b~:2 ~ 2/k.
(4.12-25)
El oscilador armónico unidimensional
115
La razón de los coeficientes ak+ 2 y a k para las soluciones en serie de ( 4.12-16) está
dada por la relación de recursión ( 4.12-20) y, para valores grandes de k, se puede
ver claramente que también es más o menos igual a 2/k. Entonces las soluciones en
serie de H(~). cuando no terminan en polinomios, se comportan como e~ 2 para
valores grandes de ~- Sin embargo, de acuerdo con (4.12-15), las funciones de onda
reales están dadas por
(4.12-26)
para valores grandes de ~- Puesto que estas funciones no siguen siendo finitas en ±oo,
no son aceptables como funciones de onda para el sistema físico. Las únicas soluciones que son aceptables son aquellas que terminan como polinomios, o sea, las
soluciones para las que se obedece (4.12-23). Si una de las dos series encerradas
entre paréntesis angulares de (4.12-22) termina como polinomio, la solución para
H(~) toma la forma
H(e) = a0 (polinomio) + a 1 (serie infinita)
o
H(~) = a 0 (serie infinita) + a 1 (polinomio).
En cualquier caso, para que la solución H(~) sea una función de onda físicamente
aceptable, la constante arbitraria que multiplica la solución en serie se debe escoger
en tal forma que sea cero, para que la expresión total de H(~) sea sencillamente un
polinomio. Si se expresa (3 en (4.12-13) en función de e por medio de (4.12-9), es
evidente que las únicas soluciones que dan las expresiones polinómicas para H(n son
las que corresponden a un grupo discreto de valores propios de energía
(n = 0,1,2,3, ... ).
(4.12-27)
Una característica notable de este sistema es que su estado más bajo de energía, para el que n = O, está representado no por e0 = O, sino por e0 = -!-hwo. En
otras palabras, el estado más bajo de energía del oscilador armónico no se caracteriza por la ausencia de movimiento vibratorio, sino por una energía vibratoria
mínima de "punto cero" -thw 0 . En su teoría original de la radiación de cuerpo
negro, Planck supuso que los niveles energéticos de un oscilador armónico estaban
dados por En= nhw 0 más que por (4.12-27). No obstante, en ese caso en particular,
la energía de punto cero no establece ninguna diferencia en el resultado final. Se
observará que los pozos de potencial de las secciones anteriores presentaban también
este efecto de energía de punto cero. El diagrama de niveles de energía del oscilador
armónico se ilustra en la figura 4.17. El espaciamiento equidistante de los niveles es
una propiedad singular del pozo de potencial parabólico.
Las soluciones polinómicas que representan las funciones propias del sistema, se
pueden obtener de (4.12-22), considerando que (3 toma los valores 1, 3, 5, ••• 2n +
1, ••• de acuerdo con (4.12-23). Para cada uno de estos valores, cualquiera de las dos
series entre paréntesis rectangulares terminará en un polinomio y todos los coeficientes
más allá de cierto punto se convierten en cero. Por Jo común se escoge la constante arbitraria a0 o bien, a 1 , cualquiera que sea el caso, que multiplica el polinomio resultante en
tal fom1a que el coeficiente de la potencia más alta de ~ en el polinomio es 2n( =
116
Mecánica cuañtica. Generalidades
•t
15 fr
•8
2
"'o
13 ñ
7
2 "'o
6
2 "'o
5
~ hw0
4
~ fr..,o
3
~ ,.,o
2
~ ñ..,o
1
Figura 4.17.
11 ñ
t fr..,o
o
Niveles de energía del oscilador armónico cuántico unidimensional.
2<13-l )/ 2 ). Cuando se hace esto, se obtiene un grupo de soluciones polinómicas fin(~) de
la forma
H¡<e> = 2e
H2<e> = 4e 2
H3<e> = se 3- 12
Hie> = 16e
4 -
(4.12-28)
4se
Hs(ü = 32es- 160e 3 + 12oe
etc.,
Los matemáticos conocen bien estas expresiones que se denominan polinomios de Hermite; la ecuación (4.12-16) recibe el nombre de Hermite. Los polinomios de Hermite
se pueden definir como
(4.12-29)
Se puede demostrar que la defmición (4.12-29) conduce a los polinomios que satisfacen la ecuación de Hermite (4.12-16). La demostración de esto se propone como
ejercicio para el lector.
Las funciones de onda reales l/ln(x) se obtienen de las soluciones polinómicas
de la ecuación de Hermite por medio de ( 4.12-15) y (4.12-1 0), siendo el resultado
(4.12-30)
El oscilador armónico unidimensional
117
en donde a está dada por (4.12-8) y en donde la constante de normalización Nn se
escoge de tal manera que
Se puede demostrar 9 que esta condición requiere que
(4.12-31)
Las funciones de onda dependientes del tiempo 'l{ln(x, t) se obtienen a partir
de las expresiones de (4.12-30) multiplicándolas por el factor e-ientfñ, de acuerdo
con (4.8-7).
Puesto que más adelante se compararán las propiedades del oscilador cuántico
con las de su equivalente clásico, conviene analizar brevemente algunas características
del oscilador clásico y, sobre todo, se debe calcular la distribución de probabilidad
asociada con éste. Dado que el desplazamiento x(t) de la partícula clásica es como
lo establece (4.12-4), se sigue que la energía cinética y la potencial del oscilador
clásico están dadas, respectivamente, por
de donde, la energía total debe ser
(4.12-32)
Esta ecuac10n se puede resolver para A en función de e, dando A= ..J2e/mw~,
y, si se supone que la energía tiene el valor (n +-t)hw 0 (como debe ser en el caso
del oscilador cuántico con el que se desea establecer una comparación directa), se
obtiene, para la amplitud del oscilador clásico con esta energía
A = J(T,J+i)h = J2n + 1 ,
mw 0
ex
(4.12-33)
en donde a está definida por ( 4.12-8).
La amplitud de probabilidad es la probabilidad de encontrar la partícula dentro
de una región dada dx alrededor del punto x. Para el oscilador clásico, esto es
sencillamente, la razón del tiempo dt que la partícula pasa en esta región durante el
curso de una vibración, al periodo de oscilación T( = 27r/w0 ). Puesto que dx = v(x) dt,
el tiempo que permanece la partícula en este intervalo durante un periodo es
2 d t_-2dx
v(x)'
9 D.
(4.12-34)
Bohm, Quantum Mechanics, Prentice-Hall, Englewood Clit'fs, N. J. (1951), página 305.
118
Mecánica cuántica. Generalidades
ya que pasa dos veces por la región durante un periodo completo de movimiento.
Dado que, de acuerdo con (4.12-4), v(t)=dx/dt=Aw 0 cos(w 0 t- 8), y, puesto que
w 0 t- 8 =sen - l (x/A)= cos- 1 (1- (x/A)2)lf2, v se puede expresar en función de x
por medio de
-~2
v(x) = Aw 0
J 1- A
2 •
(4.12-35)
La fracción de tiempo que pasa en dx es P(x) dx, en donde P(x) es la ampli·
tud de probabilidad clásica correspondiente a la cantidad cuántica 1/J*l/J. En vista de
que esta cantidad es igual a 2dt/T, debido a lo que establece (4.12-34) y la relación
T = 21T/w 0 , se tiene que
(4.12-36)
Si se usa (4.12-33), la amplitud de probabilidad de un oscilador clásico que
tiene una energía (n + )líw 0 se convierte en
-t
(4.12-37)
Esta cantidad se comparará con las amplitudes de probabilidad cuánticas 1/J~l/Jn
obtenidas a partir de ( 4.12-30).
En la figura 4.18 se ilustra el comportamiento general de las funciones de
onda correspondientes al oscilador armónico. Se observará que también en este caso
la función de onda penetra en la región más allá de los límites de amplitud del
movimiento clásico. Además, como se puede esperar, debido al hecho de que V(x)
es una función par de x, las funciones de onda son, dternadamente, funciones pares
e impares de x para valores ascendentes de n. Para el estado de energía más baja, la
amplitud de probabilidad clásica calculada a partir de (4.12-37), y representada por
la curva punteada en la figura, no se parece en absoluto a la amplitud de probabilidad desde el punto de vista de la mecánica cuántica. La amplitud de probabilidad
clásica predice que la partícula tiene una mayor tendencia a encontrarse cerca de los
extremos de la región de movimiento permisible, en tanto que el resultado cuántico
predice que es más posible encontrarla en el centro. Sin embargo, para un estado de
mayor amplitud y de una energía correspondientemente más alta, se encuentra una
coincidencia aceptable entre las distribuciones de probabilidad clásica y cuán tic a,
aparte del hecho de que, como es normal, la amplitud cuántica de probabilidad
oscila con gran rapidez alrededor de un valor medio semejante al resultado clásico.
Conforme la amplitud y la energía relacionadas con el movimiento se hacen detectables en una escala macroscópica, los resultados cuántico y clásico no son apre.ciablemente diferentes. Normalmente existen puntos a lo largo de la trayectoria clá~ca
de la partícula, en donde la probabilidad de encontrarla, según lo predice la amJ}litud de probabilidad cuántica, se hace sumamente pequeña.
Ortogonalidad de las funciones propias
1
1
'1
1
1
''1
ti
''
1
j
nn
-- -- - - -
1
1
n
\
1
:
¡1
1
1
1
11
'- /
1
11
,.
119
' ' '
1
/
/
~
lJ
o
:\
e
6
( b)
Figura 4.18.
4.13
(a) Funciones de onda de los estados de energía más bajos del oscilador armónico
cuántico unidimensional. (b) Amplitudes de probabilidad cuánticas (curvas continuas) y distribuciones de probabilidad clásicas (curvas punteadas) correspondientes
al o~cilador armónico unidimensional para dos valores de energía, if:wo y lf.l':wo.
[Tomado de L. Pauling y E. B. Wilson, lntroduction to Quantum Mechanics,
McGraw-Hill, Nueva York (1935).]
ORTOGONALIDAD DE LAS FUNCIONES PROPIAS
Y LA SUPERPOSICION DE ESTADOS
Se puede demostrar que las funciones propias de la ecuación unidimensional de
Schrodinger que satisfacen los requisitos físicos de las funciones de onda, presentan
siempre la propiedad de ortogonalidad, es decir, que obedecen siempre la ecuación
J~oo 1/1!1/Jn dx =O
(m# n)
=l
(m= n).
(4.13-1)
120
Mecánica cuántica. Generalidades
Estas relaciones son una propiedad característica de la ecuación de Schrodinger
y las condiciones de frontera, y se ha encontrado que se aplican sea cual fuere la
función de potencial V(x) y sin que tampoco importe la forma matemática que
tengan las funciones de onda. Que esto es nece~ariamente cierto, se puede comprobar escribiendo la ecuación unidimensional de Schrodinger para 1/1 n,
(4.13-2)
y la ecuación de onda 1/1~, que, de acuerdo con (4.7-12) y (4.8-6), debe ser
d 2 t/l* 2m
dx 2m - ¡r [em - V(x)]t/l!(x) =O.
(4.13-3)
Si la primera ecuación se multiplica por 1/1 ~, y la segunda por 1/1 n, se restan
ambas ecuaciones y se integra de oo a - oo, se obtiene
(4.13-4)
El integrando del término del lado izquierdo de esta ecuación se puede expresar como la derivada de 1/l~(dl/ln/dx) -- 1/ln(dl/1~/dx) con respecto a x, de donde,
( 4.13-4) se convierte en
(4.13-5)
Para funciones de onda con un buen comportamiento físico, 1/1 y dl/1/dx tienden a cero conforme x ~ ± oo; por tanto, la cantidad de la izquierda desaparece en
los dos puntos extremos y
(4.13-6)
Si se supone que las funciones de onda 1/1~ y 1/ln pertenecen a dos niveles de
energía diferentes, de tal manera que En =1= Em, entonces, se puede satisfacer (4.13-6)
si y sólo si
(m '# n).
(4.13-7)
Para m= n, se pierde el factor En -En en (4.13-6); en este caso, de acuerdo
con la forma en que se definen las funciones de onda ( 4.8-1 0), se debe tener
(4.13-8)
Así pues, las funciones dr onda 1/lm, 1/ln exhiben la propiedad de ortogonaltdad. La prop1cdad de ortogonalidad no está restringida a las soluciones de la ecuación de Schrodint'cr. sino que tamhién se relaciona con las soluciones características
Ortogonalidad de las funciones propias
121
de una gran clase de ecuaciones diferenciales, incluyendo la de calor, la de la cuerda
vibrante y las ecuaciones de ondas electromagnéticas. Se puede ver que las funciones
de onda (4.10-10) asociadas con un pozo de potencial infinitamente profundo, satisfacen las condiciones de ortogonalidad ya que, como se sabe y se puede comprobar
fácilmente,
f
mnx
nnx
sen - - sen - - dx = O.
L
L
0
L
(m -:F n)
(4.13-9)
Aunque es más difícil hacer la misma demostración para el pozo finito y para el
oscilador armónico, es cierto que las funciones de onda (4.11-5, 6, 7) y (4.12-30)
que pertenecen también a estos sistemas son también ortogonales. 1 0
Supóngase ahora que se tiene un conjunto infinito de funciones propias 1/Jn(x)
que son soluciones a la ecuación de Schrodinger para un potencial dado V(x). Ya se
dijo que estas funciones propias deben ser ortogonales y normalizadas de acuerdo
con (4.8-10), de manera que obedecen a (4.13-1). Se pueden combinar estas funciones propias en una superposición lineal, de modo que la suma represente una
función arbitraria de x, sujeta a ciertas restricciones matemáticas que no son muy
severas. Para entender cómo se hace esto, supóngase que una función arbitraria f(x)
se puede representar como la combinación lineal de las funciones propias de tal
manera que
<Xl
f(x) =
L ant/Jn(x).
n=O
(4.13-10)
Al multiplic<!T esta ecuación por 1/J~(x) e integrar, se encuentra que
(4.13-11)
En la suma, todas las integrales son cero por virtud de (4.13-1 ), excepto
aquella para la que n = m, que da un valor de am. El resultado final es
(4.13-12)
Si se substituye este valor en lugar de am ( 4.13-1 0), es obvio que f(x) se
puede respresentar como
(4.13-13)
en donde la variable ficticia de integración x' se substituyó con x para evitar confusiones.
Para las funciones propias senoidales de la sección 4.1 O, sucede que, esta expansión es simplemente una expansión de serie de Fourier. Se pueden efectuar
10 /bid.,
página 219. Véase también R. V. Churchill, Fourier Series and Boundary Value
Problems, McGraw-Hill, Nueva York (1941), páginas 46-52.
122 Mecánica cuántica. Generalidades
expansiones similares en términos de las funciones de Hermite asociadas con el
oscilador armónico, y en términos de otras funciones de onda relacionadas con otras
funciones de potencial. En la sección 4.9 se vio un ejemplo de una situación en la
que los valores propios y las funciones propias están distribuidos en una forma
continua, en lugar de discreta. En este caso se encontró que una función arbitraria
se podía representar como una combinación de integrales de las funciones propias,
de la forma de una integral de Fourier. Este resultado se puede extender a las
funciones propias que representan cualquier sistema cuyos valores propios tienen una
distribución continua, y el resultado se puede expresar como la ecuación (4.13-13)
en el límite en el que los valores propios se amontonan o concentran, después de lo
cual la suma en dicha ecuación se convierte en integral. Aunque esta representación
integral es importante y hay que mencionarla como dato complementario, no se
analizará en detalle, ya que no se utilizará en esta sección. Su aplicación al caso de
las funciones propias de la partícula libre puede verse con claridad en la exposición
de la sección 4.9.
La combinación lineal de las funciones propias tales como (4.13-1 O) no constituye una solución a la ecuación de Schri:idinger, independiente del tiempo relacionada
con algún valor particular de energía en, ya que ha perdido la forma (4.8-7); pero, una
combinación lineal de las funciones propias dependientes del tiempo de la forma
00
00
n=O
n=O
f(x,t) = L an '1' n<x,t) = L ani/Jix)e-i""''ll,
(4.13-14)
que se reduce a (4.13-10) para t =O, es efectivamente una solución para la ecuación
de Schri:idinger dependiente del tiempo, (4.7-3). Esto se puede verificar de un modo
directo con gran facilidad considerando el hecho de que las funciones propias independientes del tiempo 1/Jn obedecen siempre, de acuerdo con (4.8-8), a la relación
.tf 1/Jn =En 1/Jn. Esto permite ver que, aunque se puede construir una superposición
de funciones de onda, que obedezcan a la ecuación de Schri:idinger dependiente del
tiempo, para representar cualquier función o amplitud de probabilidad en un instante
dado (t = O en el ejemplo anterior), en general, la superposición de las funciones de
onda no stgue representando esa misma función o amplitud de probabilidad en
tiempos posteriores, debido a las diferentes dependencias del tiempo de las componentes individuales de dicha superposición. Así pues, una superposición de funciones
de onda no representa por lo general un estado estacionario del sistema. Este tema
ya se tocó en la sección 4.8.
Si una superposición de funciones propias, tales como (4.13-14), va a utilizarse
como cualquier tipo de función de onda para un sistema físico, es necesario normalizarla para que satisfaga ( 4. 7-6). Por tanto, para funciones de onda de la forma
(4.13-14), se debe tener
(4.13-U)
En vista de los establecido por {4.13-1 ), todos los términos de la doble suma
son cero, excepto aquellos para los que m = n, en donde el valor de la integral es
igual a la unidad. En consecuencia, se encuentra que el requisito de normalización
quedará satisfecho a condición de que los coeficientes se escojan de tal modo que
(4.13-16)
Valores esperados y números cuánticos
4.14
123
VALORES ESPERADOS Y NUMEROS CUANTICOS
Supóngase que se hace un gran número de mediciones de una cantidad física f
que es una propiedad de un sistema dinámico dado. Estas mediciones se hacen
siempre sobre el mismo sistema o en sistemas idénticos que se encuentran siempre
en el mismo estado. Si se conserva la propiedad f, es decir, si es constante con
respecto al movimiento de dicho sistema, entonces (dentro del error experimental
que se supondrá despreciable), se obtendrá el mismo valor de f en cada medición, y
si se traza una gráfica de la frecuencia P(j) df con que se obtiene un valor medido en
un rango df alrededor de f, será simplemente un "pico" localizado en un valor dado
/ 0 , que constituye el valor esperado <ft. Esta situación se ilustra en la figura 4.19(a).
Si la propiedad f no se conserva en el movimiento, se puede esperar obtener resultados diferentes en cada medición y una gráfica de la frecuencia a la que se observan los valores en un rango df alrededor de f, en función de f, presentará una
··ampliación" alrededor de un valor promedio o esperado (ft, como se ilustra en la
figura 4.19(b ). El grado de la ampliación estadística de las mediciones se puede
expresar en términos de la desviación estándar a, que se define como
(4.14-1)
De acuerdo con esto, es evidente que si f es siempre lo mismo que (ft, como
sucede en la distribución "pico" de la figura 4.19(a), entonces, a= O, mientras que
si f y <ft no son siempre iguales, entonces a es la desviación de raíz cuadrada media
de los valores de f en relación con el promedio. La expresión (4.14-1) puede escribirse en diferente forma, haciendo notar que
P(f)
p (f}
fo
( = <t>l
(al
Figura 4.19.
<t>
(b}
(a) Distribución estadística de muchas determinaciones relativas a una cantidad
que es una constante del movimiento (b) Distribución análoga Lurrespondiente a
una cantidad que no es una constante del movimiento.
le donde,
(12
= <12> - 2(/)(f) + <!>2
=
<!2>- (!)2.
(4.14-2)
124
Mecánica cuántica. Generalidades
Uno de los postulados fundamentales es que el valor esperado de una cantidad
dinámica está dado por
(f) =
f~"' 'P*fop'P dx,
(4.14-3)
en donde fop es el operador correspondiente a la variable dinámica f y en donde 'IJ1
representa la función de onda del sistema para el que se mide f Ahora se investi·
garán ciertos valores esperados relacionados con el operador de energía (- h/iXofot),
primeramente, para un sistema en uno de sus estados propios, y luego para el mismo
sistema en un estado que se representa como una superposición de dos estados
propios.
En primer lugar, es obvio que para cualquier sistema, el valor esperado de
energía (e), se puede calcular a partir de la función de onda dependiente del tiempo
'IJ!(x,t) por medio de (4.14-3), utilizando también (4.7-4). El resultado es
o'P)
Ji
(e) = f oo 'P* ( --:--;-dx, = foo 'P*.Jf'P dx = ($).
-oo
1 ut
_ 00
(4.14-4)
El valor esperado de la energía es, entonces, el mismo que el del operador
hamiltoniano evaluado sobre las funciones de onda dependientes del tiempo. Si
'IJ!(x,t) es una función de onda que representa un estado propio estacionario del
sistema y que, por tanto, tiene la forma ( 4.8-7), ( 4.14-4) se puede expresar como
sigue
(4.14-5)
El valor esperado del operador hamiltoniano y, por ende, de la energía es, en
este caso, el mismo cuando se toma sobre las funciones de onda independientes del
tiempo 1/J(x), o bien, que sobre las funciones dependientes del tiempo 'IJ!(x,t). Puesto
que :Tf, de acuerdo con (4.7-5), es un operador independiente del tiempo, no opera
en factores de tiempo en (4.14-5); por tanto, estos factores se pueden mover más
allá del operador :lf y cancelarse entre sí.
Si la función de onda 'IJ!(x,t) es una superposición de las funciones propias de
estado estacionario de la forma ( 4.13-14),
'P(x,t) = L anl/ln(x)e-ient!A,
(4.14-6)
"
entonces, de acuerdo con (4.14-4), observando nuevamente que :lf no opera sobre
los factores de tiempo,
(4.14-7)
Si se usa (4.8-8), que indica que :1ft/In= Ent/ln, se tiene
(e) = L L e"e-i(en-em)t/A
m
n
f"' a!anl/l!l/ln dx,
-oo
(4.14-8)
Valores esperados y números cuánticos
125
que, en vista de la propiedad de ortogonalidad de las funciones propias, se reduce a
(4.14-9)
todas las integrales de (4.14-8) desaparecen excepto aquellas para las que m= n. Sin
embargo, este es el mismo valor que se obtuvo tomando el valor esperado del
operador hamiltoniano Yf sobre la función de onda independiente del tiempo
t/l(x) = 'l'{x,O) = L a.t/l.(x),
(4.14-10)
porque entonces, utilizando ( 4.8-8) y las propiedades de ortogonalidad de las funciones propias,
= L L a!a.e.
m
n
foo t/l!t/1. dx = L a:a.e. = (e).
-oo
(4.14-11)
n
El operador Yf que opera sobre la función independiente del tiempo
(4.14-10), es por tanto, totalmente equivalente al operador (-h/iXofot) que opera
sobre la función dependiente del tiempo (4.14-6). Cuando se calculen los valores
esperados para funciones de ondas superpuestas, se usará este resultado que se debe
a la independencia del tiempo del operador Yf y la ortogonalidad de las funciones
propias.
Si el sistema se encuentra en uno de sus estados propios estacionarios, su
función de onda es 1/Jn(x), y, de acuerdo con (4.14-5),
(e)= (Jt") =
f~oo .¡,:Jt"t/1. dx = f~oo .¡,:(e.t/1.) dx =e. f~oo t/l:t/1. dx =e•.
(4.14-12)
De igual manera, el valor esperado de e2 se puede determinar evaluando el
operador correspondiente independiente del tiempo :lf 2 sobre la función de onda
independiente del tiempo,l 1 según lo cual
La desviación estándar asociaJa con una serie de determinaciones de energía
sobre un sistema, en uno de sus estados propios estacionarios será, de acuerdo con
(4.14-2), (4.14-12) y (4.14-13)
(4.14-14)
11 Estrictamente hablando, este enunciado se debe (y se puede) demostrar mediante los
métodos usados para derivar (4.14-9) y (4.14-11).
126 Mecánica cuántica. Generalidades
Entonces, se obtendrá una distribución "pico" en donde cada medición dará el
mismo valor de energía en.
Ahora se supondrá que la función de onda del sistema es una superposición de
dos funciones propias, de la forma
(4.14-15)
de tal manera que
(4.14-16)
en donde, de acuerdo con (4.13-16),
(4.14-17)
El valor esperado de la energía se puede evaluar ahora calculando el valor
esperado del operador :if sobre la función de onda (4.14-16). Por supuesto, los
resultados se pueden obtener como un caso especial de (4.4-11),.por ló cual
(4.14-18)
en donde
and
:ff 2
1 -a.= a:an.
(4.14-19)
Del mismo modo, el valor esperado de e2 se puede determinar evaluando
y empleando la función de onda (4.14-16), lo cual da
(.Yt' 2 ) =
f~.., (a!t/1! + a:t/f:)Jf.Yf(amt/Jm + ant/Jn) dx
= f~..,a!amt/J!.Yf(.Yft/lm) dx + f~.., a:ant/J:.1f(.Yft/ln) dx
+ f~.., a!ant/J!.Yt'(.1ft/ln) dx + f~oo a:amt/J:..it'(.rt't/lm) dx.
(4.14-20)
Sin embargo, .rt'l/lm = em 1/lm y Hl/ln =en 1/ln; al aplicar estas fórmulas dos
veces a cada una de las cuatro integrales de ( 4.14-20) se obtiene
(4.14-21)
Las dos primeras integrales de (4.14-21) son la unidad y las otras dos son
cero, debido a la ortogonalidad de las funciones propias 1/Jn. La ecuación se reduce.
en este caso, a
(4.14-22)
Valores esperados y números cuánticos
127
La desviación estándar asociada con mediciones de energía en un sistema cuya
función de onda es la superposición (4.14-15), es
(4.14-23)
La desviación estándar es cero sólo cuando a = O, a = 1, ó em = en; en cada
uno de estos casos, la función de onda ( 4.14-16) se reduce a una sola función
propia del sistema. Sin embargo, en general, se tendrá cierto "despliegue" relacionado con mediciones de energía de un sistema de esta índole, en donde las determinaciones no dan siempre el mismo valor de energía. En realidad, si se piensa un
P(•)
Figura 4.20.
Distribución estadística de energías para sistemas cuyas funciones de onda son
superposiciones de las mésima y nésima funciones propias
poco, se verá que la distribución de frecuencia de "dos picos" de la figura 4.20
coincide con los valores de (e) y (e 2 ) dados por (4.14-18) y (4.14-22). Si se estudian
los valores esperados de potencias más altas de e, se llegará a la conclusión de que
sólo esta distribución es consistente con todos los valores esperados. 12 En la actua\\d.ad., \a \n.terpretadón. -pteva.\ec¡,den.te de este resultado es o,.ue, cuando se mide la
energía en un sistema, el acto mismo de la medición hace que el sistema pase a uno
de sus estados propios, si no está ya en uno de ellos, y que la probabilidad de que
el valor medido de la energía esté asociado con uno u otro estado propio, es propor.::ional a la cantidad a~am relacionada con el estado propio en la función de onda
de superposición.
Si la cantidad a 2 asociada con el valor esperado de cierta cantidad dinámica es
.::ero, se dice que esa cantidad se conserva en el movimiento o que es una constante
del movimiento. De acuerdo con (4.14-14), es evidente que se conserva la energía de
"Jn sistema en uno de sus estados propios. Si se puede encontrar un operador A con
la propiedad de que
(4.14-24)
12 C. W.
Sherwin, op. cit. páginas. 118-122.
128 Mecánica cuántica. Generalidades
en donde An es una constante, se dice que An es un valor propio del operador A.
Para tal operador,
(4.14-25)
y
(4.14-26)
por lo cual,
(4.14-27)
y la cantidad dinámica representada por A se conserva, y el valor esperado del
operador A está dado por el valor propio An· Evidentemente, el operador hamiltoniano Jf es tal, que sus valores propios son las energías En· Cualquier otro
operador A, que posea la propiedad (4.14-24) con respecto a las funciones propias
del sistema, conmutará siempre con el operador hamiltoniano, es decir, siempre se
encontrará que
AJf =ffA,
(4.14-28)
Jt' Al/In= Jt'().nl/ln) = AnJfl/ln = AnBnl/ln
(4.14-29)
A.tfl/ln = A(enl/ln) = enAI/1. = enA.nl/ln = ff Al/In·
(4.14-30)
ya que, entonces,
y
La inversa de este enunciado es verdad también; si un operador A conmuta
con el operador hamiltoniano, como sucede en (4.14-28), el operador tiene la propiedad ( 4.14-24) con respecto a las funciones propias 1/1 n, y la variable dinámica que
representa es una constante del movimiento ya que en este caso se satisface
( 4.14-27),13
Cuando se trata de sistemas más complejos, tales como el átomo de hidrógeno,
que se estudia en la siguiente sección, las relaciones (4.14-24) y (4.14-28) son muy
útiles para demostrar que ciertas cantidades dinámicas son constantes del movimiento. Se constatará, recurriendo a (4.14-24), que el total de la cantidad de movimiento angular orbital del electrón dentro del átomo de hidrógeno, y su componente z, son constantes del movimiento.
4.15
EL ATOMO DE HIDROGENO
El átomo de hidrógeno es un sistema compuesto de un protón y un solo
electrón que interactúan como resultado de su atracción electrostática mutua. El
potencial clásico de este sistema es, sencillamente,
V(r) = - e2 /r,
(4.15-1)
13 Si se desea ver la demostración inversa ·de esta expresión, véase E. Merzbacher, op. cit.,
página. 160.
El átomo de hidrógeno
129
en donde e es la carga electrónica y r la distancia entre el electrón y el protón. En
este estudio se considerará que la masa del protón es infinita en comparación con la
del electrón. En esta aproximación, cualquier movimiento del protón puede considerarse como despreciable, ya que se supone que el movimiento es el que realiza el
electrón alrededor de un núcleo fijo. Puesto que la masa del protón es alrededor de
1850 veces la del electrón, esta aproximación es aceptable. El movimiento del protón se puede tomar en cuenta si se utiliza una masa reducida, como se hizo en el
análisis de la sección 4.5 en relación con el átomo de Bohr.
Considerando la simetría esférica del potencial (4.15-1) conviene usar el sistema
de coordenadas esféricas ya conocido, donde
x = r sen Ocos rjJ
y = r sen Osen rjJ
z = r cosO,
r
X
Figura 4.21.
Sistema de coordenadas esféricas utilizadas en el estudio del átomo de hidrógeno.
como se ilustra en la figura 4.21, en donde se puede escribir la ecuación independiente del tiempo de Schrodinger como
(4.15-2)
con
(4.15-3)
En (4.15-2), m 0 representa la masa del electrón.
Se puede proceder mediante la técnica ya conocida de separación de variables,
en la que se supone que las soluciones tienen la forma
1/J(r,O,r/J) = R(r)E>(O)<'P(r/J),
(4.15-4)
130
Mecánica cuántü:::. Generalidades
en donde R(r) es una función de r solamente, independiente de 8 y 1/>; 8(8) es una función sólo de 8, y cl>(if>) es una función exclusiva de 1/>. Al substituir esta forma para la
solución, en (4.15-2), observando que 3¡J¡f3r = 0cl> dR/dr, 31/1/38 = Rcl> d0/d8 y 31/1/31/>
=R@Jd~/dl/>, multiplicando la ecuación resultante por r2 sen 2 8/(R~), y transponiendo, se tiene que
Puesto que la expresión de la izquierda, que es una función solamente de r y
8 es igual a otra expresión que es una función exclusiva de 1/>, las dos expresiones se
deben igualar por separado a una constante que, por razones que se verán en breve,
se representará por medio de m 2 .
A continuación se limitará el estudio, por un momento, a la última igualdad
que aparece en (4.15-5). Esta se puede reacomodar ligeramente de tal modo que se
lea
(4.15-6)
que es una ecuación diferencial cuya solución se puede escribir como sigue
(4.15-7)
Puesto que la función de onda completa ¡J¡ debe tener un solo valor, es
necesario que cl>m(l/>) tenga un solo valor también. En otras palabras, es necesario
que
(4.15-8)
por lo que, de acuerdo con (4.15-7),
o bien,
e±2,.mi =l.
(4.15-9)
Esta condición se puede satisfacer sólo si m es un entero positivo o negativo o
bien, cero. Los valores permisibles de m están limitados, entonces, a
m= O, ±1, ±2, ±3, ···,
de otra manera, la función de onda tendrá múltiples valores. Ahora se comprenderá
por qué la constante de separación se escogió de tal manera que se representara
mediante m 2 • Si m es un número real, entonces m 2 debe ser positiva. Si la constante de separación de ( 4.1 S-5) hubiera sido negativa, las soluciones ( 4.1 S-7) habrían
sido exponenciales y no sinusoidales y la condición de valor único (4.15-8) nunca se
habría satisfecho. Así pues, la constante de separación se escogió de este modo para
asegurar que tendría siempre un valor positivo y, por ende, excluyera inmediatamente las soluciones indeseables.
El átomo de hidrógeno
131
En (4.15-5), la expresión de la izquierda se puede igualar a m 2 , y la ecuación
resultante dividirse entre sen 2 fJ y reacomodarse en tal forma que se exprese como
sigue
1d ( r 2 -dR)
R dr
dr
2
2
2
0r (
e ) = - - -1- - sde( n ( )
dE>)
m =fJ,
+2m- e+- +-li 2
r
E> sen O d()
d()
sen 2 ()
(4.15-10)
Una vez más, puesto que la primera expresión es una función exclusiva de r y
la segunda lo es sólo de fJ, las dos deben ser iguales, independientemente, a una
constante {3. La segunda igualdad de (4.15-10) se puede escribir en la forma
1 d (
dE>)
m 2 E>
sen() dO sen() d() - sen 2 () + {JE>(O) = O.
(4.15-11)
Esta ecuación es muy conocida en la física matemática y se denomina ecuación de
Legendre. Sin entrar en muchos detalles matemáticos, 14 se observará que las únicas
soluciones de esta ecuación que no violan los requisitos de lo fmito para las funciones de onda son aquellas para las que {3 tiene valores de O, 2, 6, 12, 20, • • • , de
donde, para aquellas en que
fJ = l(l + 1)
con
(l = 0,1,2,3, · · · ).
(4.15-12)
En estos casos, las soluciones de (4.15-11) se reducen a un polinomio en cos fJ
y sen fJ más o menos en la misma forma en que las soluciones de la ecuación de
Hermite se reducen a polinomios en ciertas condiciones. Estas soluciones polinómicas
se pueden representar como las funciones asociadas de Legendre P'f(8), definidas por
dlml
Pr(()) =senlml () d(cos O)lml P,(cos O)
(4.15-13)
1 d 1(cos 2 ( ) - 1)'
P,(cos ()) = 211!
d(cos 6)1
(4.15-14)
en donde
Las funciones P1 (cos fJ) son las llamadas polinomios de Legendre, las primeras
de las cuales son
P 0 (cos O)= 1
P¡{COS ()) = cos ()
(4.15-15)
P 2 (cos O)= t(3 cos 2 ()- 1)
P 3 (cos 9) = !(5 cos 3 ( ) - cos 9)
etc.
14 Por ejemplo, véase R. B. Leighton, Principies o[ Modern Physics, McGraw-Hill Book Co.,
Inc., Nueva York (1959), página 168.
132
Mecánica cuántica. Generalidades
Por supuesto, cuando m= O, las funciones asociadas P?(e) se reducen a los
simples polinomios de Legendre P1( cos 8). La función E>( 8) de ( 4.15-11) se escribe
casi siempre en la forma
0 (8) = J(2l + l)(l- m)! pm(e)
lm
2( 1 + m) !
1
,
(4.15-16)
siendo el factor de multiplicación Pf(8) una constante de normalización. La parte
angular de la función de onda, representada como un producto de 8 1m(8) y <I>m(cf>)
se escribe con frecuencia en la siguiente forma
= ( -l)m
J( +
21
1)(l- m)l
. Pr(e)eim<J>.
4n(/ +m)!
(4.15-17)
Las funciones Y 1m (e ,e/>) se conocen como armónicas esféricas. Para una fuerza
central en donde el potencial es una función exclusiva de r, la parte angular de la
función de onda está dada siempre por ( 4.15-17), sea cual fuere la forma particular
que tome V(r).
La porción radial de la ecuación ( 4.15-1 O), tomando ~ = l(l + 1) como lo requiere ( 4.15-12), se convierte ahora en
_1_ .!!_ (r 2 dR) + 2m 0 (s + e 2 )R(r) _ 1(1 + 1)R(r) =O.
r
r2
r 2 dr
dr
li 2
(4.15-18)
Esta expresión se denomina ecuación de Laguerre. Las soluciones cuyo comportamiento en r = oo permite calificarlas como funciones de onda, son aquellas que se
pueden expresar en términos de los polinomios de Laguerre. Estas funciones con las
que se asocia un conjunto discreto de valores propios de la energía E, se pueden
expresar como sigue
_ _
Rnl(r)-
( 1 1)' ]1/2
[(2 nli2 2)3 (2n[n
+ /]
e
moe
. n-
-
·
!)3
-p¡z 1 zt+ 1
p Ln+l (p),
(4.15-19)
en donde
11 =
1,2,3, ....
(4.15-20)
y en donde
(4.15-21)
Las funciones L ~':/(p) son funciones asociadas de Laguerre, definidas por
ds
L~(p) = -1S L,(p),
(p
(4.15-22)
en donde Lr(P) son los polinomios de Laguerre que, a su vez, se definen como
d'
L,(p) = eP -1 ,(p'e-P).
(p
(4.15-23)
El átomo de hidrógeno
133
Las energías en para las que existen funciones de onda aceptables están relacionadas con los valores de n en (4.15-19) por medio de 15
(4.15-24)
La ecuación ( 4.15-24) para los niveles de energía del átomo de hidrógeno
concuerda con el resultado ( 4.5-8) de la teoría de Bohr; los niveles energéticos,
según se ilustran en la figura 4.5, y dados por la teoría de Bohr son los mismos que
los que predice la mecánica ondulatoria.
Existen tres números cuánticos, n, l y m en el planteamiento de la mecánica
ondulatoria para el átomo de hidrógeno. Los valores posibles de n están dados por
(4.15-20). Los polinomios de Laguerre Lr(P) de (4.14-23) se pueden identificar como
polinomios de grado r. Estos polinomios se pueden derivar sólo r veces antes de que
el resultado de la derivación repetida dé cero como resultado. De donde, para las
funciones de onda que no sean cero de la forma
que se puedan obtener del
polinomio Lr, el número de derivaciones s necesarias para generar la función asociada
de acuerdo con (4.15-22), debe ser igual o menor que r. Entonces, para
funciones de onda con significado físico, es necesario tener en (4.15-22)
L:,
L:
s ~ r,
(4.15-25)
21 + 1 ~ n +l.
(4.15-26)
o, en (4.15-19)
Si se resta l + 1 en ambos lados de esta desigualdad, (4.15-26) se reduce a
l~n-1.
(4.15-27)
De igual manera, la función asociada de Legendre P{'(fJ) se obtiene del polinomio de Legendre P1(cos fJ) mediante una derivación de m veces. Para una función
de onda distinta a cero de la forma P{'(fJ), el número de derivaciones m debe ser
igual o menor que el grado l del polinomio. Por tanto, se debe tener
(4.15-28)
para funciones de onda de interés físico. Las condiciones expresadas en (4.15-20),
( 4.15-27) y ( 4.15-28), sirven para definir las expresiones bien conocidas para el
rango posible de valores correspondientes a n, l y m,
n = 1,2,3,4, ···
l = 0,1,2,3, ··· n- 1
(4.15-29)
m =0,±1,±2,±3, ···±l.
Por lo común los estados para los que l = O, 1, 2, 3 se mencionan como estados s, p, d y f, respectivamente. Así pues, para indicar un estado para el que n = 2
y l =O, se dice estado 2s, en tanto que uno con n = 3 y l = 2 se representa como
estado 3d.
15 Los detalles matemáticos de este desarrollo están dados por R. B. Leighton, op. cit.,
páginas. 171-17 5.
134 Mecánica cuántica. Generalidades
Las funciones de onda completas para el átomo de hidrógeno, de acuerdo con
lo establecido en ( 4.15-4), deben ser
(4.15-30)
en donde Rn 1(r), E>,m(l1>, y <~~m(C/>) son según lo establecen, respectivamente,
(4.15-7), (4.15-16) y (4.15-19), y en donde Nnlm es una constante de normalización
seleccionada en tal forma que
f
1/J:,ml/lnlm · r 2senO dr dO df/J =l.
(4.15-31)
Se encuentra que las funciones de onda (4.15-30) son ortogonales, de modo
que
f
1/J:I'm'l/lnlm · r 2 senO dr d(J df/J =O,
(4.15-32)
a menos que n = n', l = l' y m= m' simultáneamente. Las funciones de onda dependientes del tiempo se o_btienen a partir de las funciofles independientes del tiempo y
multiplicándolas por e- 1 ent/fl.
TABLA 4.1.
Funciones de onda del átomo de hidrógeno
m=O
.P1oo = Nlooe-'hP
1s
1=0
1=1
(4 estados)
m=O
m=O
m=±1
.P2oo = N2oo(2- p)e-'hP
.P21o = N21ope- 'hP cos 8
.P21±1 = N211pe-~'>P sen8 e± 1"'
2s
1=0
1= 1
m=O
m=O
m=±1
m=O
m=±1
m=±2
.P3oo = N3oo(6- 6p + p2)e- 'hP
.P31o = N31op(4- p)e- 'hP cos 8
.P3t±1 = N311p(4 -p)e-'l.zP sen8 e± 1•
.P32o = N32op 2e_ 'hP(3 cos 2 8- 1)
.P32± 1 = N321p 2e- 'hP sen8 cos 8 e± 1"'
if¡ 32 ±2 = N 322 p2e- 'lzP sen 2 8e±Z1"'
m=O
m=O
m=±1
m=O
m=±1
m=±2
m=O
m=±1
m=±2
m=±3
.P4oo = N4oo(24- 36p + 12p 2 - p3)e- 'hP
4s
.P4to = N4tope- 'hP(20- 10p + p2) cos 8
} 4p3
.P4t±l = N411pe-'lzP(20- 10p +p 2) sen8 e± 14>
.P4zo = N42oP 2(6 -p)e- 'hP(3 cos 2 8- 1)
.P42±1 = N42tP 2(6 -p)e-'hPsen8 cos 8 e± 1•
.P4z±Z = N4••P 2(6- p)e-'l.zP sen 2 8 eu 1•
.P43o = N43op 3e-'hP(j-cos 3 8- cos 8)
.p43±1 = N43tp 3e- 'h•(5 cos 2 8- 1) sen 8 e± 1"'
.P43±2 = N432p 3e-'h.Psen 2 8 cos 8 e± 21 "'
.P43±3 =N433p 3e-'hPsen 3 8 e± 3'"'
n=1
1=0
n=2
n=3
1=2
(9 estados)
n=4
1=0
l= 1
1=2
1=3
(16 estados)
N
nlm
} 2p3
3s
} 3p3
) 3d'
)4d'
}·;,
= _ [ cmoe 2 ) 3 (n -1- 1)!(/- m)!(2/ + 1)]'/.z
nli'
4rr(2n[n + /]!) 3(/ + m)!
El átomo de hidrógeno
Figura 4.22.
135
Representaciones fotográficas de la densidad de electrones asociada con varios
estados propios del átomo de hidrógeno. El eje polar yace sobre el plano de la
página y está orientado verticalmente.
De acuerdo con (4.15-24), es evidente que la energía depende sólo del número
cuántico principal n de este sistema particular. Existen muchos estados cuánticos
independientes [correspondientes a los diversos valores permisibles para l y m, de
acuerdo con (4.15-29)], que tienen el mismo número cuántico principal n y que, por
tanto, pertenecen al mismo nivel de energía. Este fenómeno se conoce como degeneración y un nivel energético que contiene más de un estado cuántico independiente
se conoce con el nombre de nivel degenerado. Gracias a ( 4.15-29), se puede ver
mediante un simple recuento de los estados, que la degeneración o multiplicidad
asociada con el nivel de energía En, cuyo número cuántico principal es n, es simplemente n 2 •
Las expresiones algebraicas para algunas de las funciones de onda del átomo de
hidrógeno se ilustran en la tabla 4.1 y, en la figura 4.22 se muestran algunas representaciones de la densidad de probabilidad de algunos de estos estados. Se observará
que los estados s- (l = O) son siempre esféricamente simétricos, en tanto que los
estados p-, d- y f, etc., tienen dependencias angulares que pueden ser muy complejas. El estado 2p- para el que m = O, tiene dos lóbulos que señalan hacia las
direcciones ± z, en tanto que los estados 2p- para los que m = ± 1 tienen la forma
de "ondas" y son simétricos alrededor del eje z. Por tanto, todos los estados 2p-
136
Mecánica cuántica. Generalidades
Figura 4.22.
(continúa). La escala no es uniforme en todos los diagramas. [Tomado de R. B.
Leighton, Principies of Modern Physics, McGraw-Hill, Nueva York (1959).]
tienen amplitudes de probabilidad que son simétricas alrededor del eje z. Se podría
preguntar cuál es la razón de esta aparente preferencia por el eje z. Después de
todo, el potencial V(r) es esféricamente simétrico, lo cual permite en primer lugar
escoger cualquier eje polar del sistema de coordenadas esféricas, y se seleccionó éste
de un modo puramente arbitrario. Entonces, ¿por qué parece que este aspecto es en
apariencia preferible o, más concisamente, se prefiere en realidad este eje en un
sentido físico?
En la sección 4.13 se hizo notar que las superposiciones lineales de las funciones ondulatorias en estado estacionario que pertenecen a diferentes niveles de
energía, no representan amplitudes de probabilidad que son independientes del tiempo. Puesto que las diversas funciones propias de estado estacionario independientes
que pertenecen al mismo grado energético degenerado tienen el mismo factor de
dependencia del tiempo e-iEntffi, sin embargo, se sigue que los estados de esta
naturaleza pueden superponerse y la amplitud de probabilidad de la superposición
sigue siendo independiente del tiempo. En la sección 4.10 se vio un ejemplo de este
tipo [en relación con la ecuación (4.10-13)]. Por ejemplo, de acuerdo con la tabla 4.1 y (4.15-29) es evidente que existen tres estados independientes 2p para el
átomo de hidrógeno. No obstante, no existe ninguna diferencia si se considera que
El átomo de hidrógeno
137
estos estados son los mismos que se indican en la tabla 4.1 ó si se les toma como
tres superposiciones linealmente independientes de dichos estados. Mediante la superposición adecuada de los tres estados dados en la tabla 4.1, se podrían producir tres
funciones de onda independientes en superposición, que correspondan a las amplitudes de probabilidad con lóbulos que señalen a lo largo de los ejes x-, y- y z-, en
lugar del lóbulo polar y la configuración en "dona" de las funciones de la tabla. Si
se hace una superposición lineal adecuada y subsecuente de estas tres funciones de
onda, se puede hacer que estos tres lóbulos señalen en cualquiera de tres direcciones
ortogonales dadas. Esto demuestra que las funciones de onda de la tabla 4.1, en las
que un eje polar arbitrariamente escogido parece tener un grado único o preferencial,
forman sólo una representación de las funciones de onda del sistema y que, a través
de la superposición correcta de estados cuánticos degenerados, se podría formar una
representación en la que el eje polar estuviese en alguna otra dirección. Además, por
supuesto, si así se deseara, se podría superponer el estado 2s a lo largo de los tres
estados 2p. No obstante, no se podría sumar en un estado 3s o 3p y seguir conservando una amplitud de probabilidad independiente del tiempo.
o3/2R/Z
3/2 2
o
1
o
Figura 4.23.
k
R 10
~
1
1
10
15
Gráficas de la función de onda radial Rn¡(r) correspondiente a 11lgunos estados del
átomo de hidrógeno. [Tomado de R. B. Leighton, Principies of Modern Physics,
McGraw-Hill, Nueva York (1959).]
En la figura 4.23 se muestra una gráfica de la función de onda radial Rn¡(r)
para varios de los estados de energía más bajos del átomo de hidrógeno, y en la
figura 4.24 se muestra una gráfica de la densidad de probabilidad radial, que es la
probabilidad de encontrar al electrón dentro de una capa esférica de un espesor dr,
alrededor del radio r. Puesto que el volumen de una capa de esta naturaleza es,
138 Mecánica cuántica. Generalidades
47rr2 dr, la densidad de probabilidad radial debe ser proporcional a r 2 R~ 1nl(r). 1
demostración de este aserto se propone como ejercicio para el lector. Los máxim<
en la densidad de probabilidad radial para las funciones de onda s, como se ilust1
en la figura 4.24, son muy semejantes (aunque no idénticas) a los radios de Bot
rn, según lo establece (4.5-4).
Ya se observó, gracias a la ecuación (4.15-24), que el número cuántico pri1
cipal n está asociado con la energía total del sistema. Más tarde se verá que 1<
números cuánticos 1 y m están relacionados con la cantidad de movimiento angul:
del sistema. En el movimiento planetario clásico se conserva la cantidad de mov
25
Zr
o;
Figura 4.24.
Gráficas de la distribución de probabilidad radial r2R~ 1 (r) para algunos estado~ d
átomo de hidrógeno. [Tomado de R. B. Leighton, l'rinciples of Modern Physic
McGraw-Hill, Nueva York (1959).]
miento angular orbital. Como se verá en breve, esto se aplica también al plante:
miento de la mecánica cuántica. La cantidad de movimiento angular clásica L de ur
partícula se define por medio de
L = r X p,
(4.15-3:
en donde p es la cantidad de movimiento lineal y r es el vector de radio a partir d
un origen arbitrario hasta la partícula. De acuerdo con esta definición y el enur
ciado de los operadores de cantidad de movimiento lineal (4.7-2), se puede construJ
de un modo muy directo un conjunto de operadores que representen las comp<
nentes cartesianas de una cantidad de movimiento angular. El resultado es
L
L
y
=zp" -xpz =~[z~-x!_]
i
OX
oz
z
=xpy -yp" =~[x!_-y!_]
i
iJy
ox .
(4.15-3~
El átomo de hidrógeno
139
Estos operadores se pueden expresar de acuerdo con las coordenadas esféricas
(r, O, cp) mediante una transformación de coordenadas directa, pero tediosa. En este caso,
los operadores se convierten en
L
x
li[
a - ctn () cos "~',¡,. -a<Pa]
= -¡ - sen "~',~,. -ao
L = ~ [cos ,¡,. 0 - ctn Osen,¡,.~]
'
"~' ao
¡
(4.15-35)
"~' a<P
li a
L.= i a<P ·
El operador que representa el cuadrado del total de la cantidad de movimiento
angular se puede obtener a partir de (4.15-3 5) como
2
2
2
2
L = Lx + L, +L.= -li
2[
a(
a) + sen1 Oa<joJ
1
sen OoO sen() ao
2
2
]
2 •
(4.15-36)
A continuación se examinará lo que sucede cuando este operador opera sobre
las funciones de onda 1/lnlm del átomo de hidrógeno, según lo indica (4.15-30). Se
encuentra que
(4.15-37)
Sin embargo, el operador L 2 es independiente de r y opera sobre la función
de onda producto (4.15-30) en tal forma que (4.15-37) se puede escribir como sigue
(4.15-38)
Si a esta expresión se aplican sucesivamente las relaciones (4.15-6), ( 4.15-11) y
(4.15-12), es evidente que
(4.15-39)
Esta ecuación demuestra que el operador L 2 es tal que tiene la propiedad
especial dada por (4.14-24) con respecto a las funciones de onda 1/lnlm· En consecuencia, de acuerdo con (4.14-27) y (4.14-25), la variable dinámica asociada con el
operador debe ser una constante del movimiento y su valor esperado es h2 l(l + 1).
Así pues, se conserva el cuadrado de la cantidad del movimiento angular, por lo que
la propia cantidad de movimiento angular debe conservarse, y el valor esperado de la
cantidad de movimiento angular debe ser
(L) =
J (L = lijl(l + t).
2)
(4.15-40)
140 Mecánica cuántica. Generalidades
En forma similar, se puede demostrar que la componente z de la cantidad de
movimiento angular se conserva también. En este caso, a partir de (4.15-35) y
(4.15-30), se tiene que
li a
li
a<I>m
Lzt/Jnlm = ¡ oc/J R",(r)E>,m(O)<I>m(cP) = ¡ R",(r)E>,m(O) oc/J •
(4.15-41)
Sin embargo, ocfJm/ocp = imeím<P = imcfJm(C/J), de donde (4.15-41) se convierte
en
(4.15-42)
En consecuencia, el operador Lz tiene también la propiedad especial (4.14·24)
y, por ende, Lz es una constante del movimiento cuyo valor esperado debe ser
(4.15-43)
Se conserva tanto el total de la cantidad de movimiento angular como su
componente a lo largo del eje polar (cuya dirección, como ya se vio antes, se puede
escoger de un modo arbitrario). El número cuántico /, que especifica el total de la
cantidad de movimiento angular orbital, se denomina a veces número cuántico orbital. El número cuántico m, que especifica la componente z del momento angular,
se llama a veces número cuántico magnético, ya que la degeneración de los estados
que tienen los mismos valores de n y /, pero distintos para m, se pueden eliminar
aplicando un campo magnético.
Las orie'ltaciones posibles del vector de cantidad de movimiento angular L con
las restricciones impuestas por las condiciones cuánticas ( 4.15-40) y (4.15-43), se
ilustran en la figura 4.25 para los estados en los que l = O, 1 y 2. El vector L debe
tener, al mismo tiempo, una longitud total dada por (4.15-40) y una proyección a
lo largo del eje z establecida por ( 4.15-43). Esto da como resultado un grupo
discreto de orientaciones posibles para el vector, como se indica en los diagramas. Es
evidente que estos diagramas pueden generalizarse para aplicarlos a sistemas que
tienen valores más altos de /. También se debe aclarar que, si se aplica un campo
magnético constante a lo largo del eje z, el momento magnético del electrón dentro
de su órbita (que es proporcional al total de la cantidad de movimiento angular
L,="Íi
f¡
Figura 4.25.
1=0
/= 1
/=2
L=O
L="Íiff
L,=O, ± "Íi
L="Íi {6
L,=O,±"Íi ±2"Íi
Posibles orientaciones para el vector de cantidad de movimiento angular bajo las
restricciones impuestas por (4.15-40) y (4.15-43) para l =O, 1 y 2.
El espín electrónico
141
orbital) tendrá una interacción con el campo aplicado, de modo que el átomo
experimentará una fuerza que trata de alinear al vector del momento magnético (y,
por ende, el vector de su cantidad de movimiento angular orbital) con el campo
aplicado. Por consiguiente, los estados cuyo valor de m permite una alineación par.:ial o completa, deben tener una energía más baja que los que corresponden a
orientaciones casi antiparalelas. Los estados cuánticos que tienen dife¡entes valores de
m, los cuales se degeneran en ausencia de un campo magnético, al aplicarles dicho
~po se dividirán en m niveles separados aunque muy proximos uno del otro. Este
fenómeno se conoce con el nombre de efecto de Zeeman.
Estos resultados sirven para explicar adecuadamente las propiedades eléctricas,
magnéticas y espectroscópicas observadas en el átomo del hidrógeno. En principio,
los átomos de estructura más compleja se pueden manejar con los mismos métodos;
por otra parte, puesto que estos átomos representan sistemas de tres o más cuerpos,
no se pueden obtener soluciones analíticas de forma cerrada, debido a lo cual es
necesario recurrir a la teoría de perturbaciones. Un método de esta índole se basa
en la técnica de dividir el operador hamiltoniano del sistema en una parte principal
.:uya solución se conoce o se puede obtener analíticamente, y una parte más pequeña que contiene todos los términos que pueden originar dificultades analíticas. O,
por lo menos la mayoría de ellos. Entonces, se supone que la solución tiene la
forma de una combinación lineal de funciones propias de la primera parte del hamiltoniano y las constantes relacionadas con la combinación lineal se determinan de
tal modo que la función de onda sea una función propia aproximada del hamiltoniano completo. Aunque estos métodos son muy útiles para resolver una gran
,·ariedad de problemas prácticos, no se analizarán aquí con más detalle. 16
4.16
EL ESPIN ELECTRONICO, EL PRINCIPIO DE EXCLUSION
DE PAULI Y EL SISTEMA PERIODICO
En el cálculo de las funciones de onda y los niveles de energía de átomos con
muchos electrones (He, Be, Li, etc.,) que se hace desde el punto de vista de la mecánica cuántica, generalmente se supone que cada electrón se mueve dentro de un
potencial esféricamente simétrico, debido al núcleo y a una distribución espacial
promedio de todos los demás electrones. En esta aproximación, la función de onda
total del sistema se puede expresar como un producto de funciones de onda de un
solo electrón. La función del potencial de cada electrón es esféricamente simétrica y
la parte angular de las funciones ondulatorias de un solo electrón se pueden seguir
expresando de acuerdo con los armónicos esféricos (4.15-17). No obstante, la porción radial de estas funciones de onda es más compleja que en el caso del átomo de
hidrógeno. Debido a que las funciones de onda de un solo electrón pueden dividirse
en sus partes radiales y angulares, cada electrón se puede considerar como representado por tres números cuánticos n, m y l, al igual que en el 1-tidrógeno. Sin
embargo, puesto que la función radial de onda no tiene ya la forma (4.15-19),
correspondiente a un simple potencial de Coulomb, los estados que tienen el mismo
valor de n, pero un valor diferente de l, ya no están degenerados y la energía total
del electrón depende del número cuán tic o orbital l así como de n.
En vista de estas observaciones, los niveles de energía de átomos complejos se
pueden calcular y ya se pueden hacer predicciones acerca de los espectros de dichos
16 Para obtener un estudio completo de este tema véase, por ejemplo, C. W. Sherwin, op.
cit., capítulos 7-10 o bien, E. Merzbacher, op. cit., capítulos 16-20.
142
Mecánica cuántica. Generalidades
átomos. No obstante, estas predicciones no concuerdan por completo con la experiencia, a menos que se efectúen dos correccciones adicionales.
La primera de éstas es la hipótesis del espín electrónico, que fue introducida
por Goudsmit y Uhlenbeck en 1925, según la cual, cada electrón, además de la
cantidad de movimiento angular orbital que tenga, debe poseer una cantidad de
movimiento angular intrínseco o cantidad de movimiento angular de espín, de magnitud L 8 = -!-h..J3, cuya componente a lo largo de cualquier eje de campo dado
puede tener dos valores posibles hm8 = ± h/2. En consecuencia, el electrón puede
existir en dos "estados de espín" correspondientes a dos valores posibles de m8 •
Estos dos estados de espín se mencionan con frecuencia como estados de "espín
ascendente" y "espín descendente". Se puede considerar que el electrón tienen un
número cuántico de cantidad de movimiento angular total del espín s, que sólo
puede tener un valor de 1/2, en cuyo caso, análogamente a lo que establece
(4.15-40), la cantidad de movimiento angular del espín es
(L.) =
nJ s(s + 1) = nJ3¡2,
(4.16-1)
y un número cuántico m8 que representa la componente z de la cantidad de movimiento angular del espín que puede tener los valores ± 1/2, análogamente a
(4.15-43), la componente z de dicha cantidad de movimiento es
(L•• ) = m.ñ = ± ñ/2.
(4.16-2)
Así pues, la degeneración de todos los estados electrónicos que se producen
en el hidrógeno y en átomos más complejos, se duplica debido a que haya dos
estados del espín del electrón. La cantidad de movimiento angular intrínseca del
electrón es una consecuencia de la relatividad y se obtuvo de los primeros principios
cuando se formuló la ecuación de onda del modo covariante relativísticamente, como
lo demostró Dirac en 1928. La incorporación del espín electrónico al formalismo de
la mecánica ondulatoria en realidad no constituye ninguna suposición nueva en esta
rama de la física.
El otro factor que se debe introducir en la explicación del comportamiento de
sistemas de muchas partículas, de acuerdo con la mecánica ondulatoria, es el principio de exclusión de Pauli, que establece que en un sistema dado (que puede ser un
átomo, una molécula o todo un cristal compuesto de muchos átomos interactuantes),
no hay dos electrones que puedan ocupar el mismo estado cuántico, considerándose
los estados de espín opuestos como si fueran estados diferentes. Aplicándolo a un
átomo complejo, el principio significa que no puede haber dos electrones en el
átomo que posean los mismos números cuánticos, n, l, m y m8 • Para otros sistemas,
esto significa que no puede haber más de g electrones que ocupen un nivel energético que se haya degenerado g veces. Aunque los electrones obedecen al principio de
Pauli, hay otras partículas tales como los fotones, que no lo hacen. En general, las partículas tales como los electrones cuyo espín es múltiplo de (s = f, f, f, • • • ) obedecen
al principio de Pauli, en tanto que otros, como los fotones cuyo espín intrínseco es
entero (s =O, 1, 2 • • • ), no lo obedecen. Este hecho origina diferencias muy importantes en el comportamiento estadístico de los grupos de electrones y fotones, lo cual
se verá en el siguiente capítulo.
La adición del espín electrónico y ta principio de Pauli al planteamiento de la
mecánica ondulatoria de átomos de muchos electrones, ayudó a explicar el sistema
periódico de los elementos basándose en la ocupación sucesiva de los estados electrónicos de los átomos. Este enfoque se ilustra en la tabla 4.2, en donde se indica la
configuración electrónica de cada átomo.
El espín electrónico
143
TABLA 4.2.
Configuraciones electrónicas y el sistema periódico
1s
2s
H
He
Li
Be
B
e
N
o
F
Ne
3s
3p
S
Cl
A
1s 2 )2s 2 2p 6)3s
1s 2 )2s 2 2p 6)3s 2
1s2)2s 2 2p 6)3s 23p
1s2)2s22p6)Js2Jp2
1s2)2s22p6)Js2Jp3
1s2)2s22p6)Js2Jp4
1s2)2s22p 6)3s2 3ps
1s2)2s22p6)Js2Jp6)
K
Ca
Se
Ti
V
Cr
Mn
Fe
Co
Ni
Cu
Zn
Ga
Ge
As
Se
Br
Kr
1s 2 )2s 22p 6)3s 23p 6)4s
1s 2)2s 22p 6 )3s 23p 6 )4s 2
1s 2)2s 22p 6 )3s 23p 6 3d)4s 2
1s 2 )2s 2 2p 6 )3s 2 3p 6~d 2 )4s 2
1s2)2s22p6)Js2Jp6Jd3)4s2
1s2)2s22p6)Js2Jp63ds)4s
1s2)2s22p6)Js2Jp63ds)4s2
ls 2)2s 22p 6)3s 23p 63d6)4s 2
1s 2)2s 22p 6)3s 23p 63d 7 )4s 2
1s2)2s22p6)Js2Jp6JdB)4s2
ls2)2s22p6)Js>Jp6Jdlo)4s
1s2)2s22p6)Js2Jp6Jdlo)4s2
ls 2)2s 22p 6)3s 23p 63d 10)4s 24p
1s2)2s22p6)Js2Jp6Jdlo)4s24p2
ls2)2s22p6)Js2Jp6Jdlo)4s24pJ
ls 2)2s 22p 6)3s 23p 63d 10)4s 24p 4
ls2)2s,2p6)Js2Jp6Jdlo)4s24ps
ls 2)2s 22p 6)3s 23p 63d 10)4s 24p 6) ... etc.
Na
Mg
Al
Si
p
4s
3d
4p
ls
1s 2 )
1s 2 )2s
1s 2 )2s 2
1s 2 )2s 2 2p
1s,)2s,2p>
1s 2 )2s 2 2p 3
1s,)2s,2p4
1s2 )2s 2 2p 5
1s2 )2s 2 2p 6)
Según la representación de esta tabla, el átomo más simple, H, tiene un solo
electrón, que en la configuración de energía más baja del sistema, debe encontrarse
en un estado ls. El siguiente átomo, He, con dos electrones, puede tener dos
electrones ls con espins opuestos en la configuración de energía más baja (o estado
fundamental o basal). Esta configuración se denota con ls 2 Puesto que sólo hay
dos estados relacionados con el nivel n = 1, 1 = O, el siguiente átomo más complejo,
144 Mecánica cuántica. Generalidades
Li, debe tener, de acuerdo con el principio de Pauli, la configuración de estado basal
ls 2 )2s, con lo cual se indica que el tercer electrón pasa al siguiente estado energético más bajo, o sea, 2s. El cuarto elemento, Be, tiene dos electrones 2s más; pero
puesto que sólo existen dos estados 2s, el principio de Pauli requiere que el quinto
elemento, B, tenga un electrón en el nivel 2p, que es el más bajo en energía,
excepción hecha de ls y 2s; así pues, B tiene la configuración de estado basal
ls 2 )2s 2 2p. Existen seis estados 2p posibles que corresponden a los números cuánticos n = 2, l = 1, m = O ± 1 y m 9 = ± 1/2. Los cinco elementos siguientes, C, N, O, F y
Ne tienen un electrón 2p adicional para llenar el nivel 2p. La capa 2p llena es esféricamente simétrica y muy estable, como sucede en la capa ls llena, y los elementos Ne y
He, que tienen estas configuraciones, son gases inertes. Los elementos subsecuentes llenan, entonces, las capas 3s y 3p, como se indica en la tabla, y terminan con otro gas
inerte, A, que tiene una capa 3p llena con 6 electrones. Los elementos que tienen arreglos similares de los electrones externos o de valencia en los grupos n = 2 y n = 3,
poseen propiedades químicas similares.
Cuando se llena el nivel 3p, los dos elementos siguientes agregan electrones en
los estados 4s y no en los niveles 3d, como podría esperarse. Esto se debe simplemente, a que el estado 4s tiene una energía más baja que el estado 3d. Luego viene
una serie de 8 ''elementos de transición" que tienen una capa interna 3d incompleta.
Cuando este nivel 3d se llena por fin, se sigue llenando la capa 4p concluyendo con
otro gas inerte, Kr. El resto de la tabla se puede elaborar siguiendo, por lo general
los mismos lineamientos. En todos los casos, la estructura de la capa externa de
elementos químicamente relacionados, tales como Li, Na, K, Rb, y Cs es idéntica.
Por tanto, es evidente que la teoría cuántica explica satisfactoriamente no sólo la
estructura de los niveles energéticos observados espectroscópicamente, en el caso de
los átomos complejos, sino que también explica la disposición de los átomos en el
sistema periódico y la regularidad con que se distribuyen en dicha tabla las propiedades químicas de los elementos.
EJERCICIOS
l. Demuestre que el valor esperado de la energía es igual a la constante de separación é,
para un sistema que tiene funciones de onda dependientes del tiempo, de la forma (4.8-8).
Demuestre que el valor esperado del operador hamlltoniano, tomado sobre la función de onda
independiente del tiempo es igual a é para este tipo de sistema.
2. Demuestre que si z 1 y z 2 son dos números complejos cualesquiera, entonces (z 1 z 2 )* =
zjz~; demuestre que el conjugado complejo de una cantidad compleja expresado en forma polar
feifJ (f. 8 real) es {*e-ifJ.
3. Para la partícula libre de la sección 4.9, la velocidad de fase, de acuerdo con (4.9-5) es
w/k =f'k/2m =p/2m. Sin embargo, desde el punto de vista clásico, la velocidad de una partícula
libre es p/m. Explique por qué discrepan en un factor de 2.
4. Verifique directamente que la función de onda (4.9-11) correspondiente a una partícula
libre, satisface la ecuación de Schrodinger (4.7-3) cuando V= O.
5. Verifique la ecuación (4.9-18) expresando la función (4.9-17) como un integral de
Fourier con la ayuda de (4.9-16).
6. Encuentre (x)n, {px)n, {pi>n para el nésimo estado propio del pozo de potencial infinitamente profundo de la sección 4.10, y demue~tre explícitamente que En= {p~)n/2m, para las
partícula libre.
7. ¿Cuál es la razón de las amplitudes que tienen las funciones propias del continuo del
pozo de potencial finito de la sección 4.11, en la región (-a <x <a), a la amplitud que hay en
las regiones (x <-a, x >a)?
8. De acuerdo con la definición (4.12-29), demuestre 4ue dHn(~/d~ = 2nHn-i (~). Nota:
observe que dn(xf(x))/dxn =X dnffdxn + ndn-i {/dxn-i.
9. A partir de (4.12-29), corrobore que Hn+i(~=2~n(~)- 2nHn_¡(~).
10. De acuerdo con los re~ultados de los problemas 8 y 9, demuestre que las funciones
Hn(~) satisfacen la ecuación de Hermite (4.12-16).
El espín electrónico
145
11. Encuentre el valor esperado de la energía potencial <v>n para el nésimo estado propio
de un oscilador armónico cuántico unidimensional: Nota: use las propiedades de ortogonalidad
de las funciones de onda.
12. Determine el valor esperado de la energía cinética <K>n correspondiente al nésimo
estado propio de un oscilador armónico cuántico unidimensional y utilice el resultado del problema 11 para demostrar que (V)n +<K>n = hvo<n +-!), lo cual concuerda con lo que se puede
mtuir.
13. Mediante la evaluación de la desviación estándar, demuestre que la cantidad de movi::~iento de una partícula libre es una constante del movimiento.
14. En relación con los estados propios del átomo de hidrógeno, demuestre que la probabi.Jdad de encontrar al electrón dentro de una capa esférica de espesor dr y radio r es r2R~ 1 (r).
Suponga que los armónicos esféricos Y¡m(O, cp) están normalizados.
15. Demuestre directamente que la fórmula de la desviación estándar indica a= O para los
vperadores L2 y Lz para el átomo de hidrógeno.
16. Obtenga las expresiones (4.15-36) para L2, a partir de las expresiones (4.15·35) para
Lx,Ly y Lz.
17. Utilice los métodos de la sección 4.15 y demuestre que si (€") se puede evaluar como
·JI'") usando las ecuaciones de onda independientes del tiempo, entonces, (en+t) se puede
:epresentar como (Jt'•+t) usando estas mismas funciones. Indique en forma inductiva la manera
<!n que esto significa que {f(e)) se puede obtener a partir de (/(Jt')) empleando las funciones de
·Jnda independientes del tiempo, en donde /(€) es una función de € que se puede representar
.:omo una serie de potencias convergente.
LECTURAS RECOMENDADAS
D. Bohm, Quantum Mechanics, Prentice-Hall, Inc., Englewood Cliffs, N.J. (1951).
E. Ikenberry, Quantum Mechanics for Mathematicians and Physicists, Oxford University Press,
Nueva York (1962).
R. B. Leighton, Principies of Modern Physics, McGraw-Hill Book Co., lnc., Nueva York (1959).
E. Merzbacher, Quantum Mechanics, John Wiley & Sons, Inc., Nueva York (1961).
L. Pauling y E. B. Wilson, Introduction to Quantum Mechanics, McGraw-Hill Book Co., lnc.,
Nueva York (1935).
J. L. Powell y B. Craseman, Quantum Mechanics, Addison-Wesley Publishing Company, Inc., Reading, Mass. (1961).
C. W. Sherwm, lntroduction to Quantum Mechanics, Holt, Rinehart and Winston, Inc., Nueva
York (1959).
J. C. Slater, Quantum Theory of Matter, McGraw-Hill Book Co., Inc., Nueva York (1951).
CAPITULO
5
Mecánica estadística.
Generalidades
5.1
INTRODUCCION
El objetivo de la mecamca estadística es analizar el comportamiento de un
gran conjunto de partículas o sistemas idénticos, en una forma estadística o probabilística, derivando los valores más probables de las propiedades del conjunto sin
inquirir en detalle los valores de estas propiedades para una partícula dada en un
momento determinado.
Este estudio se limitará a un conjunto de sistemas idénticos que se supondrán
independientes unos de otros, excepto que pueden actuar entre sí o con el medio
ambiente externo, sólo a través de procesos instantáneos que conservan la energía y
la cantidad de movimiento. Por ejemplo, estos sistemas podrían ser las partículas de
un gas monoatómico ideal de partículas libres que pueden interactuar unas con otras
o con el medio circundante, interviniendo en colisiones instantáneas, o bien podrían
representar sistemas de otros tipos. Los campos de fuerza externos (eléctrico, magnético o gravitacional, etc.,) también pueden ejercer su influencia en estos sistemas. En
tales circunstancias, se puede tratar a ::ada sistema de un modo independiente de los
demás, y se puede describir el comportamiento de cualquier sistema de acuerdo con
sus coordenadas en un espacio de fase sesquidimensional cuyas coordenadas son
(x, y, z, Px, Py. Pz). Se supone que estas coordenadas son independientes y ortogonales, y la especificación completa del estado de movimiento de cualquier partícula
perteneciente al conjunto se expresa asignando valores a estas seis coordenadas espaciales; entonces, su comportamiento subsecuente se puede describir, en principio,
basándose en estos conocimientos.
El postulado básico de la mecánica estadística es que la probabilidad a priori
de que un sistema esté en cualquier estado cuántico dado, es la misma para todos
los estados cuánticos del sistema. Esto significa, por ejemplo, que la probabilidad a
priori de que una partícula libre se encuentre dentro de una región (Ax, Áy, &)
alrededor de (x, y, z) es la misma para todos los valores de x, y, z, y la probabilidad de que su cantidad de movimiento esté comprendida dentro de una región
(¡jpx, ¡jpy, ¡jpz) alrededor de (px,Py.Pz) es idéntica para todos los valores de
(px, Py, Pz). Se debe subrayar el hecho de que este postulado se refiere sólo a las
probabilidades a priori, es decir, a las probabilidades que prevalecen en ausencia de
cualquier restricción dinámica. Las probabilidades a priori en cualquier conjunto de
sistemas se modifica casi siempre mediante restricciones externas impuestas al sistema, tales como requisitos de que el número total y la energía total de todos los
sistemas que pertenecen al conjunto se mantengan constantes.
147
148 Mecánico estadística. Generalidades
Primero se tratarán las partículas pertenecientes al conjunto, como si fueran las
clásicas "bolas de billar," considerando que se pueden distinguir unas de otras y
suprimiendo que un número cualquiera de ellas puede encontrarse en un solo estado
cuántico. Después de esto se investigará el efecto que tiene el principio de exclusión
de Pauli y cuál es el efecto de la imposibilidad de identificación de las partículas
elementales que se están estudiando. Se recurrirá con mucha frecuencia a los resultados del capítulo anterior e, incluso, en el caso del planteamiento estadístico de las
partículas clásicas, se utilizará el marco cuántico de los niveles energéticos y los
estados cuánticos, aunque no sea absolutamente necesario hacerlo, con el fin de
conservar la misma consistencia y uniformidad.
5.2
LA FUNCION DE DISTRIBUCION Y LA DENSIDAD
DE LOS ESTADOS
Para calcular las propiedades promedio de un conjunto de partículas, por lo
general se necesita conocer la forma en que dichas partículas están distribuidas, en
promedio, en lo que respecta a la energía. Si el número promedio de partículas del
sistema que ocupa un solo estado cuántico de energía e se designa como f(e) y si se
hace que g(e)de sea el número de estados cuánticos del sistema, cuya energía está
dentro de un rango de alrededor de e, entonces, el número de partículas del sistema
cuya energía está dentro del rango de alrededor de e está dado por N(e)de, en
donde
N( e) de = f(e)g(e) de.
(5.2-1)
La cantidad f(e), como se definió antes, se denomina función de distribución
del sistema, y depende de las probabilidades relacionadas con la distribución de las
partículas del sistema entre los estados cuánticos disponibles. La cantidad g(e), que
depende sólo de la forma en que los estados cuánticos mismos están situados en lo
que respecta a la energía, se llama densidad de los estados.
Si se conocen estas dos cantidades, el valor promedio de cualquier cantidad a
que se puede expresar como una función de la energía total e, se puede evaluar
como
f
f
~f
rx(e)N(a) de
<!X> = " - - - : o - - - N(e) de
=
rx(e)f(e)g(e) de,
(5.2-2)
la integral de N(e)de tomada sobre todos los valores posibles de e da simplemente
N, que es el número total de partículas del sistema. Si la cantidad a es una función
de las coordenadas del sistema q¡( = x,y,z, para i = 1, 2, 3, respectivamente) y las
cantidades de movimiento p¡( = Px• Py. Pz, en la misma forma) que no se puede expresar como una función exclusiva de la energía total e, entonces e se puede expresar como
La función de distribución y la densidad de los estados
149
una función de las coordenadas y las cantidades de movimiento, como la suma de las
energías cinética y potencial,
1 "
, + V(q¡),
¡¡ = -2 L. p¡
m¡
(5.2-3)
y el valor promedio de ex evaluado como una integral sobre las coordenadas del
espacio de fase como
JI
(a.)=
a.(p¡.q¡}f(p¡,q¡) dp dq
.
(5.2-4)
JJJ(p¡,q¡} dp dq
En este caso, f(p¡, q¡) representa la función de distribución .f(E) en donde E se
expresa en función de p¡ y q¡ por m~dio de (5.2-3), y las cantidades dp y dq
representan los elementos de volumen en el espacio de cantidades de movimiento y
en el espacio de coordenadas expresadas en cualquier forma (cartesianas, cilíndricas,
esféricas, etc.) que pueda ser conveniente para la integración. La ecuación (5.2-4) no
contiene ningún factor de densidad de estados g{p¡, q¡) debido a que, como se verá
en breve, en sistemas del tipo que se está estudiando, la densidad de los estados
cuánticos en el espacio de fase es constante y se cancelan en el numerador y el
denominador de (5.2-4). Las expresiones (5.2-2) o (5.2-4) se mencionarán con frecuencia cuando se calculen los promedios.
Puesto que el factor de densidad de estados g( E), según se define en relación
con (5.2-1), depende sólo de la dtstribución de los estados cuánticos del sistema en
cuanto a la energía, debe existir la posibilidad de calcular g{E) a partir de la solución de la ecuación de Schrodinger. Esto se puede hacer en relación con las partículas libres tal y como se definieron en la sección 5.1, suponiendo que el sistema está
confinado en el interior de un recipiente rígido cuyas dimensiones son x 0 ,y 0 ,z 0 en
las direcciones x-, y- y z-, respectivamente. En efecto, este recipiente es un pozo de
potencial infinitamente profundo para las partículas que se encuentran en su interior,
siendo el potencial igual a cero para cada partícula que se encuentra dentro del
recipiente, a condición de que las interacciones de las partículas estén restringidas a
colisiones instantáneas. En este caso, dentro del recipiente, la ecuación de Schrodinger se puede escribir de acuerdo con ( 4.8-5) como sigue
(5.2-5)
en donde
(5.2-6)
De acuerdo con los resultados dados en las secciones 4.10 y 4.11, se puede
llegar a la conclusión de que 1/1 =O, fuera del recipiente. De acuerdo con (4.9-3), se
puede esperar que una solución válida para (5.2-5) sería una onda plana de la forma
(5.2-7)
Se puede verificar con facilidad que, en efecto, esta solución satisface lo establecido en (5.2-5). En realidad, la ecuación (5.2-7) se puede obtener como una
solución de (5.2-5) mediante la técnica de separación de variables que se usó con el
lSO Mecánict1 estadística. Generalidades
átomo de hidrógeno, suponiendo inicialmente una solución de producto de la forma
t/1 = X(x) Y(y) Z(z). Sin embargo, para que (5.2-7) sea una solución de (5.2-5), las
cantidades kx, ky y kz de (5.2-7) se deben relacionar en tal forma que
(5.2-8)
y, en este caso, se puede considerar que estas cantidades se comportan como las
componentes de un vector k que se conoce como vector de propagación. Si se
estudia el carácter físico de la función de onda dependiente del tiempo que se
relaciona con (5.2-7) por medio de (4.8-7),
'P(x,y,z,t) = Aei(k·r-wr)
(5.2-9)
(w = efh),
debe ser evidente que la dirección de k es la misma que aquella en la que avanza el
frente de la onda. La explicación física real de esto quedará asignada como tarea
para el lector. Utilizando los métodos desarrollados en el último capítulo, se puede
demostrar que el valor esperado de la cantidad de movimiento vectorial p está dado
por
(p) = hk,
(5.2-10)
y que p (y, por tanto, k) es una constante del movimiento.
Para las condiciones de frontera, se requerirá que la función de onda en cualquiera de las caras del recipiente sea igual a la de la cara opuesta. Estas condiciones
de frontera periódicas o cíclicas se vieron con anterioridad en relación con las vibraciones de red (sección 3.3). En una geometría unidimensional, estas condiciones de
frontera representan un sistema que equivale topológicamente a un anillo. En tres
dimensiones, las condiciones periódicas de frontera dividen todo el espacio en regiones exactamente similares cuyas dimensiones son (x 0 , y 0 , z 0 ), siendo la función de
onda la misma en cada una de ellas, y cualquiera de estas regiones se puede usar
para representar el interior del pozo de potencial correspondiente al recipiente. Procediendo de esta manera y suponiendo que los bordes del recipiente se extienden a
lo largo del eje x desde O hasta Xo, a lo largo de la dirección y, de O a y 0 y en la
dirección z, de O a z 0 , las condiciones de frontera se convierten en
tf¡(O,y,-z) = tf¡(x 0 ,y,z)
t/l(x,O,z) = tf¡(x,y 0 ,z)
(5.2-11)
tf¡(x,y,O) = tf¡(x,y,z 0 ),
lo cual requiere que en (5.2-7) se tome
(nx = 0,± 1,±2, ···)
(ny = 0,± 1,±2, ···)
(nz = 0,± 1,±2. ··· ),
(5.2-12)
La función de distribución y la densidad de los estados
151
y luego, (5.2-7) se reduce a
1/l(x,y,z) = Ae
lni(nxx + nll'y + ~)
xo
Jlo
zo •
(5.2-13)
De acuerdo con (5.2-2) y (5.2-6), esto significa que sólo es permisible un
grupo discreto de valores de energía dados por
(5.2-14)
De acuerdo con (5.2-10), los valores permisibles de (kx, ky, kz) se pueden expresar
como los valores permisibles de (px,Py,Pz) en la forma
Py = hny/Yo
(5.2-15)
Si se graficaran todos los valores permisibles de la cantidad de movimiento,
haciéndolos corresponder a todos los valores enteros posibles de (nx, ny, nz) en
(5.2-15), como puntos en un espacio ortogonal de cantidad de movimiento cuyas
coordenadas son (px, Py, Pz ), se obtendría una red ortogonal simple de los puntos,•
que representan los valores permisibles de la cantidad de movimiento, en donde las
dimensiones de la célula unitaria (h/x 0 , h/y 0 , h/z 0 ) corresponden a los cambios unitarios en (nx, ny, nz) en (5.2-15). El volumen del espacio de cantidad de movimiento
correspondiente a un solo estado cuántico del sistema es, simplemente, el volumen
de la celda unitaria
(5.2-16)
en donde V es el volumen físico del recipiente. De acuerdo con esto (y con la
gráfica de los puntos que representan las cantidades de movimiento permisibles), se
observa que la densidad con la que están distribuidos los estados cuánticos permisibles en el espacio de cantidad de movimiento, es uniforme sobre todo el espacio,
[lo cual se mencionó anteriormente en relación con las ecuaciones (5.7-4)]. En
(5.2-16), no se tomó en cuenta el espín; para partículas con espín de l/2, como los
electrones, existen dos estados permisibles de cantidad de movimiento por cada punto reticular dentro del espacio de cantidad de movimiento correspondientes a las dos
orientaciones posibles de espín de la partícula. Si se toma esto t'n cuenta, (5.2-16)
debe escribirse en la forma
(5.2-17)
Para valores grandes de x 0 ,y 0 y z 0 , tales como los que se relacionan con un
recipiente de dimensiones macroscópicas, el volumen VP de (5.2-17) se hace muy
pequeño y los estados de cantidad de movimiento (5.2-15) y los estados de energía
(5.2-14) se concentran excesivamente en comparación con los intervalos de energía y
cantidad de movimiento que se pueden apreciar macroscópicamente. Entonces, para
un sistema de dimensiones razonables, estará justificado el considerar que los valores
permisibles de energía y cantidad de movimiento están distribuidos t'n una forma
substancialmente continua dentro del espacio de cantidad de movimiento.
152 Mecánica estadística. Generalidades
Ahora se verá una superficie dentro del espacio de cantidad de movimiento
(px, p , Pz), estando todos estos puntos a una energía constante e. De acuerdo con
(5.2-6), (5.2-8)__rj_5.2-10), la ecuación de esta superficie debe ser la de una esfera
de radio p = ..j2me, o bien,
P2 = Px2 + Py2 + Pz2 = 2 me.
(5.2-18)
Esta superficie aparece ilustrada en la figura 5.1. En esta misma figura se
muestra una esfera similar cuya superficie representa todos los puntos de energía e + de.
La capa esférica entre estas dos esferas representa la región del espacio de cantidad de
movimiento correspondiente a las energías comprendidas en el rango de e a e +de. El
volumen del espacio de cantidad de movimiento contenido dentro de. esta capa es
dVP = 4n:p 2 dp.
(5.2-19)
Sin embargo, de acuerdo con (5.2-18),
p dp =m de,
(5.2-20)
dVP = 4n:p ·m de= 4n:mjlme de.
(5.2-21)
por lo cual,
El número de estados cuánticos que se pueden encontrar en este volumen del
espacio de cantidad de movimiento se determina dividiendo este resultado entre el
volumen de tal espacio, relacionado con un solo estado cuántico dado por (5.2-17).
Por definición, el resultado
8 fin:v 3 2
g(e) de = "h 3
m'
J-e de,
(5.2-22)
es el factor de densidad de estados que se menciona en (5.2-1). Por supuesto, este
resultado se refiere sólo a las partículas libres suje~as exclusivamente a interacciones
tales como choques instantáneos. Para otros sistemas, sobre todo aquellos en los que
Cantidad de
movimiento p,
energía •
Cantidad de
movimiento p + dp,
energía • + d•
P,
Figura 5.1.
Superficit>s esféricas correspondientes a energías constantes e y e +de graficadas en
el c<pacio de cantidad de movimiento (px, Py, Pz) de una partícula.
La distribución Maxwe/1-Boltzmann
153
se produ..~.: L'!n3C..-iooes mutuas de largo alcance entre partículas, el factor de
densidad de esudos sería mucho más complejo. Así también, el resultado (5.2-22)
pertenece estrictamente hablando sólo a un recipiente de la forma de un sólido
rectangular. No obstante, puesto que sólo en el resultado fmal aparece el volumen
d~l recipiente, por simple intuición se deduce que se obtendría la misma densidad de
ntados para un recipiente de volumen semejante, independientemente de su forma.
Se puede demostrar que esto es verdad.
5.3
LA DISTRIBUCION MAXWELL-BOLTZMANN
Si no existen restricciones respecto a los valores de energía y cantidad de
movimiento que una partícula del sistema pueda poseer, la probabilidad asociada con
todos los estados cuánticos es la misma y el promedio del número de partículas por
estado cuántico será independiente de la energía. Esto significa que la función de
distribución fte) será constante. Esta simple situación no es muy importante desde el
punto de vista físico, ya que un sistema que está térmicamente aislado del medio
que lo rodea debe obedecer la restricción de que la suma de las energías de todas
las partículas del sistema debe ser constante, y éste es precisamente el tipo de
sistema que se estudiará aquí. En este caso que es más apegado a la realidad se
reduce la proporción de partículas que ocupan estados de energía sumamente altos,
y la función de distribución ya no es constante con respecto a la energía.
Para determinar cuál es la función de distribución en estas condiciones, será
necesario proceder en primer lugar de acuerdo con los lineamientos clásicos, imagi·
nando que las partículas del sistema son objetos identificables tales como las bolas
de billar numeradas. Todo esto se hará dentro del marco de los estados cuánticos y
los niveles de energía, aunque, haciendo caso omiso del principio de exclusión de
Pauli, se permitirá que un número de partículas ocupe un estado cuántico dado del
s1stema. Se supondrá que se trata de un sistema aislado de N partículas distinguibles,
.:on una energía total constante U que se puede distribuir entre n niveles de energía
e1 , e2 , e2 , • • • e¡, • • • En. Desde el punto de vista estadístico, el conjunto tendrá la
distribución de energía que corresponde a una distribución aleatoria de partículas
entre los niveles, y en donde el número de cada nivel está dado por
.V 1 ,N2 ,N3 , · ··N¡,···Nn. De todas las distribuciones fortuitas de N partículas
~ntre n niveles energéticos, algunas ocurrirán con una probabilidad relativamente alta
desde un punto de vista puramente estadístico, y otras serán muy poco probables.
Esta situación es análoga al hecho de lanzar simultáneamente dos monedas en las
que la distribución (1 águila, 1 sol) es más probable que la distribución (2 águila, O
sol) o bien, (O águila, 2 sol). La distribución que tiene la máxima probabilidad de
ocurrir es la distribución de partículas entre niveles que se pueden producir dentro
de un número máximo de formas estadísticamente independientes. En consecuencia,
se supondrá que el estado de equilibrio del sistema corresponde íntimamente a esta
distribución estadística de partículas entre niveles que tienen la máxima probabilidad
en las condiciones del problema.
El cálculo del número de maneras en que las partículas identificables se pueden distribuir entre los niveles energéticos de un sistema, equivale a la determinación
del número de formas en que una cantidad de objetos numerados se puede distribuir
entre un conjunto de recipientes también numerados. Así pues, es necesario estudiar
el problema de determinar la cantidad de formas para distribuir N objetos identificables entre n recipientes, de tal manera que haya N 1 en el primero, N 2 en el
segundo, • • • , N¡ en el iésimo, etc. Este número será proporcional a la probabilidad
154
Mecánica estadística. Generalidades
con la que pueda ocurrir una distribución en donde N 1 , N 2 , • • • , Nn objetos se
encuentran dentro de los recipientes 1, 2, 3, • • • , n.
En primer lugar, se supondrá que se cuenta sólo con dos recipientes en los que
se pueden colocar los objetos, como se ilustra en la figura 5.2. En general, se tendrán
N 1 objetos dentro del recipiente 1 y N 2 en el recipiente 2, con
N 1 + N 2 = N = const.
(5.3-1)
Sea Q(N 1 , N 2 ) el número de formas estadísticamente independientes de llegar a
la distribución (N 1 ,N2 ) de objetos en los recipientes (1, 2). Ahora, Q(O,N2 ) es
evidentemente igual a 1, porque la única forma de lograr esta distribución es poner
todos los N objetos dentro de la segunda caja, como se indica en la figura. De igual
manera, Q(l, N 2 ) =N, ya que para alcanzar esta distribución se puede poner el
objeto 1 dentro del primer recipiente y el resto en el segundo, el objeto 2 dentro
del primer recipiente y el resto en el segundo, y así sucesivamente hasta N objetos.
Existen N formas de seleccionar un objeto para colocarlo dentro del primer recipiente y, por tanto, N maneras de llegar a la distribución deseada. Si se tienen dos
objetos dentro de la primera caja, entonces Q(2,N2 ) =N(N- 1)/2! . Este resultado
se obtiene debido a que hay N formas de escoger el primer objeto que va al primer
recipiente; pero sólo N- 1 maneras de escoger el segundo de los objetos restantes.
Así también, las dos distribuciones en las que el objeto numerado a se escogió como
el primero y el objeto numerado {J como el segundo para colocarlo dentro del
primer recipiente, y en donde {J se escogió como el primero y a como el segundo,
son en realidad idénticos, y los mismos dos objetos acaban por colocarse dentro de
la primera caja; por tanto, el factor N(N- 1) se debe dividir entre dos. Para el caso
en que se tienen tres objetos dentro de la primera caja, existen N formas de escoger
el primero, N- 1 formas de escoger el segundo y N - 2 maneras de escoger el
Nz
Compartimiento Núm.
2
(j)
® ®---0---®
Partículas
Q(O,N2 ) = 1
2
Q(I,N2 )=N
N formas de escoger a
Q( 2 N)=N(N-I)
' 2
21
N-1 formas de escoger (3
(pero las dos distril:iuciones
que aparecen a la izquierda
son la misma)
N formas de escoger a
N-1 formas de escoger p
N-2 formas de escoger 'Y
(pero las 3! distril:iuciones
ilustradas son la misma)
Figura 5.2.
Jo'ormas posibles de distribuir N partículas identificables entre dos recipientes.
La distribución Maxwell-Boltzmann
tercero, en tanto que hay 3!
1SS
formas de permutar entre sí los objetos enumerados
a, (3, y 'Y como si se les hubiera seleccionado en primero, segundo y tercer lugares,
por lo que Q(3, N 2 ) = N(N- 2)/3! . Por supuesto, se puede confirmar con este
procedimiento, entonces, recordando (5.3-I), se puede establecer que
Q(N¡,Nz) =
N(N-1)(N-2)···(N-N 1 +1)
N!
N1!
= N 1 !(N- N 1)!
N!
N 1 !N 2 !
(5.3-2)
Supóngase ahora que el segundo recipiente se divide en dos subcompartimientos que contienen v 1 y v2 objetos en donde, por supuesto,
(5.3-3)
como se ilustra en la figura 5.3. El número de formas independientes que logra la
distribución (v 1 , v 2 ) entre los subcompartimientos de la segunda caja es, de acuerdo
con (5.3-3),
(5.3-4)
Sin embargo, ahora se podría considerar que el sistema tiene tres recipientes
distintos y que el número total de maneras de acomodar los objetos, requerido para
que haya N 1 en el primer recipiente, v 1 en el segundo y v2 en el tercero [que se
denominará Q(N 1 ,v 1 ,v 2 )], será sencillamente el producto de Q(N1 ,N2 ) y Q(v 1 ,v 2 ),
ya que para cada arreglo (N1 , N 2 ), habrá Q(v 1 , v 2 ) maneras de acomodar las par-
IN·
Compartimiento : 1
Figura 5.3.
m
~
2
Subdivisión del segundo recipiente en dos subcompartimientos; de hecho, se puede
considerar que el sistema así obtenido se ha dividido en tres recipientes diferentes.
tículas entre los subcompartimientos y existen Q(N 1 ,N2 ) maneras básicas de llegar a
una distribución (N1 , N 2 ) para los dos recipientes originales. De donde, se encontrará
que
(5.3-5)
A continuación, el trabajo se limita a marcar de nuevo los tres recipientes
como las cajas 1, 2 y 3, y denominar a los objetos dentro de cada una N 1 , N 2 y
N3 en lugar de N 1 , V 1 y v 1 , en cuyo caso (5.3.-5) se puede expresar como sigue
N!
Q(N¡,Nz,N3) =N 1 N 1 N
1.
2.
1
3.
(5.3-6)
156
Mecónica estadística. Generalidades
Una vez más, se puede imaginar que el tercer compartimiento se subdivide
como antes y, utilizando el mismo procedimiento se obtiene una expresión para el
número de acomodos requeridos a fm de distribuir N objetos entre cuatro cajas en
un forma tal que se obtenga una distribución (N 1 , N 2 , N 3 , N 4 ). Mediante la aplica·
ción repetida de este procedimiento el resultado se puede extender indefinidamente
por inducción hasta abarcar el caso en que se tengan n cajas. De acuerdo con
(5.3-3) y (5.3-6), es evidente que se encontrará
(5.3-7)
en donde el símbolo TI indica un producto ampliado, en la misma forma en que el
bien conocido
expresa una suma.
La probabilidad real relacionada con una distrioución dada de N objetos entre
n cajas, es el número de diferentes maneras de acomodar objetos en Q(N 1 , • • • Nn)
cajas, requerido para obtener esta distribución particular, dividido entre el número
total de maneras de acomodar N objetos en n cajas sin tener en cuenta la distribución resultante de objetos entre las cajas. Como se puede demostrar con facilidad,
este último factor es nN. La probabilidad relacionada con una distribución dada es,
entonces, Q(N 1 , • • • Nn)/nN. Sin embargo, se encontrará que es más conveniente
manejar sólo las cantidades Q(N 1 , • • • Nn), que son proporcionales a las probabilidades reales, ya que sólo se tiene el interés de determinar los valores de N 1 , • • • Nn
que le dan un máximo a la probabilidad y, si Q(N 1 , • • • Nn), es un máximo, también lo es la probabilidad asociada.
Ahora se identificará el iésimo recipiente con el iésimo nivel energético del
sistema, y el número de objetos N¡ de dicho recipiente con la cantidad de partículas
pertenecientes a ese nivel. Sin embargo, se debe permitir un margen por si los
niveles energéticos degeneran y se supondrá que hay g¡ estados cuánticos independientes asociados con el iésimo nivel energético, cada uno de los cuales tiene la
misma probabilidad a priori de estar ocupado, de acuerdo con el postulado fundamental de la sección 5.1. Entonces, cada nivel de energía se debe considerar no
como un solo recipiente, sino como un grupo de g¡ recipientes, según se ilustra en la
figura 5.4. Para un nivel energético dado, por ejemplo, el iésimo que contiene N¡
partículas y g¡ estados cuánticos independientes, existen gf'i formas de acomodar las partículas en los estados o recipientes pertenecientes a tal nivel, porque existen g¡ opciones
independientes respecto al lugar en que se puede colocar la primera partícula y para
cada una de éstas, hay g¡ selecciones del sitio donde se puede colocar la segunda, y
¿
Degeneración g; = 4
.:
r-·-'-le.
•• 1 • r--1-
--1--
Nivel
Población N¡
Figura 5.4.
1
4
2
6
.
~···
2
7
---
1
1
•1
• _L
n
2
La subdivisión de los niveles energéticos en diferentes estados cuánticos de acuerdo
con ~u dcgenerac.:ión. Dichos estados desempeñan el mismo papel que los recipientes
del desarrollo e~tadístico, y cada uno tiene el mismo peso estadístico.
La distribución Maxwell-Boltzmann
157
así sucesivamente hasta N¡ factores. Cada uno de estos arreglos constituye una forma
estadísticamente, independiente de distribuir partículas entre los estados cuánticos
del sistema, ya que estos estados cuánticos son de igual probabilidad, y no así los
niveles energéticos. Si el primer nivel de energía e 1 , fuera el único nivel degenerado,
se tendrían i( 1 maneras independientes de establecer una distribución específica de
partículas entre los niveles energéticos, como se indica en (5.3-7), ya que existen
muchas maneras de permutar las partículas entre los distintos estados degenerados
pertenecientes al primer nivel, y por cada uno de éstos queda todavía el mismo
número de maneras de asignar las partículas a los otros niveles del sistema, de tal
modo que se obtenga la distribución (N1 , N 2 , • • • Nn). Si además el segundo nivel
estuviera degenerado, se tendrían
posibilidades por cada una que existió antes,
siendo ahora el número total de formas independientes en que se logra una distribución dada de las partículas entre los niveles, ¡{ 1
veces la que se establece en
( 5 .3-7). Es obvio que cuando se incluye la degeneración de todos los niveles, el
resultado (5.3-7) se deberá multiplicar por 1{ 1 21:3 • • • tf:n, lo cual da
112
112
11
N!
nn g¡N,
º( N¡,N2, ... Nn ) = - n
-TIN¡!i=l
(5.3-8)
i= 1
cuando se incluye la degeneración.
Ahora se supondrá que la distribución real (N 1 , N 2 , • • • N n) de partículas
entre los estados energéticos que se observa en equilibrio, es esencialmente la que se
suele obtener en el número máximo de formas estadísticamente independientes, en
otras palabras, la distribución para la que la cantidad Q de (5.3-8) es un máximo.
Entonces, Q debe maximizarse con respecto a los parámetros N 1 , N 2 , • • • Nn, teniendo en cuenta la~ restricciones
n
L1 N¡ = N = const.
(5.3-9)
i=
y
n
L e¡N¡ = U = const.
(5.3-10)
i= 1
Esta maxnmzacwn se logra con mayor facilidad utilizando la técnica matemá·
tica denominada método de los multiplicadores de Lagrange y se hará un breve
paréntesis para describir este tema. Supóngase que se da una función f(x 1 , x 2 , • • • x n)
de n variables y hay que determinar los valores de x 1 , x 2 , • • • Xn que maximizan
f, a condición de que alguna otra constante dada <P{x 1 , x 2 , • • • xn) permanezca
constante. Para un valor máximo (o mínimo) de f, df =O y si cp permanece constante
dcp = O, de tal manera que si f es un máximo o un mínimo en estas condiciones,
entonces
df + (/. d<f> =o
(5.3-11)
sea cual fuere el valor que el multiplicador arbitrario indeterminado a pueda tener.
~o obstante, (5.3-11) se puede expresar como
158 Mecánica estadística. Generalidades
De acuerdo con esta ecuación, la condición ( 5.3-11) se satisface con toda
seguridad si para cada i
a¡
o</J
OX¡
OX¡
-+IX-=Ü
(5.3-13)
{i = 1,2, ·· · n),
y como además se dio la información inicial de que
(5.3-14)
las ecuaciones {5.3-13) y (5.3-14), tomadas juntas, representan un grupo de n + 1
ecuaciones simultáneas que se pueden resolver para las n cantidades x 1 ,x 2 , • • • Xn
que maximizan (o minimizan) a f y [para el multiplicador indeterminado] a que se
introdujo en (5.3-11).
Si existen dos funciones auxiliares cf>(x 1 , x 2 , • • • Xn) y ¡J¡(x 1 , x 2 , • • • Xn) que
se deben mantener constantes mientras se maximiza la función f, entonces se introducen dos multiplicadores arbitrarios a y {3, y es necesario que
df + IX d</J + f3 dlj¡ =O,
(5.3-15)
que lleva, en .la misma forma, a un conjunto de n + 2 ecuaciones
a¡
o<P
oi/J
OX¡
OX¡
OX¡
(i = 1,2, ·· · n)
-+IX-+/3-=Ü
(5.3-16)
(5.3-17)
(5.3-18)
¡J¡(x 1 ,x 2 , ••• x.) = 1/1 0 = const.
paras las n + 2 incógnitas x 1 , x 2 , • • • x n, a y (3.
A continuación se procederá a aplicar este método con el fin ce encontrar la
distribución N 1 , N 2 , • • • Nn para la que (5.3-8) es un máximo. Para facilitar las
operaciones matemáticas lo que en realidad se maximizará es In Q y no Q propiamente dicha; pero puesto que el logaritmo es una función monotónica de un solo
valor de todas las variables comprendidas, cuando In Q es un máximo, también lo es
Q. Si se toma el logaritmo de los dos lados de (5.3-8), se tiene que
In Q(N 1 ,N 2 , ···N.)= In N!+
n
n
i= 1
i= 1
L N¡ In g¡- L In N;!.
(5.3-19)
Se supondrá que este sistema es tan grande que para cada nivel t:¡! se puede
aproximar, utilizando la aproximación de Stirling según la cual, para x ~ 1,
lnx!:::;;-xlnx-x.
(5.3-20)
Cuando se usa esta aproximación, {5.3-19) se convierte en
In Q = In N! + L N¡ In g¡ - L N; In N¡ + L N;,
i
i
i
(5.3-21)
La distribución Moxwell-Boltz1111lnn
159
que se debe maximizar bajo las restricciones
L N¡= N
(5.3-22)
I/J(N¡,N2, ··· Nn) = L e1N 1 =U.
(5.3-23)
</J(N¡,N2, ··· Nn) =
¡
¡
De acuerdo con (5.3-16), esto requiere que
o(ln Q)
o</J
oi/J
iJNi
oNi
oNi
a [ LN 1 lng 1 - ¿N1 lnN1 + LN1]
- - +1X-+{J-=-
oNi
1
1
1
(j = 1,2, ··· n).
(5.3-24)
Al desarrollar las derivadas de {5.3-24), se observa que los únicos términos de
las sumas cuyas derivadas con respecto a N¡ no sean cero son aquellos para los cuales
i = j; por tanto, ( 5.3-24)se puede reducir a
(j = 1,2, ··· n).
(5.3-25)
Resolviendo para In (N¡/g¡) y desarrollando los exponenciales, esta expresión se
puede escribir en la forma
(5.3-26)
La ecuación ("5.3-26) proporciona el número promedio de partículas por estado
cuántico del sistema y, por ende, representa por definición la función de distribución
de energía f(e). Esta función de distribución particular de energía, que se obtuvo
como {5.3-26) de acuerdo con la suposición clásica de partículas identificables y sin
utilizar el principio de exclusión de Pauli, se conoce como función de distribución
de Maxwe/1-Boltzmann.
Conviene explicar la forma en que las dos constantes a y 13 se relacionan con
las propiedades físicas del sistema. En primer lugar, a la constante 13 se le asignará el
valor
p = -1/kT,
(5.3-27)
en donde T es la temperatura absoluta del sistema y k es una constante denominada
constante de Boltzmann, y se considerará que esta ecuación junto con {5.3-26)
definen lo que se entiende por temperatura. A su debido tiempo se verá que esta
definición conduce a todas las bien conocidas características de temperatura que se
asocian con un gas ideal y, entonces se podrá ver claramente que, antes de definir la
temperatura, ya se podían identificar las propiedades de un gas ideal a partir de
(5.3-26). Después se podría proceder a la identificación de p con el valor dado
arriba, basándose en una comparación de los resultados así obtenidos y la ecuación
termodinámica ya conocida del estado de un gas ideal (a partir de la cual se define
más comúnmente la temperatura). Se demostrará que el valor de k se puede relacionar con la constante medida del gas ideal R y el número de Avogadro.
160 Mecánica estadística.. Generalidades
Si se utiliza el valor de (J dado en (5.3-27), la expresión (5.3-26) ahora se
puede escribir como
N.J = gJ.e"e-• 1/kT.
(5.3-28)
Luego, el valor de la constante a se puede expresar de acuerdo con el número
total de partículas N ya que, de acuerdo con (5.3-9) y (5.3-28),
N= L N¡= e" L g¡e-•JfkT,
j
(5.3-29)
j
por lo cual
e"=
N
(5.3-30)
L g¡e e tkT•
1
j
y
N = g .e"e-•JtkT =
1
Ng .e-•¡tkT
L g¡e • ¡kr
J
•
1
J
(5.3-31)
j
Si los niveles energéticos del sistema están muy próximos unos de otros, como
sucede con los niveles del gas de partículas libres que se vio en la sección anterior,
la cantidad g¡ de (5.3-28) se puede considerar como g(e)de y la cantidad N¡ de la
ecuación se considerará como N(e)de, de acuerdo con lo expuesto en relación con la
ecuación (5.2-1). El número de partículas dentro de un rango energético de alrededor de e dentro de este límite, estará dado, de acuerdo con (5.3-28), por
N(e) de= e"e-•fkTg(e) de= f(e)g(e) de.
(5.3-32)
Para un gas ideal de partículas libres, el factor de densidad de estados g(e) está
dado por (5.2-22). Obsérvese que la forma de (5.3-32) es la misma que la de
(5.2-1), siendo !(e)= e"e-efkT. Una vez más, como se vio en relación con (3.3-31),
se puede evaluar la constante a teniendo en cuenta la condición de que el número
total de partículas dentro del sistema será una constante N, por lo cual
N =
f N(e) de = e" f g(e)e-•fkT de,
(5.3-33)
y
-f
N
e"-~----
(5.3-34)
g(e)e-•fkT de'
en donde las integrales se toman sobre todas las energías disponibles para las partículas del sistema.
Se debe observar que la cantidad Q de (5.3-8) está íntimamente relacionada
con la entropía termodinámica del sistema. En equilibrio, el estado del sistema es tal
que Q. el número de formas estadísticamente independientes de distribuir las par-
La estadístiCil de Maxwell-Boltzmann para un gas ideal
161
f(•l
7j
ura S.S.
Representación esquemática de la función de distribución de energía de MaxwellBoltzmann para tres temperaturas distintas.
ulas entre los estados cuánticos, es un maxtmo como lo es la entropía del sisna Por ahora no se entrará en detalles; pero se puede demostrar 1 que la relación
stente entre estas dos cantidades es
S-= k In Q,
(5.3-35)
donde S es la entropía.
LA ESTADISTICA DE MAXWELL-BOLTZMANN PARA
UN GAS IDEAL
A continuación se analizarán las propiedades de un gas ideal de partículas
es del tipo que se estudió en la sección 4.2. Para este sistema, el factor de
sidad de estado g(€) d€ está dado por (5.2-22), debido a lo cual, de acuerdo con
:-34),
"'-
N
e - 8j2 ¡¡; V m 3!2 f"" Jf.e-c!kT de
h3
(5.4-1)
o
La integración se toma entre los límites cero e infinito, ya que la energía de
partículas es totalmente cinética y, por ende, positiva. La integral de (5.4-l) se
de expresar en una forma más sencilla mediante la substitución
x = efkT,
(5.4-2)
1 J. E. Mayer y M. Goppert-Maycr, Statistical Mechanics, John Wiley & Sons, Nueva York
!.'1), capítulo 4.
162 Mecánica estadística. Generalidades
por lo cual, (5.4-1) se convierte en
(5.4-3)
La integral se puede expresar ahora como una función r-, 2 ya que f(n) se
define como
(5.4-4)
siendo entonces la integral de (5.4-3) igual a f(3/2), que, a su vez, es igual a
Si se inserta este valor en (5.4-3), se tiene que
N ( h2
e"= 2V 2mnkT
)3/2
'
..J1i72.
(5.4-5)
que permite escribir la función de la distribución de Maxwell-Boltzmann para un gas
ideal como
(5.4-6)
Nótese que el valor de e" dado por (5.4-5), es dependiente de la temperatura.
También conviene destacar quue este valor de e" pertenece sólo a la función de
densidad de estados de partículas libres (5.2-22) y que para sistemas que tienen
otras funciones de densidad de estado relacionadas con ellas, el valor de e" será
diferente del que se da en (5.4-5). En la f~ura 5.5 se muestra una gráfica de la
distribución de Boltzmann (5.4-6) para varias temperaturas. De acuerdo con (5.4-6) y
(5.2-22), es obvio que la distribución real de la densidad de partículas con respecto
a la energía está dada por
N(e) de =f(e)g(e) de=
2rrN
r;,.e-•tkT de
( rrk T)312 \/
.
(5.4-7)
La energía interna total y el calor específico del gas se puede obtener fácilmente a partir de estos resultados. Puesto que la energía de las partículas en el
rango de alrededor de e es eN( e) de, la energía interna total del gas es
U= E'"eN(e) de,
(5.4-8)
o bien, utilizando (5.4-7),
(5.4-9)
2 Véa~c.
pm <'Íl"mplo, I. S. y 1·~ S. Sokolnikoff, Hif{her Mathematics for Engineers and
1'/n•sicil'l.\, Md;raw-llill Hook Co., lnc., Nueva York (1941), página~. 273-276.
La estadística de Maxweii-Boltzmann para un gas ideal
163
Esta integral se puede evaluar en términos de las funciones r-, substituyendo
(5.4-2). Al desarrollar la integral de este modo, y observando que r(5/2) =
(3/2)r(3/2) = 3 .Jrr/4, se encuentra
(5.4-10)
U =tNkT,
por lo cual, la energía interna promedio por partícula, U/N, es 3/2kT que es un
resultado importante y muy conocido. La capacidad calorífica del gas a volumen
constante es la razón de aumento de la energía interna con respecto a la temperatura, por lo cual, de acuerdo con (5.4-10),
e (au)
ar =1Nk
=
V
V
,
(5.4-11)
independiente de la temperatura. El calor específico Cv es simplemente la capacidad
calorífica por unidad de volumen.
El objetivo final es derivar la ecuación de estado para un gas de Boltzmann
ideal a partir de las propiedades dinámicas de la partícula y la función de distribución. N:> obstante, antes de llegar a esto, es necesario convertir las distribuciones de
energía (5.4-6) y (5.4-7), en distribuciones de velocidad apropiadas e investigar brevemente cómo se pueden usar estas funciones de distribución de velocidad. En la
tabla 5.1 se proporciona el valor de algunas integrales definidas que se utilizan muy
a menudo cuando se trabaja con las distribuciones de velocidad de Boltzmann.
En un gas de partículas libres que no poseen ningún grado interno de libertad,
toda la energía se basa en la energía cinética de las partículas. Esto se puede
relacionar con la velocidad mediante la expresión
(5.4-12)
de donde
de= mv dv,
(5-4.13)
y la distribución de energía ( 5.4-7), se puede escribir directamente como una distribución de velocidad de la forma
m
N(v) dv = 47tN ( 21tkT
)3/2v2e-mv>f2kT dv.
(5.4-14)
Esta función expresa el número de partículas el sistema cuvas velocidades
quedan dentro de un rango dv alrededor de v, o el número de partículas que quedan
dentro de una capa esférica cuyo espesor es dv y el radio es v, dentro del espacio
de velocidad.
Suponga que ahora se desea conocer cuántas partículas del sistema tienen velocidades tales que la componente x de la velocidad se encuentre dentro de un rango
dvx alrededor Vx, la componente y está en el rango dvy alrededor de vy y la
componente z está dentro de un rango derivada de Vz alrededor de Vz, o sea el
número de partículas que quedan dentro de un elemento rectangular de volumen
(dvxdvydvz) en el espacio de velocidad centrado alrededor del valor (vx, vy, Vz). Este
164 MecániCtJ estadístiCtJ. Generalidades
TABLA 5.1.
Integrales Maxwell-Boltzmann*
=-
4
kT
m
=
~; e~Tr2
=
~e~Tr
= 3~; e~Tr 2
= e~Tr
=--
32
256
=-64
*La segunda columna de la tabla da el valor de la integral definida que aparece en la
primera columna. La tercera columna indica el valor ~ la integral definida cuando a se hace
igual a m/2kT, como casi siempre sucede cuando se trabaja con distribuciones de velocidad de
Boltzmann. La cuarta columna expresa el resultado que aparece en la tercera columna como un
múltiplo de 12 velocidad térmica media e, en donde
e= v8kT/Trm.
número se denominará N(vx, Vy, Vz)dvx dvy dvz. Ahora se procederá con más cuidado, principiando con (5.4-6) que, de acuerdo con (5.4-12), se puede escribir como
N ( h2
!( V V V ) = - - - '"' '' z
2V 2nmkT
)3/2
e-m(v 2 x+v 2 ~+v 2 ,)/2kT
(5.4-15)
Entonces, como lo requiere (5.2-1),
(5.4-16)
en donde g(vx, vy, ~·.)dvx dvy dvz es el número de estados cuánticos dentro del elemento de espacio de velocidad dvxdvvdvz. De acuerdo con (5.2-17) el número de
La estadística de Maxwell-Boltzmann para un gas ideal
165
estados dentro de un elemento de volumen dpx dpy dpz del espacio de cantidad de
movimiento es (2V/h3) (dpxdPydPz), por lo cual,
(5.4-17)
Puesto que la densidad de estados en el espacio de cantidad de movimiento, es
constante, también lo es la densidad de estados en el espacio de velocidad. Si se
substituyen (5.4-15) y (5.4-17) en (5.4-16) y simplifica el resultado, se obtiene
)3/2
m
N(v V V) dv dv dv =N ( - x• Y' z
x
y
z
21tkT
e-mlu'"+u'y+u'.)/lkT dv
x
dv dv
Y
z·
(5.4-18)
Una tercera función de distribución de velocidad N(vx)dvx, que representa el
número de partículas cuya componente x de velocidad queda dentro del rango dvx
alrededor de Vx, sean cuales fueren los valores de las componentes y- y z- de
velocidad para dichas partículas, está íntimamente relacionada con la función de
distribución (5.4-18). La función de distribución N(vx)dvx se puede calcular a partir
de (5.4-18) integrando sobre todos los valores posibles de vy y Vz, siendo el resul·
tado
(5.4-19)
Los valores de las integrales definidas requeridas al integrar (5.4-18), se tomaron de la tabla 5.1. En la figura 5.6 se ilustra una gráfica de la distribución N(v) y
N(vx) como funciones de la coordenada de velocidad aprÓpiada.
Si se conocen estas tres funciones de distribución de velocidad, es muy fácil
evaluar los promedios sobre las distribuciones de velocidad. Por ejemplo, la velocidad
(o)
Figura 5.6.
( b)
(a) Representación esquemática de la distribución de Maxwell-Boltzmann de las
velocidades de partículas, N(v) a tres temperaturas distintas. (b) La distribución
correspondiente de las componentes x de la velocidad, N(vx).
166 Mecánica estadística. Generalidodes
térmica promedio e para una partícula en una distribución de Boltzmann, se obtiene
a partir de (5.4-14) escribiendo
ra)
J, vN(v)dv 1
312 a)
(v) = o
=-. 4nN (~-)
f v3e-mv2f2kT dv
Soa) N(v)dv N
2nkT
Jo
(5.4-20)
= J8kT/nm,
en donde la integral se evaluó con la ayuda de la tabla 5.1.
Ahora ya se puede pasar al estudio de la ecuación de estado de un gas ideal.
Supóngase que las partículas chocan contra una área unitaria de la pared de un
recipiente lleno con dicho gas, como se ilustra en la figura 5.7. Si la pared es un
plano orientado en sentido normal al eje x, las componentes de la cantidad de
movimiento Py y Pz de las partículas que chocan contra la pared, se conservan, si
las colisiones de las partículas con las paredes son elásticas, lo cual se supondrá, es
el caso de que se trata. En cada colisión, la componente de velocidad Vx dirigida
hacia la pared, cambia a - Vx, alejándose de la pared. La transferencia de cantidad
de movimiento de la partícula a la pared, por colisión, es entonces 2mvx. La trans-
r----
las partículas de
1
velocidades Vx dentro
l
de este volumen chocarán-,-_
contra la pared durante 1
el período dt
1
Unidad de área
1
1
1
1
L____ _
-v.dt
Pared de recipiente
-x
Figura S. 7.
Colisión elástica de una partícula contra la pared de un recipiente rígido, siendo Vx
la componente x de la velocidad de dicha partícula.
ferencia de cantidad de movimiento a la pared en el intervalo de tiempo dt es esta cantidad por el número de partículas que chocan con la pared durante este período; para partículas cuya componente x de velocidad es Vx, se trata sencillamente del número de
tales partículas dentro de un volumen que se extiende a una distanciad= vxdt detrás
de la pared, o el número por unidad de volumen por vxdt, de donde, vxdt • N(vxXJvxfV.
La transferencia de cantidad de movimiento en el tiempo dt para partículas cuya velocidades quedan dentro del rango dvx alrededor de Vx, entonces, es
La estadística de MaxweU-Boltzmann para un gas ideal
167
o bien,
(5.4-21)
La razón total de transferencia de cantidad de movimiento a las paredes, mediante las colisiones en que intervienen partículas con todos los valores posibles de
vx, se puede obtener integrando sobre vx, lo cual da, con ayuda de (5.4-19) y la
tabla 5.1,
dpx2m NJrn
foo V 2 e -mv2xf2kT dV--NkT
----.
dt
V
2nkT
0
x
x
V
(5.4-22)
Sin embargo, de acuerdo con la ley de Newton, el cambio en el tiempo de la
cantidad de movimiento por una unidad de área de la pared del recipiente es igual a
la fuerza ejercida sobre una unidad de área de la pared que, por definición, es la
presión P. En consecuencia, la ecuación (5.4-22) se reduce a
PV = NkT,
(5.4-23)
que es la ecuación de estado para un gas de Boltzmann de partículas independientes.
La ecuación anterior tiene la misma forma que la ley del gas ideal ya conocida, aunque ésta se suele escribir
PV = nRT,
(5.4-24)
en donde n es el número de moles de gas en el sistema y R es una "constante
molar de gas" determinada en forma experimental, que es la misma para todos los
gases "ideales". Si el sistema tiene n moles de gas, el número de partículas estará
dado por N= nNA, en donde NA es el número de Avogadro igual a 6.026 X 10 23
moléculas por mol. En estas condiciones, (5.3-23) toma la forma
PV = nNAkT,
(5.4-25)
por lo cual, comparando (5.4-24) con (5.4-25), es obvio que la constante de Boltzmann k debe estar dada por
(5.4-26)
de donde, la constante de Boltzmann es la constante de gas por partícula del
sistema. Su valor se puede derivar de NA y R y es igual a 1.380 x lQ-16 ergs/°K, o
bien, 8.615 x 1Q- 5 eV¡oK.
Ahora se ve con claridad que el valor de la constante {3 en la función de
distribución que se supuso en (5.3-27), se escogió correctamente. Si se hubieran
desarrollado los cálculos hasta este punto sin suponer ningún valor para {3, se habría
llegado a la ecuación (5.4-23),
PV = -N/{3,
(5.4-27)
168 Mecánictl estadístictl. Generalidades
y, para que esos resultados concuerden con la ley de los gases (5.4-24) establecidos
experimentalmente, habría sido obligatorio escoger
N
-N/P = nRT =NA RT,
o bien,
(5.4-28)
.S
ESTADISTICA DE FERMI-DIRAC
En el desarrollo de la función de distribución de Maxwell-Boltzmann, se considera que las partículas pueden distinguirse; pero en la práctica es imposible distinguir un electrón de cualquier otra partícula elemental. Es más, se admitió que un
número cualquiera de partículas ocupara el rniemo estado cuántico del sistema, a
pesar de que muchas de ellas, sobre todo los electrones, obedecen al principio de
exclusión de Pauli, que no permite que un estado cuántico acepte a más de una
partícula. Si estas condiciones adicionales se imponen al sistema, los cálculos de la
sección 5.4 se deben modificar, dando como resultado otra función de distribución
que se conoce como función de distribución de Fermi-Dirac. Esta distribución tiene
una importancia enorme, ya que describe la conducta estadística de los electrones
libres en los metales y los semiconductores; además, muchas propiedades eléctricas y
térmicas de los sólidos que no se pueden comprender en absoluto a la luz de lo
establecido con las estadísticas clásicas, se deducen como una consecuencia directa
de la estadística de Fermi-Dirac.
Si las partículas del sistema no se pueden distinguir, tampoco se pueden identificar numéricamente, como se supuso cuando se analizaron las diversas posibilidades
ilustradas en la figura 5.2. En realidad, todas las diferentes distribuciones presentadas
en cada hilera de la figura 5.2 que dan Q(N1 ,N2 ) para cualquier valor particular de
N 1 , serían iguales si se eliminaran los números que identifican las partículas, en
cuyo caso el factor (5.3-7) se reduce a la unidad. Sin embargo, en el iésimo nivel
energético se pueden permutar las N; partículas entre los g; estados cuánticos pertenecientes a ese nivel, y se puede hacerlo de muchas maneras cada una de las
cuales constituye una forma estadísticamente independiente de lograr un arreglo en
el que N; partículas estén en el iésimo nivel energético del sistema, como se ilustra
en la figura 5.8. El producto de los números posibles de permutaciones de partículas
entre los estados cuánticos sobre todos los niveles energéticos del sistema, da entonces el número de formas independientes de efectuar una distribución dada de partículas entre los niveles de energía.
~f;~:~:!Y~:el 1·1·1·11·1·11
Estado Núm. 1 2
Figura 5.8.
3 4 5
s 7
1·1
9 ,.
Una posible distribución de partículas entre los estados cuánticos del iésimo nivel
de energía de un sistema en el que se aplica el principio de exclusión de Pauli.
Estadística de Fermi-Dirac
169
En el caso de Fermi-Dirac, en el que se supone que se aplica el pnncipio de
exclusión de Pauli, se permite que haya, como máximo, una partícula por estado
cuántico. En relación con la figura 5.8, que describe el iésimo nivel de energía del
sistema, existen g¡ formas de seleccionar el punto en el que !>e debe insertar la
primera partícula, g¡ - 1 formas de escoger en donde se inserta la segunda, ya que la
segunda no puede ocupar el mismo estado cuántico que la primera, g¡ - 2 formas de
escoger en donde insertar la tercera, y así sucesivamente. El número total de maneras de acomodar N¡ partículas en el iésimo nivel obtenido sobre esta base, es
g.l
g1(g 1 - l)(g 1 - 2) ... (g 1 - N 1 + 1) = ( . -·~·)'
g,
(5.5-1)
1.
No obstante, las partículas no se pueden distinguir entre sí y por tanto, en un
arreglo dado de partículas las N¡! formas de permutadas unas con otras y entre
estados, no se consideran como permutaciones diferentes. Fl número real de formas
independientes de lograr una distribución de N¡ partículas en el iésimo nivel, se obtiene dividiendo (5.5-1) entre N¡! , lo cual da
(5.5-2)
N 1!(g1 - N 1)!
El número total de formas independientes de lograr una distribución de
(N 1 , N 2 , • • • Nn) partículas indistinguibles entre n niveles energéticos, en donde no
se tiene más de una por estado cuántico, es sólo el producto de los factores individuales de la forma (5.5-2) sobre todos los niveles, es decir,
(5.5-3)
Ahora se procederá a maxlffiJZar el logaritmo de esta cantidad con respecto a
las variables N 1 , N 2 , • • • Nn por el método de los multiplicadores lagrangeanos
utilizados en la sección 5.3. De acuerdo con (5.5-3), se tiene que
In Q1 = L In g1!- L In N1! - L ln(g 1 - N1)!,
i
i
i
(5.5-4)
que, utilizando la aproximación de Stirling (5.3-20) se puede describir
In Q1 = L [g 1 In g1 - N 1 In N 1 - (g 1 - N 1) In(g 1 - N1)].
(5.5-5)
1
Nuevamente, se requiere que el número total de partículas del sistema y su
energía total se mantengan constantes, lo que significa que las ecuaciones (5.3-22) y
l5.3-23) deben aplicarse también en este caso, de donde, se puede escribir, al igual
que antes
(j = 1, 2, ... n),
(5.5-6)
170
Mecánica estadística. Generalidades
en donde cp y 1/1 están dados por (5.3-22) y (5.3-23). Al substituir (5.5-5), (5.3-22)
y (5.3-23) en esta ecuación, se obtiene
- a~J ~ N In N + ~ (g
1
1
1-
N 1) ln(g 1 - N 1)] +oc
a~i (~ N + pa~i (t e N =O.
1)
1
1)
(5.5-7)
Al desarrollar las derivadas de la sección 5.3, se encontró que
(5.5-8)
o bien, reacomodando, haciendo las exponenciales, y resolviendo para N¡/g¡ =!(e¡),
f(e.) = N ·fg · =
1
1
1
1
11
1 + e " "1
•
(5.5-9)
Esta es la función de distribución de Fermi-Dirac.
Al igual que en la sección 5.4, se considerará que el valor de (3 es
p = -1/kT,
(5.5-10)
y más adelante se explicará el porqué de este paso. Lo más aceptado es expresar a
como
(X=
(5.5-11)
8¡/kT,
en donde e¡ es un parámetro con las dimensiones de la energía que se denomina
energía de Fermi o bien, nivel de Fermi del sistema. Por tanto, la ecuación (5.5-9)
se convierte en
N·=
J
gi
(5.5-12)
1 + e<•J tt)fkT '
o bien, si se supone que los niveles se juntan formando un continuo, de modo que
g¡(e¡)-+ g(e)de, entonces,
g(e)de
N(e)de = g(e)f(e) de = 1 + e<• •tlikT.
(5.5-13)
Para un gas de partículas independientes tales como electrones libres, g(e)de se
representa mediante (5.2-22), al igual que un gas de Maxwell-Boltzmann.
La energía de Fermi e¡ es, en general, una función de la temperatura cuya
forma y dependencia de temperatura depende primordialmente de la densidad de la
función de estados del sistema, al igual que en el caso del parámetro correspondiente e" de la distribución Maxwell-Boltzmann. Su valor se determina mediante la
condición (5.3-22) o bien si se trata de un continuo de niveles, por medio de
N = const. =
f
g(e)de
1 + e<• •tlfkT =
f
g(e)f(e)de.
(5.5-14)
Estadístico de Fermi-Dirac
171
La integral se toma sobre todas las energías disponibles para las partículas del
sistema. Para un gas de Fermi de partículas independientes, g(e) está dada por
(5.2-22) y e¡ se determina mediante
N= B.j21tVm312 roo
Jede
Jo 1 + e<• e¡)/kT.
h3
(5.5-15)
Desgraciadamente, esta integral no se puede evaluar en una forma analítica, de
modo que e¡ no se pueda determinar como una función simple de la temperatura.
Sin embargo, en un gas bidimensional de partículas libres, se puede demostrar, mediante los métodos usados para derivar (5.2-22), la función de densidad de estados es
41tmA
g(e)de = """"'h2 de,
(5.5-16)
e independiente de la energía (ejercico 3, capítulo 5). En esta fórmula, A representa
el área del "recipiente" bidimensional. Para este sistema, (5.5-14) se convierte en
41tmA roo
N= -¡¡r-
de
Jo i + e<•-•¡)/kT•
(5.5-17)
que se puede evaluar en forma cerrada, haciendo que uno resuelva para e¡ y se
obtiene
e1(T) = kT ln(e•t<O)/kT- 1),
(5.5-18)
Nh 2
e¡(0)=-41tmA
(5.5-19)
en donde
es el valor que ej(1) toma conforme T tiende a cero, como está dado por (5.5-18).
Los detalles del cálculo de este resultado son muy instructivos y quedan asignados
como ejercicio para el lector. La variación de la energía de Fermi del gas bidimensional de partículas independientes se ilustra en la figura 5.9. Se notará en este caso,
que la energía de Fermi es una función monotónica decreciente de la temperatura.
La energía de Fermi para el gas de Fermi tridimensional, con la función de densidad
de estados (5.2-22), presentará el mismo comportamiento general, excepto que en
este caso, la variación de la energía de Fermi con respecto a la temperatura es lineal
cuando los valores de ésta se mantienen razonablemente bajos, en tanto que para el
ejemplo bidimensional, la variación es mucho más compleja a temperaturas bajas.
Para muchos sistemas, incluyendo estos dos, la variación del nivel de Fermi con
respecto a la temperatura es p~queña sobre el rango de temperaturas físicamente
posibles; en la figura 5.9, la temperatura a la que e¡= O sería del orden de
75000°K para un gas de electrones con la densidad de electrones libres correspondiente a la del cobre metálico. Por esta razón, en muchas aplicaciones la dependencia de temperatura de la energía de Ferrni se puede desechar o aproximar mediante una función lineal u otra apropiada de la temperatura.
La función de distribución de Fermi propiamente dicha,
1
/(e) = 1 + e<•-•,>tkT '
(5.5-20)
172 Mecánica estadística. Generalidades
., (T)
Figura 5.9.
Representación esquemática de la variación de la energía de Fermi en función de la
temperatura, en un gas bidimensional de electrones libres, de acuerdo con (5.5-18).
se muestra en la figura 5.10 para varios valores de temperatura. Puesto que sólo
una partícula puede ocupar un estado cuántico dado, el valor de f(e) para una distribución de Fermi a una energía partícular es justamente igual a la probabilidad
de que un estado cuántico de dicha energía esté ocupado. En el cero absoluto,
como se puede ver fácilmente en la figura 5.10 y por la ecuación (5.5-20), la
función de distribución de Fermi se convierte sencillamente en una función de escalón
f(e) = 1
(e< e1 )
=O
(e> e1 ).
(5.5-21)
Conforme aumenta la temperatura, los bordes del escalón se redondean y la
función de distribución varía rápidamente desde casi la unidad hasta casi cero sobre
un rango de energía de algunos múltiplos de kT alrededor del valor e = e1. Al
mismo tiempo, el valor de e¡ cambia y la variación ilustrada en la figura 5.10 es
aproximadamente la que se asocia con el gas electrónico tridimensional, cuya densidad de estados está dada por (5.2-22). A temperaturas muy elevadas, la función de
Figura 5.10.
Representación esquemática de la función de distribución de Fermi para cuatro
diferentes temperaturas. Obsérvese la variación de la energía de Fermi con la
temperatura. La dependencia de la energía de Fermi en relación a la temperatura,
tal como se muestra aquí, es típica para un gas tridimensional de electrones libres;
pero la variación real en cualquier sistema en particular depende críticamente de
la función de densidad de estados (o nivel de degeneraciones) del sistema.
Estadístictl de Fermi-Dirac
173
distribución pierde su característica de escalón y varía con más lentitud en función
de la energía. De acuerdo con (5.5-20), es evidente que el valor de !(e) a e= e¡ es
sólo l/2, es decir,
(e1 ) =t.
(5.5-22)
de donde, un estado cuántico al nivel de Fermi tiene la probabilidad de ocupación
de l/2.
En la figura 5.11 se muestra la distribución real de la densidad de partículas
.V(e) como una función de la energía para un gas de Fermi de partículas independientes, dada por (5.5-13) con la función de densidad de estados (5.2-22). Nuevamente, en T =O, la curva tiene un carácter escalonado; así la porción para la que
(e< e¡) es la parábola de densidad de estados (5.2-22) y para la que (e> e¡) es
.:ero. Al aumentar la temperatura, este aspecto escalonado se hace cada vez menos
pronunciado, como se ilustra en el dibujo. A temperaturas bajas, cuando la función
de distribución de Fermi es escalonada, se dice que la distribución está sumamente
degenerada.
A temperaturas bajas, la distribución de Fermi-Dirac se puede representar como
una esfera en el espacio de cantidad de movimiento en el que todos o casi todos los
estados cuánticos de energía menor que e1 están llenos, en tanto que todos o la
mayoría de los estados de energía mayores que e1 están vacíos. De acuerdo con
f 5.2-14), la ecuación de la superficie de esta "esfera Fermi" debe ser
Px2 + Py2 + Pz2 = 2 me¡,
(5.5-23)
de donde, el radio es ..J2me1 , como se ilustra en la figura 5.12. A temperaturas muy
altas, la superficie de la esfera de Fermi está definida muy deficientemente debido a
la desaparición de bs aspectos escalonados de j(f), y el concepto resulta menos útil.
Entonces, se llega a la conclusión que ta integral (5.5-15) no puede evaluarse
en forma exacta y esto no permite encontrar una expresión simple para la energía
de Fenni de un gas de Fermi tridimensional a todas las temperaturas; sin embargo el
.:arácter simple (5.5-21) que adopta la función en T= O permite evaluar er de un
modo muy sencillo en el cero absoluto. Si se utiliza (5.5-:ll) para representar !(e)
en T =O, se puede volver a escribir (5.5-14) utilizando la función de densidad de
estados (5.2-22) como
N = 8J2nm 312 r•¡(O) Jede = 16j2nm 3 ' 2 [e¡(0)] 3 ' 2
V
h3
3h 3
Jo
(5.5-24)
N(.)
Figura 5.11.
Representación esquemática de la densidad electrónica como función de la energía
asociada a un gas tridimensional de electrones libres.
174 Mecánica estadística. Generalidades
( r- eje .lal papel l
Figura 5.12.
La distribución de Fermi al cero absoluto correspondiente a un gas de electrones
libres, representada, por medio de una esfera de electrones dentro del espacio de
cantidad de movimiento. Esta representación es útil siempre y cuando T<t.Tp.
Resolviendo esta ecuación para ej(O), se obtiene
(3N)2/3 .
h2
e¡(O) = - 8m 1rV
(5.5-25)
De un modo similar, se puede obtener la energía interna de un gas de Fermi
al cero absoluto, siendo el resultado
U0 _ 1th 2
(3N) 3-5
_3NV e¡(O).
V- 40m 1rV
5'
(5.5-26)
Los detalles de estos cálculos se omiten, pero se proponen como ejercicio para el
lector.
Para energías mucho mayores que er, e<e-e¡)fkT es mucho mayor que la unidad
y para tales energías, la función de dÍstribución de Fermi-Dirac (5.5-20) se puede
escribir aproximadamente como
(5.5-27)
Si todas las energías disponibles para el sistema satisfacen la condición
e- e1 ~ kT,
(5.5-28)
es decir, si e¡ es muchas unidades kT menor que cualquier energía que pueda tener
una partícula perteneciente al sistema, entonces (5.5-27) constituirá una buena aproximación de (5.5-20) para todas las partículas del sistema. Sin embargo, la función
de distribución aproximada (5.5-27) es, sencillamente, la función de distribución de
Maxwell-Boltzmann de (5.4-6) con a= e¡/kT. Entonces, si se conserva la condición
(5.5-28) para todas las partículas del sistema, la distribución Fermi-Dirac y la de
Maxwell-Boltzmann son casi iguales.
Estadística de Fermi-Dirac
175
Para el gas bidimensional de Fermi, donde la energía de Fermi está dada por
(5.5-18), si T es tan grande que kT'> e¡(O), el exponente e¡(O)/kT será pequeño, de
tal manera que el exponencial se puede aproximar mediante 1 + [e¡(O)/kT], dando
e (T) = kT In e¡(O)
1
kT
=
81
(O)[ kT 1 B¡(O)]
e1(0) n kT
kT
kT]
= -e¡(O) [ e¡(O) In e¡(O) .
(5.5-29)
De acuerdo con esto, se advierte que conforme T aumenta, e¡(T)-+- oo. Puesto que la energía más baja que puede tener cualquier partícula del sistema es cero,
es evidente que la condición (5.5-28) se satisfará para temperaturas lo suficientemente altas y la función de distribución será aproximadamente la misma que la de
la distribución de Maxwell-Boltzmann a temperaturas muy elevadas. Se puede demostrar que el mismo resultado se aplica al caso tridimensional. Estos resultados también
pueden esperarse si se emplea un enfoque físico, ya que a altas temperaturas, las
partículas se distribuyen sobre un rango muy amplio de estados energéticos, y el
número de partículas en cada rango de energías disponibles es tan pequeño que
siempre hay mucho más estados cuánticos disponibles que partículas que puedan
ocuparlos. En estas circunstancias, la probabilidad de que dos o más partículas ocupen el mismo estado cuántico siempre se hace sumamente pequeña de modo que no
importa mucho si la función de distribución obedece al principio de Pauli (distribución Fermi-Dirac) o no lo obedece (distribución Maxwell-Boltzmann). 3 Puesto que
la cantidad e¡(O), que deber ser obligatoriamente mucho menor que kT para que las
dos distribuciones coincidan, es proporcional a la densidad de partículas N/A por
(5.5-19), la reducción de la distribución de Fermi a una reducción de Maxwell-Boltzmann se desarrollará a temperaturas más bajas en gases menos densos. Por las mismas razones, de acuerdo con ( 5.5-19), se producirá a temperaturas más bajas en
gases en las que la masa de las partículas m sea grande. Debido a ello, las substancias gaseosas ordinarias a temperaturas normales obedecen a la estadística de MaxwellBoltzmann mejor que a la estadística Fermi-Dirac (o Bose-Einstein). Sin embargo,
para un gas denso de partículas muy ligeras, tales como los electrones libres de un
metal, la energía de Fermi al cero absoluto es bastante grande y la condición
(5.5-28) se puede satisfacer para todas las partículas del sistema sólo a temperaturas
tan altas que sean físicamente inalcanzables. Por tanto, cuando se trata de un gas
denso de electrones libres, debe utilizarse la estadística de Fermi-Dirac. No obstante,
en los semiconductores, la forma peculiar de la función de densidad de estados es
tal que la distribución de Maxwell-Boltzmann casi siempre es una aproximación aceptable de la distribución de Fermi-Dirac o prácticamente igual a ella. Esta situación
se examinará más detalladamente en un capítulo posterior.
3 Se podría alegar que aun en este límite la distribución de Fermi-Dirac debe diferir de la
de Maxwell-Boltzmann en virtud de que no se pueden identificar las partículas. Sin embargo, se
puede demostrar, como se verá en la siguiente sección, que la función de distribución de partículas no distinguibles, que no obedecen el principio de exclusión de Pauli (la distribución
Bose-Einstein), se aproxima a la función de distribución Maxwcii-Boltzmann en este límite. Una
forma más exacta de explicar la situación sería afirmar que, en el límite de altas temperaturas,
la distribución Fermi-Dirac se acerca a la distribución Bose-Einstein que, a su vez, se acerca a la
distribución Maxwell-Boltzmann.
176 Mecánica estadística. Generalidades
Si se hubiera escogido para el multiplicador (3, otro, diferente al dado por
(5.5-10), no se habría encontrado, por lo general, la correspondencia entre los sistemas Fermi-Dirac y Maxwell-Boltzrnann en el límite de las temperaturas altas que,
como ya se vio, se puede esperar por razones físicas. Por tanto, se debe llegar a la
conclusión de que el valor de (3 dado por (5.5-10) está físicamente justificado.
5.6
LA DISTRIBUCION HOSE-EINSTEIN
En la sección anterior se demostró que la distribución estadística de FermiDirac (5.5-20) es la que caracteriza el comportamiento de un conjunto de partículas
no distinguibles que obedecen al principio de exclusión de Pauli. Puesto que no
todas las partículas elementales obedecen el principio de Pauli (siendo la excepción
más conspicua los fotones), es necesario considerar el comportamiento de las partículas no distinguibles, que no obedecen este principio. También en este caso, puesto
que las partículas no están numeradas, el factor ( 5.3-7) se reduce a la unidad y sólo
es necesario considerar las posibles permutaciones de N¡ partículas idénticas entre g¡
estados cuánticos de iésimo nivel energético; pero ahora sin ninguna restricción en lo
que respecta al número de partículas que pueden ocupar cualquier estado cuántico
dado.
Sea un arreglo lineal de N¡ partículas y g¡ - 1 particiones que serían necesarias
para dividir estas partículas en g¡ grupos, como se ilustra en la figura 5.13. No es
difícil ver que el número de formas de permutar las N¡ partículas entre g¡ niveles, es
igual al número de permutaciones independientes de objetos y particiones de la
figura 5.13. Puesto que se tiene un total de N¡+ g¡- 1 partículas más las particiones, éstas se pueden arreglar linealmente en (N¡+ g¡- 1)! formas; pero puesto
que las permutaciones que se hacen entre las partículas y entre las particiones no
se consideran como acomodos independientes, el número de acomodos se debe dividir entre el número de maneras de permutar las partículas entre ellas mismas (N¡! )
y nuevamente entre el número de maneras de permutar las particiones entre ellas
mismas ((g¡- 1)! ), dando
(N;+ g¡- 1)!
N;!(g;- 1)!
(5.6-1)
formas de realizar una distribución de N¡! partículas no distinguibles entre g¡ estados que pueden alojar a cualquier número de partículas. Fl número Qb de formas
estadísticamente independientes de lograr una distribución (N 1 , N 2 , • • • Nn) de partículas entre los niveles energéticos del sistema, de acuerdo con estas reglas, es
•• •
•• •• ••
• ••• •
iésimo nivel de energía: degene.r.ación 9; =9
poblac10n N;= 14
Figura 5.13.
Una posible distribución de partículas entre los estados cuánticos del iésimo nivel
de un sistema en el que no se aplica el principio de exclusión de Pauli.
< ncr?,ético
La distribución de Rose-Einstein
177
simplemente el producto de los factores de la forma (5.6-l) sobre todos los niveles
del sistema por lo que
(5.6-2)
Ahora se puede maxlinizar esta cantidad con r~specto a las variables N¡, N 2 : • • •
Nn, utilizando el método de los multiplicadores de Lagrange y de acuerdo con las restricciones (5.3-22) y (5.3-23). Los cálculos no se incluirán aquí; pero se sugiere que
los ejecute el lector como ejercicio. El resultado es
1
(5.6-3)
Esta fórmula se conoce como función de distribución Bose-Einstein. También
ahora se puede identificar (3 como
{3 = -1/kT,
(5.6-4)
mientras que a puede determinarse de acuerdo con el número de partículas del
sistema, al igual que se hizo en los casos Maxwell-Boltzmann y Fermi-Dirac. Para el
caso de un continuo de niveles muy poco espaciados entre sí, g¡ ~ g(c)d€ y
N¡~ N(c)dc, lo cual da
(5.6-5)
Para la función de densidad de estados de partículas independientes ( 5.5-16)
correspondiente a un gas bidimensional de partículas libres, el parámetro a se puede
calcular explícitamente en la misma forma que e¡ para este sistema, de acuerdo con
la estadística Fermi-Dirac. Se puede demostrar entonces que conforme T se incrementa, a~- oo, en cuyo caso el factor exponencial del denominador de (5.6-5) se
hace mucho mayor que la unidad y la distribución Bose-Einstein (5.6-5) tiende a
(5.6-6)
que es una función de distribución del tipo de Maxwell-Boltzmann. Se puede obtener el mismo comportamiento general para un gas de Base-Einstein tridimensional de
partículas independientes, aunque en este caso no es posible obtener una expresión
para a en forma exacta.
En el límite de las temperaturas muy altas, las partículas del sistema se distribuyen sobre un rango muy amplio de energía, y el número de partículas en cada
rango de energía disponible será mucho más pequeño que el número de estados
cuánticos de dicho rango, de donde, para todos los estados g¡ :>N¡. En esta situación, se puede escribir, aproximadamente,
(N; + g¡ - 1)! ~ N;
(g¡-1)!
=g¡,
(5.6-7)
de donde, (5.6-2) se convierte en
(5.6-8)
178 Mecánica estadística. Generalidades
Cabe notar que esto, aparte de un factor constante N! , es igual a
Q(N 1 , N 2 , • • • Nn) como está dado por (5.3-8) para un sistema Maxwell-Holtzmann.
Entonces, desde un punto de vista puramente físico se debe esperar que las distribuciones Hose-Einstein y Maxwell-Holtzmann coincidan en el límite de altas temperaturas. La selección del valor dado por (5.6-4) para (j está entonces justificado, ya
que esta selección, como se vio antes, lleva directamente a la correspondencia entre
la estadística Hose-Einstein y Maxwell-Boltzmann indicada por (5.6-6).
En el caso de los gases bidimensional y tridimensional de partículas independientes de Hose-Einstein, conforme la temperatura se acerca a cero, el valor de a
tiende a cero y el resultado es que todas las partículas del sistema tienden a condensarse en el estado energético más bajo del sistema al cero absoluto. Este fenómeno,
denominado condensación de Hose, es característico de los sistemas que obedecen la
estadística de Bose-Einstein.
En algunas aplicaciones, conviene obtener la función de distribución BaseEinstein, sin establecer la restricción de que el número de partículas del sistema sea
constante. De acuerdo con (5.3-15) y (5.3-16), se puede ver que este resultado se
puede obtener de (5.6-5), si se supone que a es idéntica a cero. En este caso,
(5.6-5) se reduce a
f(e) =
1
e/kT
e
·
- 1
(5.6-9)
EJERCICIOS
l. Demuestre que el frente de onda asociado con la onda plana 'Ir= ei(k•r-wt) avanza en
la dirección k.
2. Demuestre, para la partícula libre en tres dimensiones cuya función de onda está dada
por (5.2-7), que el valor esperado de la cantidad de movimiento vectorial p es igual a hlc, y que
p (y, por ende, k) es una constante del movimiento.
3. Calcule la densidad del factor de estados g(e)de para un sistema bidimensional de partículas libres, en el que no hay otras interacciones que colisiones instantáneas y que está contenido en un recipiente rígido de superficie A y de dimensiones x 0 y y 0 . Comience con la ecuación
de SchrOdinger.
4. Suponga que se lanzan simultáneamente cuatro monedas, ¿cuáles son las probabilidades
asociadas con las distribuciones (0 águila, 4 sol), (1 águila, 3 sol) ... (4 águila, O sol)?
5. Encuentre las dimensiones y la superficie del rectángulo de área máxima con lados
paralelos a los ejes de las coordenadas, que se puede inscribir dentro de una elipse cuyo eje
mayor es 2a y cuyo eje menor es 2b. Los ejes de la elipse pueden considerarse paralelos con los
ejes de las coordenadas. Emplee el método de los multiplicadores de Lagrange.
6. Encuentre la velocidad de raíz cuadrada media y la velocidad más probable de una
partícula en un gas ideal de Boltzmann.
7. Demuestre que el flujo de partículas en un gas ideal de Boltzmann, cuyas componentes
x de velocidad son positivas, por unidad de área sobrt> un plano normal al eje x es -!Nc7V.
Nota: el flujo o densidad de corriente se define como el número de partículas por unidad de
volumen por su componente de velocidad a lo largo de la normal al plano sobre el que se
observa el flujo.
8. Demuestre que la energía de Fermi de un gas de Fermi bidimensional de partículas
libres cuya función de densidad de estados está dada por el resultado del ejercicio 3, es ej{T) =
kTin(eEj{O)fkT- 1), en donde et{O) =Nh2f(4rrmA)
9. Calcule la energía de Fermi, en electrón-volts, para los electrones libres en el cobre al
cero absoluto, suponiendo que hay un electrón libre por átomo de cobre. Indique la temperatura
a la que kT será igual a ef.O).
10. Demuestre que la energía interna por unidad de volumen de un gas de Fermi de
partículas libres al cero absoluto es ~!!.. ej(O).
5 V
11. Demuestre por el método de los multiplicadores lagrangeanos, que si Q(N ¡, N 2 , • • • Nn)
está dada por la ecuación (5 .6-2), la función de distribución correspondiente a los valores más probables dé N •· N2, • • • Nn, está dada por (5.6-3).
La distribución de Rose-Einstein
179
12. Use la función de densidad de estados calculada en el ejercicio 3 para demostrar que
d parámetro a de un gas de Bose-Einstein bidimensional de partículas libres está dado por
IX= )n(l _
e-h2N/(2nAmkT)).
Analice las propiedades de la función de distribución resultante para T--'>- oo y para T-+ O.
LECTURAS RECOMENDADAS
W. Band, An Introduction to Quantum Statistics, D. Van Nostrand, Princeton, N. J. (1955).
R. W. Gurney, Introduction to Statistical Mechanics, McGraw-Hill Book Co., lnc., Nueva York
(1949).
D. ter Haar, Elements of Statistical Mechanics, Holt, Rinehart and Winston, lnc., Nueva York
(1954).
R. B. Lindsay, Introduction to Physical Statistics, John Wiley and Sons, Nueva York (1941).
J. E. Mayer y Maria Gi:ippert-Mayer, Statistical Mechanics, John Wiley and Sons, Nueva York
(1940).
R. C. Tolman, The Principies of Statistical Mechanics. Oxford University Press, Londres (1938).
CAPITULO
6
Vibraciones reticulares y
propiedades térmicas de los cristales
6.1
CALCULOS CLASICOS DEL CALOR ESPECIFICO RETICULAR
En la sección 4.4 se delinearon algunos de los problemas que se presentan
cuando se calcula el calor especifico de un cristal, suponiendo que los átomos de
dicho cristal se comportan como osciladores armónicos clásicos independientes. Ahora se examinarán estos problemas detalladamente y se estudiará la forma en que se
pueden resolver, usando los resultados obtenidos en los capítulos 3-5, relacionando
la dinámica reticular, la mecánica cuántica y la mecánica estadística. En todas estas
investigaciones se tratará de un cristal compuesto de N átomos, que se mantienen
unidos en un arreglo periódico. Se supone que estos átomos sólo pueden vibrar
alrededor de sus posiciones de equilibrio ya que están sometidos a fuerzas restrictivas
que, en una primera aproximación, obedecen a la ley de Hooke. También se supone
que no hay electrones libres, como se encontrarían en un metal, y que toda la
capacidad calorífica del cristal se debe a las vibraciones de la red producidas por
excitación térmica. Cuando hay electrones libres, también, se puede lograr que se
muevan excitándolos por medio de una fuente calorífica externa y, entonces, su
movimiento ocasiona un aumento en el calor específico observado; esto se estudiará
en un capítulo posterior.
El cálculo clásico supone que cada átomo es un oscilador armónico clásico
tridimensional que vibra independientemente de todos los demás átomos del cristal.
En estas circunstancias, se puede calcular la energía térmica interna total del cristal
determinando la energía promedio de un solo oscilador y multiplicando el resultado
por N. Para un solo oscilador armónico isotiópico tridimensional, la energía total es
p2
e=-+ V(r)
(6.1-1)
2m
siendo
(6.1-2)
en donde m es la masa y w 0 la frecuencia natural del oscilador. Si se supone que la
distribución de los osciladores por energía obedece a la ley de distribución MaxwellBoltzmann, la función de distribución que expresa la probabilidad de que un oscilador tenga una energía dada E es
pl
mwo2r2
f(c.) = Ae-•lkT = Ae- 2mkT e- 2fT= f(p,q)
181
(6.1-3)
182
Vibraciones reticulares y propiedades térmicas de los cristales
en donde A es una constante. De acuerdo con (5.2-4), la energía promedio está
dada por
(6.1-4)
En este caso se prefirió usar coordenadas esféricas (r, e, cf>) para el espacio de
las coordenadas y (p, eP, cf>p) para el espacio de la cantidad de movimiento, para
fines de integración la cual, por supuesto, debe hacerse sobre todo el espacio de
fase. Puesto que el integrando no tiene dependencia en relación de e, p, ep, o 'cf>p la
integración sobre estas variables se puede desarrollar de un modo muy sencillo,
dando un factor de 41T tanto al numerador como al denominador, y dejando
_1_ foo p4e- 2~~T dp
(e) =
2m o
foo pZ
p2e2mkT dp
m;~ foo r4e- m~~~z dr
+
foo o mm >rZ
o
0
- (~ ) + (~ )
-
"k
"p •
(6 1 5)
• -
r2e 2kT dr
o
En el primer término de (6.1-5), cada doble integral de (6.1-4) se ha expresado
como un producto de una integral p y otra integral r; las integrales r del numerador
y el denominador son iguales y se anulan, dando el primer término de la expresión
antes presentada. El segundo término se maneja en la misma forma; pero en este
caso las integrales de p del numerador y el denominador son las que se cancelan. Es
evidente que el primer término de la expresión anterior representa la energía cinética
promedio y el segundo la energía potencial promedio. Al evaluar las integrales con la
ayuda de la tabla 5.1, se encuentra que
(6.1-6)
Para un conjunto de N oscilaciones independientes, la energía interna total U
es, sencillamente,
U= N(e) = 3NkT,
(6.1-7)
y la capacidad térmica Cv es, por definición,
Cv = (8Uf8T)v = 3Nk.
(6.1-8)
El calor específico es la capacidad calorífica por gramo (o por unidad de
volumen). La capacidad calorífica es una constante independiente de la temperatura.
Para un mol de cualquier substancia, N es igual al número de Avogrado Na y la
capacidad calorífica molar Cvm está dada por
(6.1-9)
Este resultado se conoce como la ley de Dulong y Petit, y los alumnos que
han estudiado química elemental están familiarizados con ella ya que es la base de
una forma rudimentaria de estimar el peso atómico de un elemento desconocido. La
Teoría de Einstein sobre el calor específico
183
Cvm
~i"!'O:....__~I0'-0---2-'0-0---30-'--0---4.L.OO--- T ("K)
Figura 6.1.
Capacidad térmica de una substancia sólida típica graficada como una función de la
temperatura.
ley de Dulong y Petit concuerda totalmente con los resultados experimentales obtenidos con la mayoría de las substancias a la temperatura ambiente y por encima de
ella; pero conduce a errores notables a temperaturas bajas. En el rango de temperaturas bajas, el calor específico de todas las substancias tiende a cero siendo proporcional a P conforme T se acerca a cero, como se ilustra en la figura 6.1.
6.2
TEORIA DE EINSTEIN SOBRE EL CALOR ESPECIFICO
Einstein investigó las discrepancias en la teoría clásica del calor específico y,
en 1911, logró explicar cualitativamente el calor específico (por lo menos en su
forma observada y desde un punto de vista experimental) como una función de la
temperatura. En la teoría de Einstein, los átomos se consideraban nuevamente como
osciladores armónicos independientes e idénticos con una sola frecuencia de vibración
natural w 0 , pero se toman como osciladores cuánticos armónicos que pueden tener
sólo valores discretos de energía 1 tales que
(n = 0,1,2, · · · ),
(6.2-1)
como está dado por ( 4.12-27). Se puede considerar que los osciladores tienen una
distribución de energía del tipo Maxwell-Boltzmann, ya que forman un conjunto de
sistemas que son distinguibles o identificables en virtud de su ubicación en puntos
separados y distintos de la red, y puesto que cualquier número de osciladores puede
estar en cualquier estado cuántico del sistema. Por tanto, aunque los átomos son
osciladores cuantizados, la distribución clásica de Maxwell-Boltzmann sigue siendo la
más apropiada para describir su comportamiento estadístico. Por otro lado, los verdaderos cuantos de energía vibratoria que absorben o emiten los osciladores, no son
entidades distinguibles y, por tanto, la estadística de Bese-Einstein se debe utilizar
1 Por supuesto, Einstein utilizó el resultado de Planck En = nl'k.u más bien que el resultado
de la mecánica ondulatoria que se da en (6.2-l) para los niveles de energía de un oscilador
armónico. Si se usa el resultado original de Planck, la expresión final de la energía interna y el
calor específico que se obtienen difieren de los resultados aquí derivados, ~ólo en la <lll~encia de
una contribución energética de punto cero independiente de la tl'mpcratura a la energía interna
184
Vibraciones reticulares y propiedades térmicas de los cristales
para describir su comportamiento estadístico. Como se verá más tarde, se pueden
obtener los mismos resultados analizando las propiedades del sistema de osciladores de
acuerdo con la estadística Maxwell-Boltzmann, o bien manejando la dinámica de los
cuantos de energía vibratoria por medio de la estadística de Bose-Einstein.
Para mayor simplicidad, se supondrá que el cristal contiene 3N osciladores
armónicos unidimensionales cuyos niveles de energía están dados por (6.2-l), en
lugar de N osciladores isotrópicos tridimensionales. Esta suposición se justifica, ya
que existen tres grados de libertad de vibración independiente relacionados con cada
átomo del cristal y que, de acuerdo con el principio de equipartición, la energía
vibratoria disponible se distribuye de un modo equitativo, en promedio, entre estos
tres grados de libertad. Si la energía se distribuye entre los osciladores de acuerdo
con la ley de Boltzmann, el número de osciladores a la energía e es proporcional a
e- efKT y la energía promedio es
¿ e<n+t)x
(6.2-2)
n
en donde
x = -liw0 /kT.
(6.2-3)
Sin embargo, la ecuación 6.2-2 se puede escribir como
(6.2-4)
La energía interna se obtiene multiplicando la energía promedio por oscilador,
por el número de osciladores, como antes, de donde,
3Niiw 0
3Niiw 0
U= 3N(e) = --2- + eftwa/kT- 1
(6.2-5)
e = (-aaTu_) = 3N k (-liw_o)
---;:--e~=Wo,...lk_T--::
kT
1)2.
(6.2-6)
y
2
V
(eftwo/kT-
V
Este resultado se puede expresar en una forma algo más s~ncilla definiendo
una "temperatura de Einstein" 8¡.; tal que
liw 0 = k0E.
(6.2-7)
Al substituir k8E en lugar de hw 0 en (6.2-6), se tiene que
(6.2-8)
Teoría de Einstein sobre el calor específico
185
Para temperaturas lo suficientemente altas para que T~ eE, e0 EIT:::: 1; utilizando la expansión de series de potencias para la exponencial y reteniendo sólo los
términos de primer orden, se puede ver fácilmente que en este límite, Cv se acerca
al resultado clásico 3Nk. Para temperaturas bajas (T <1!; SE), e0 EIT ~ 1 y (6.2-8) se
puede aproximar mediante
(6.2-9)
.:¡ue se acerca a cero conforme T tiende a cero, aunque no concuerda con el comportamiento T3 observado a temperaturas bajas. El primer término de (6.2-5) representa la parte de energía interna del sistema que corresponde a la energía de punto
~ero de los osciladores. Puesto que es independiente de la temperatura, no hace
\·ariar el valor del calor e~pecífico.
Físicamente, la razón de que el calor específico se haga tan pequeño a temperaturas bajas se puede entender suponiendo que el cristal se coloca de tal modo
que hace contacto con un baño térmico externo compuesto de un gas monoatómico ideal a una temperatura dada y se deja que absorba energía de los átomos del gas
ideal. La energía promedio de los átomos del gas es 3/2kT y si la temperatura del
sistema es lo suficientemente alta, de tal modo que kT sea por lo menos del orden
de la energía líw 0 requerida para excitar uno de los átomos vibrantes del cristal a
un estado energético más alto, tales excitaciones ocurrirán frecuentemente, al chocar
~on el cristal los átomos del gas del baño térmico. Entonces, estas colisiones serán
inelásticas en el sentido mecánico y la energía que inicialmente pertenecía a los
átomos del gas se transferirá con facilidad a la red cristalina como energía de
\"ibración. Por otro lado, a temperaturas lo suficientemente bajas, kT será mucho
más pequeña que la energía de excitación líw 0 , y sólo un átomo ocasional de gas
que tenga una energía mucho mayor que la promedio podrá producir una excitación
de esta índole y, por tanto, transferir calor a la red cristalina. Luego, el cristal tiene
relativamente poca capacidad para absorber calor de su ambiente y un cambio unitario de temperatura en el ambiente sólo ocasiona la transferencia al cristal de una
cantidad de calor muy pequeña, en comparación con la que se puede transferir en conniciones similares a temperaturas más altas. Conforme la temperatura se acerca al cero
absoluto, la fracción de átomos del baño térmico que poseen la mínima energía de excitación hw 0 tiende a cero, y en consecuencia, también lo hace el calor específico.
La temperatura de Einstein SE = líw 0 /k se puede calcular fácilmente si se
conoce w 0 . Esta frecuencia natural de vibración se puede calcular a partir de la
masa atómica y las constantes elásticas observadas del cristai.2 Para muchos elementos metálicos, el valor calculado de esta manera es del orden de 100-200°K y, por
ende, la transición del comportamiento a bajas temperaturas al de altas temperaturas
debe ocurrir en este rango de temperaturas. Experimentalmente, se ha encontrado
que la teoría de Einstein satisface las observaciones en todas las temperaturas, excepto las bajas, en donde el comportamiento de T3 observado no se puede obtener. Por
lo general, los valores calculados de SE y los que se obtienen aplicando la expresión
teórica (6.2-8) a datos observados, también concuerdan con bastante exactitud. Evidentemente, la teoría de Einstein proporcionó una explicación mucho mejor de los
datos experimentales que la teoría clásica, a pesar de que la coincidencia con la
experiencia no es perfecta. La teoría de Debye, de 1912, permitió eliminar la discrepancia entre la teoría y Jos resultados experimentales a baja temperatura y mejoró la
aceptación general de Jos datos experimentales. En la teoría de Debye, se toman en
2 Véase
el capítulo 3, ejercicio 6.
186
Vibraciones reticulares y propiedades térmicas de los cristales
cuenta las interacciones entre los átomos que dan como resultado que exista un
rango de valores posibles de frecuencia vibratoria en lugar de un solo valor Wo,
como se describió en el capítulo 3.
6.3
TEORIA DE DEBYE SOBRE EL CALOR ESPECIFICO
La teoría de Debye sobre el calor específico, primeramente propuesta en
1912, 3 consideraba a los átomos de los cristales como osciladores que están acoplados y que pueden propagar ondas elásticas cuya frecuencia varíe sobre un amplio
rango de valores, como lo predicen los cálculos del capítulo 3. Aunque todavía se
obtienen algunos resultados que son aproximaciones, se encontró que eran superior
al modelo de Einstein en lo que respecta a las predicciones sobre el calor específico
de substancias en la región de temperaturas bajas. Además, proporcionó una base
para varias investigaciones subsecuentes más detalladas.
Puesto que de acuerdo con lo anterior, los átomos del cristal no vibran independientemente unos de otros, es más conveniente trabajar con los modos normales
de vibración del sistema, que con el movimiento vibratorio de un solo átomo. Ya se
vio (en la sección 3.3 y el ejercicio 7, capítulo 3), que para una cadena lineal
unidimensional de N átomos, existen esencialmente N modos normales de vibración.
En el caso de un cristal tridimensional de N átomos, cada átomo puede vibrar
independientemente a lo largo de las tres direcciones de las coordenadas, de manera
que, para este sistema, se tienen 3N modos normales posibles. Puesto que cualquier
movimiento vibratorio del sistema se puede considerar como una superposición de
vibraciones independientes de modo normal, los modos normales se pueden tomar
como oscilaciones armónicas independientes cuyos niveles de energía permisibles están dados por (6.2-1) y cuya energía promedio está dada por (6.2-4), a condición de
que el número de modos normales excitados estén distribuidos en cuanto a energía
de acuerdo con la ley de distribución de Maxwell-Boltzmann.
Supóngase ahora que en un rango de frecuencia dw alrededor de la frecuencia
w, existen g( w) dw modos normales de vibración del cristal. En consecuencia, la
cantidad g(w) debe representar el número de modos normales por unidad de frecuencia a la frecuencia w. El aumento de la energía vibratoria interna del cristal,
producido por estos modos de vibración, está dada por
dU = (e(w))g(w) dw
(6.3-1)
en donde (e(w)) es la energía promedio de un modo de vibración de frecuencia w,
según lo establece la fórmula (6.2-4). Es más conveniente calcular el número de
modos normales g(k) dk en un intervalo dk alrededor del número de onda k, y,
puesto que dk = (dk/dw)dw (6.3-1) se puede escribir como
dk
dU = (e(w(k)))g(k) dk = (e(w))g(k)- dw.
dw
(6.3-2)
Para calcular g(k), sea un cristal rectangular cuyas dimensiones son (Lx, Ly, Lz)
y supóngase que el origen se encuentra en un vértice del cristal, y que los bordes
del cristal coinciden con los ejes + x, +y y + z. Las ecuaciones de movimiento de
~ P
lkhyc, Ann. Physik 39, 789 (1912).
Teoría de Debye sobre el calor específico
187
la amplitud mecánica vibratoria u(x, y, z, t), conduce entonces a soluciones vibratorias de la forma
(6.3-3)
Si a la expresión (6.3-3) se aplican las condiciones periódicas de frontera de la
forma
u(L",y,z,t) = u(O,y,z,t)
u(x,L,,z,t) = u(x,O,z,t)
(6.3-4)
u(x,y,L.,t) = u(x,y,O,t)
k" = 21tnxf L"
k,= 21tn,JL,
(6.3-5)
en donde nx, ny, nz son enteros positivos o negativos. Los valores permisibles
(kx, ky, kz), a los cuales corresponde un solo modo normal de vibración que satisfacen las condiciones periódicas de frontera, se pueden graficar como puntos en un
espacio k ortogonal, como el que se ilustra en la figura 6.2. Los modos normales
permisibles forman una red ortorrómbica simple en este espacio, siendo las dimensiones de la célula unitaria (2rr/Lx, 2rr/Ly, 2rr/Lz).
Figura 6.2.
Superficies esféricas corre~pondientes a valores constantes de la constante de propagación k Y k +dk, graficadas en un sistema de coordenadas (kx, k y, kz)·
Si las dimensiones del cristal Lx, Ly, Lz son lo suficientemente grandes, la
célula unitaria se hará pequeña y los puntos que representan los modos normales
permisibles se amontonarán en un modo muy semejante al diagrama que aparece en
188
Vibraciones reticulares y propiedades térmicas de los cristales
la figura 6.2. En este caso, se puede calcular g(k) dk, evaluando el volumen del
espacio k entre la superficie esférica de radio k
(6.3-6)
que es el lugar geométrico de todos los puntos correspondientes al número de onda
k, y otra superficie esférica de radio k + dk, que es el lugar geométrico de todos los
puntos cuyo número de onda es k+ dk. El volumen requerido es, sencillamente, el
comprendido entre las dos esferas de la figura 6.2 o 47Tk 2 dk. El número de modos
normales permisibles se obtiene dividiendo esta cantidad entre el volumen de la
célula unitaria correspondiente a un solo modo normal del sistema. Este volumen es
87T 3 f(LxLyLz) = 87T 3 /V, en donde V es el volumen del cristal. Este procedimiento da
como resultado el valor
k2V
g(k) dk = - 2 dk.
2n
Sin embargo, existen en realidad tres modos normales independientes para cada
punto permisible en el espacio k, uno correspondiente a una vibración longitudinal
(que ya se vio antes) y los otros dos que corresponden a dos vibraciones transversales mutuamente ortogonales que, hasta ahora, no se han considerado en este análisis. Para tomar en cuenta esas posibilidades, el lado derecho de la ecuación anterior
debe multiplicarse por un factor de 3, lo cual da finalmente
3k 2 V
2n
g(k) dk = - - 2 dk.
(6.3-7)
En este punto, se desearía utilizar alguna relación como la (3.3-7) que expresa
la variación de k como una función de w para una red monoatómica, encontrando
dk/dw y substituyendo los resultados junto con (6.3-7) y (6.2-4) en (6.3-2), e
integrando finalmente sobre w. Born y von Karman, 4 fueron los primeros en delinear este procedimiento. Desafortunadamente, la forma matemática de la ecuación es
tal que la expresión resultante es demasiado compleja y no se puede integrar en
forma cerrada o manejarse numéricamente de un modo conveniente. Para contrarrestar esta dificultad, Debye aproximó la función sinusoidal (3.3-7) escribiéndola como
una función lineal:
w(k) = v0 k
(6.3-8)
en donde v0 es una velocidad de fase (constante) la cual, en principio, es igual a la
velocidad del sonido de onda larga en el cristal. En realidad esto es, lo que indica (3.3-7)
con respecto a longitudes de onda lo suficientemente grandes para satisfacer la condición ka~ 1T, pero Debye utilizó la función para describir el comportamiento de
todas las vibraciones que se pueden propagar dentro del cristal.
La integración sobre w indicada en (6.3-2) se realiza entre los límites cero y
una frecuencia máxima Wm que se escoge de tal forma que el número total de
modos normales de frecuencia menores que Wm deben ser justamente 3N, ya que se
sabe que éste es el número real de modos normales que existen para un cristal de N
átomos. 5 Existe un número de onda km correspondiente a Wm y todos los modos
4 M.
Born T. von KJrman, Physikalische /eitschrift U, 297 (1912).
5 Si hubiera sido posible usar una exprc~ión exacta para relacionar w y k, la integración se
habría desarrollado dentro de los límites de la primera zoua de Brillouin. Esto habría garanti!.ado que se hubiera satisfecho automáticamente la condición de que el número total de modos
fu <'SC igual a 3N
Teoría de Debye sobre el color específico
189
nonnales para los que k< km tienen frecuencias w < Wm, de acuerdo con (3.3-7) o
(6.3-8). Por tanto, debe haber solamente 3N modos nonnales de oscilación dentro de
una esfera de radio km en el espacio k. Puesto que el volumen del espacio k
ocupado por un solo modo normal es 81r 3 /3 V, se puede escribir
8n 3
4
-nk 3 = 3N · 3 "'
3V
o bien
(6.3-9)
por lo cual, utilizando la aproximación de Debye (6.3-8),
W 111
= Vokm = v0 (6Nn 2 /V) 113 •
(6.3-10)
La variación de w en función de k, de acuerdo con la aproximación de Debye,
se ilustra y se compara con el valor dado por (3.3-7) en la figura 6.3. En (6.3-10)
"'
Figura 6.3.
La verdadera relación de dispersión (curva continua) y la relación de dispersión
(curva punteada) de acuerdo con la aproximación de Debye.
se supone que la velocidad v0 es la misma para ondas elásticas longitudinales y
transversales. Por lo general, esto no es cierto; pero la diferencia no es siempre lo
suficientemente grande para que afecte el resultado final de un modo significativo.
Si ahora se substituye (6.2-4) y (6.3-7) en (6.3-2), utilizando (6.3-8) siempre
que sea necesario expresar k en función de w, e integrando desde cero hasta Wm, se
obtiene
(6.3-11)
La integral del primer término anterior se evalúa fácilmente y origina en el
punto cero un aumento de la energía interna el cual, por otra parte, es independiente de la temperatura y no modifica en nada el calor específico. La integral del
segundo ténnino no se puede evaluar en fonna exacta; pero se solucionará numéricamente.
190
Vibraciones reticulares y propiedades térmicas de los cristales
Por lo general, se acostumbra expresar estos resultados en una forma algo
diferente. Si se hace que
(6.3-12)
x = hwfkT,
x
liv (6Nn
)
= liwm /kT = ~
kT -V2
m
113
(6.3-13)
y
(6.3-14)
entonces, (6.3-12) se puede escribir en la forma
9
(T) fa¡T e-1
x dx
U=-Nk0+9NkT 0
8
"
3
3
-x-·
(6.3-15)
0
Como se puede ver, el parámetro e tiene las dimensiones de la temperatura y
desempeña el papel de una temperatura característica en ( 6.3-15) más o menos en la
misma forma que lo hace la temperatura de Einstein en (6.2-8). e se conoce generalmente como la temperatura de Debye. Por supuesto, es independiente de la temperatura, excepción hecha de la ligera variación de temperatura introducida por el
cambio de V y de v0 al cambiar la temperatura.
Al derivar (6.3-11), con respecto a la temperatura, se puede determinar la
capacidad térmica y se demuestra fácilmente que el resultado es
(T)3 fa¡T
x4ex dx
o (ex- 1)2.
31i2V f"'m w4e~"'/kT dw Cv- 2n2v~kT2 o (e~"'/kT- 1)2- 9Nk 0
(6.3-16)
La integral de (6.3-16), que es una función exclusiva de e¡T, se puede evaluar
de un modo númerico dando una función cuya gráfica se ilustra en la figura 6.4.
A altas temperaturas T~ e y el término exponencial de la expresión central de
(6.3-16) se pueden ampliar al igual que se hizo en relación con (6.2-8), obteniéndose
una expresión que se puede integrar fácilmente; a continuación, usando (6.3-10) se
puede demostrar que se obtiene el resultado clásico eV = 3Nk. A bajas temperaturas,
3Nit
v
~------------------
~~0~-----0~5--------~----~15-------2~0 ~8
Figura 6.4.
La capacidad térmica de un sólido monoatómico aislador, de acuerdo con la teoría
de Debye, graficada en función de la variable de temperatura reducida T/e.
Teoría de Debye sobre el color específico
191
en la expreswn del lado derecho de ( 6.3-15), el límite de la integral se acerca a
infinito y, por los métodos de integración de contorno, se puede demostrar que la
integral definida resultan te es igual a rr4 115, dando
=e = 12n Nk(!.)
(au)
oT
s
e
4
V
3
(T ~E>).
(6.3-17)
V
Esto se conoce como la "Ley 'J'3 de Debye" y sus predicciones sobre los
calores específicos en la región de temperaturas bajas concuerdan aceptablemente con
los datos experimentales obtenidos con muchas substancias.
El valor de la temperatura de Debye se puede calcular a partir de (6.3-14), u
obtenerse experimentalmente seleccionando el valor de e con el que se obtenga la
mayor concordancia entre los datos experimentales y la expresión teórica (6.3-16).
Los valores calculados y los determinados de un modo experimental están casi siempre de acuerdo en el caso de substancias que obedecen las suposiciones hechas de
acuerdo con la teoría de Debye. Para los elementos metálicos más comunes, la
temperatura de Debye se registra generalmente en el rango de 150-450° K. Seitz 6
presenta una tabla de temperaturas de Debye y un análisis detallado de la concordancia entre los valores de la temperatura de Debye, calculados y determinados de
un modo experimental.
En un cristal, en el que los átomos no son todos idénticos, por ejemplo, el
NaCl, se pueden excitar vibraciones elásticas pertenecientes a modos ópticos o acústicos, y los resultados calculados mediante este procedimiento ya no se pueden
aplicar directamente en los cristales de este tipo. Sin embargo, los modos acústicos y
los ópticos se pueden utilizar por separado. Los modos acústicos se pueden manejar
mediante el procedimiento anterior, mientras que la variación de w con k para los
modos ópticos es, como lo ilustra por ejemplo la figura 3.11, tan pequeña, que generalmente se obtiene una aproximación bastante buena al considerar los modos ópticos como vibracione3 de una sola frecuencia dada por (3.4-10). Los modos ópticos se pueden tratar mediante el método de Einstein, desarrollado en la sección
anterior y los valores aportados por los modos óptico y acústico se combinan para
dar la capacidad calorífica total del cristal. Blanckman, 7 • 8 estudió con cierto detalle
éstas y otras modificaciones de la teoría primitiva de Debye, y llegó a la conclusión
de que en ciertos casos específicos, el procedimiento de Debye puede llevar a errores
notables y que en tales circunstancias, es mejor usar el procedimiento más exacto de
Born-von Karman.
Se suele pensar que una substancia metálica posee un gran número de electrones libres que pueden servir para producir en el metal un flujo de corriente al
aplicarle un campo eléctrico, lo cual explica la gran conductividad eléctrica de los
metales. Tomando esto como base, se podría esperar que los electrones libres adquirirían una energía cinética adicional cuando el cristal está cerca de una fuente
térmica externa y que debido a ello habría un aumento notable en el calor específico. En realidad, y contrario a lo esperado, este aumento es tan pequeño que se
puede pasar por alto a temperaturas mayores de aproximadamente 5° K. Por debajo
de esta temperatura, en los cristales metálicos se puede distinguir una variación lineal
del calor específico con respecto a la temperatura, que se debe efectivamente a los
electrones libres. La explicación de este comportamiento peculiar del calor específico
electrónico se dará en el análisis detallado que hace en el capítulo siguiente.
6 F. Seitz, Modern Theory o{ Solids, McGraw-Hill Book Co., Inc., Nueva York (1940),
páginas 110-111.
7 M. B1ackman, Z. Physik 86, 421 (1933).
8 M. Blackman, Proc. Roy. Soc. 148, 384 (1935); 159, 416 (1937).
192
Vibraciones reticulares y propiedades térmicas de los cristales
6.4
EL FONON
Hasta ahora el calor específico de materiales sólidos se ha estudiado en relacwn con osciladores armónicos cuánticos y la energía interna se ha calculado determinando el número de osciladores que hay en promedio en cada estado energético
permisible. Si las vibraciones de la red se pueden tratar de este modo, entonces
deben existir cuantos de energía vibratoria emitidos o absorbidos cuando ocurran
transiciones entre un estado cuántico y otro. Uno de los resultados de la mecánica
cuántica del oscilador armónico es que, a una aproximación de primer orden, las
transiciones ocurren sólo entre estados adyacentes del sistema;9 en otras palabras, en
tales transiciones, el número cuántico del oscilador puede cambiar sólo por ± l. De
acuerdo con esto, el cambio de energía ~E del oscilador correspondiente a la energía
del cuanto que se absorbe o emite, debe ser
~e = ~n · ñw =
± ñw
(6.4-1)
en donde w es la frecuencia del oscilador. El signo más de ( 6.4-1) se relaciona con
la absorción y el signo menos con la emisión.
Un cuanto de energía acústica de esta índole se denomina comúnmente fonón,
para guardar cierta analogía con el término fotón usado para un cuanto de energía
electromagnética. Un fonón se parece al fotón en que se debe considerar como algo
que tiene características tanto de onda como de partícula; de hecho, es muy posible
tratar la interacción entre dos fonones o entre un fonón y un electrón, como una
"colisión" de dispersión entre dos partículas. En efecto, el resultado de Debye para
el calor específico se puede obtener considerando las vibraciones reticulares del cristal como un gas de fonones. Puesto que los fonones son partículas no distinguibles,
se debe utilizar la función de distribución Bose-Einstein para describir la distribución
de partículas entre los estados energéticos del sistema y, dado que el número de
fonones del sistema no es constante con respecto a la temperatura, la forma que
toma la función de distribución es (5.6-9), en donde a= O.
El número de fonones en el rango de frecuencias dw, alrededor de w (correspondiente a un rango de energía dE alrededor de E= hw) es, entonces,
N(w) dw = g(w) dw
ehw/kT _ 1
(6.4-2)
en donde g( w) dw es el núm~:ro de vibraciones normales posibles del sistema dentro
del rango dw alrededor de w. No obstante, en (6.3-2) y (6.3-7), ya se sabe que
dk
3k 2 V dk
w
2n
g(w) dw = g(k) -d dw = -.2 -d dw.
w
(6.4-3)
Utilizando la aproximación de De by e ( 6.3-8) para expresar k y dk/dw en
función de w (6.4-2) se convierte en
3V
N(w) dw = -----z-3
2n v0 e
w 2 dw
hwfkT
- 1
•
(6.4-4)
9 Para una derivación de esta regla de selección véase R. B. Leighton, Principies of Modem
Physics, McGraw-Hill Book Co., Inc., Nueva York (1959), páginas 211-222.
Expansión térmica de los sólidos
193
El aumento de la energía interna correspondiente al rango de frecuencias dw
alrededor de w es, simplemente, la energía cuántica hw multiplicada por el número
de cuantos que haya en ese rango de frecuencias. Por tanto,
dU = e(w)N(w) dw = hwN(w) dw
3/iV
w 3 dw
= 21t2V~ eAw/kT _ 1 ·
(6.4-5)
Al integrar sobre todas las frecuencias permisibles desde cero hasta la frecuencia máxima de Debye Wm, se obtiene directamente el resultado (6.3-11). Por supuesto, el término de energía de punto cero no se obtiene cuando la energía interna se
calcula en esta forma, ya que la energía de punto cero no está relacionada de
ningún modo con la distribución de los fonones. Sin embargo, este término no
modifica el calor específico y los dos métodos conducen al mismo valor (6.3-16) del
calor específico; dicho resultado es de interés físico y accesible a la medición. En
consecuencia, el sistema se puede tratar como un conjunto de osciladores armónicos
distinguibles que obedecen a la estadística de Maxwell-Boltzmann o bien, como un
gas de fonones o cuantos de energía vibratoria, que no son distinguibles, y que
obedecen a la estadística de Base-Einstein.
6.5
EXPANSI ON TERMICA DE LOS SOLIDOS
La representación de un sólido como sistema de átomos que tienen la libertad
para vibrar alrededor de un arreglo periódico de posiciones de equilibrio, desarrollado
en las secciones anteriores, basta para explicar el comportamiento observado del
calor específico y, también, es suficiente para entender la expansión térmica de los
sólidos. No obstante, en este caso se encuentra que si los átomos del cristal son
simples osciladores armónicos ideales, no puede haber una expansión térmica en
absoluto, de acuerdo con el pensamiento de la mecánica clásica ni la cuántica, y que
el efecto total de la expansión térmica de un cristal real depende de la inarmonía de
las vibraciones de la red.
Este resultado se puede comprender cualitativamente considerando la energía
potencial de interacción entre átomos cercanos, que debe tener la forma de una
función de la distancia interatómica, como se ilustra en la figura 6.5. El mínimo en
la curva de energía potencial, en B, es la posición clásica de equilibrio del átomo en
cuestión cuando está en reposo. Si las fuerzas interatómicas fueran tales que el átomo al activarlo por excitación térmica vibrará alrededor de su posición de equilibrio, como un oscilador armónico clásico ideal, entonces la curva potencial sería una
parábola perfecta cuyo vértice se ubicaría en B. En un ''pozo'' de potencial de esta
naturaleza, el átomo ejecutaría vibraciones armónicas alrededor del punto de equilibrio B, las excursiones máximas a partir de dicho punto de equilibrio en ambas
direcciones serían iguales, y la distancia interatómica promedio (x} sería igual a la
.::onstante de red a temperatura cero, a. Así pues, no habría ninguna expansión
térmica en absoluto.
Sin embargo, en realidad, el cristal se desintegra al aplicarle una cantidad finita
de energía y, por tanto, el pozo potencial en el que vibran los átomos debe tener
.1proximadamente la apariencia que se ilustra en la figura 6.5. En este caso, aunque
es casi parabólico alrededor del punto mínimo B, el verdadero pozo se desvía cada
194
Vibraciones reticulares y propiedades térmicas de los cristales
t•
1-- Pozo P.arabólico que corresponde
¡
al OSCilador ideal armónico
~O~l¡---:~----t-----=:==~~~==~--- X
Energfa potencial del átomo
Niveles cuanticos permitidos
del oscilador inarmónico
Figura 6.5. Representación de la energía potencial de un solo atomo del cristal en tunción del
espaciamiento interatómico, ilustrando el papel de la componente inarmónica en la
expansión térmica.
vez más de la forma parabólica conforme aumenta 1a distancia que lo separa del
punto mínimo. Si el átomo tiene una energía e0 , como debe ser, de acuerdo con el
cuadro clásico, deberá vibrar entre los límites de amplitud extrema A y C, siendo las
vibraciones de naturaleza más bien inarmónica. No obstante, la distancia DC entre la
posición de equilibrio y la posición de máxima extensión es ahora mayor que la
distancia AD entre la postción de equilibrio y la posición de máxima compresión.
La distancia interatómica promedio <x> es, por tanto, mayor que la constante de red
a temperatura cero y se observa una expansión térmica. Se puede demostrar que esta
observación clásica del efecto lleva a la conclusión de que la expansión térmica
<x>- a es directamente proporcional a la temperatura o que el coeficiente de expansión térmica d(<x>- a)/dT es independiente de la temperatura. Esto concuerda bastante bien con lo observado en la mayoría de las substancias, en el rango de
temperatura ambiente o un poco por encima de ella.
No obstante, a temperaturas bajas, el coeficiente de expansión térmica observado en la mayoría de los materiales se hace mucho más pequeño que el valor
clásico y, en efecto, tiende a cero conforme la temperatura absoluta se acerca a
cero. También aquí la representación clásica se hace inaplicable y los átomos del
cristal deben considerarse como osciladores cuánticos y no como clásicos. Para calcular la expansión térmica, primero se debe resolver la ecuación de Schrodinger utilizando un potencial inarmónico (por lo general basta con modificar el potencial
armónico (4.12-6) mediante la adición de un término cúbico en x) para obtener los
niveles energéticos En y las funciones de onda correspondientes a este potencial
modificado y, a continuación, se debe encontrar el valor esperado <x>n para cada
estado energético permisible según (4.8-11). Entonces, la distancia interatómica, promediada sobre una distribución de Maxwell-Boltzmann, debe escribirse (en analogía
con (6.2-1)) como
L (x).e-•nlkT
(x) = •
Le tn/kT
•
(6.5-1)
Conductividad térmica reticular de los sólidos
195
en donde la suma se toma sobre todos los niveles de un oscilador inarmónico. Los
detalles de este procedimiento son muy complejos y no se presentarán aquí. El
coeficiente de expansión térmica calculado mediante este método se acerca a cero y
concuerda aceptablemente con los experimentos sobre un amplio rango de temperaturas.
6.6
CONDUCTIVIDAD TERMICA RETICULAR DE LOS SOLIDOS
La conducción de calor en los sólidos es un proceso en el que las vibraciones
de red desempeñan también un papel importante. En los cristales metálicos en los
que se tienen grandes concentraciones de electrones libres, éstos hacen aumentar
notablemente la conductividad térmica y, en efecto, constituyen el mecanismo principal para el transporte de energía térmica a través del cristal. El estudio de la
conductividad térmica electrónica en los metales se facilita realizándolo a la luz de la
teoría del electrón libre de los metales y, por tanto, se pospondrá hasta un capítulo
posterior. Sin embargo, en substancias no metálicas, el transporte de calor a través del
cristal se debe exclusivamente a las vibraciones de la red.
La conductividad térmica se define generalmente como una situación de flujo
térmico unidimensional, en la que hay una diferencia de temperatura t:1l' sobre una
distancia &, originando un flujo de calor /Y), en una superficie A dentro de un
tiempo !:J.t. La conductividad térmica es el coeficiente de proporcionalidad entre el
flujo de calor por unidad de área y el gradiente de temperatura. De acuerdo con
esta definición, se puede escribir
J
qx
1 AQ
AT
=--=-KA At
Ax'
(6.6-1)
en donde K es el coeficiente de conductividad térmica y Jqx el flujo de calor por
unidad de área o la densidad de corriente térmica. El signo menos es obligatorio, ya
que K se considera como una cantidad positiva; pues, con un gradiente de temperatura positivo se obtendría una corriente térmica negativa. Si se conserva la energía
térmica, la corriente térmica debe obedecer siempre a la ecuación de continuidad de
la forma
oTq"
aQ
V·J = - = - - .
q
ax
ot
(6.6-2)
Si se combinan (6.6-2) y (6.6-l), se puede ver fácilmente que la temperatura
(y, por ende, la energía térmica por átomo) debe obedecer a una ecuación diferencial de la forma
K o2 T
oT
~ ox 2 =a¡·
(6.6-3)
. Esta ecuación diferencial parcial es esencialmente la misma que la ecuación que
de~cnbe el tra~sporte por difusión de partículas móviles en un medio en el que
ex1~te .un gradiente de concentración. Difiere de la ecuación para la propagación
radiactiva (3.1-12) en que el lado derecho es la primera derivada con respecto al
tiempo Y no la segunda derivada. Sus soluciones características tienen un comporta-
196
Vibraciones reticulares y propiedades térmicos de los cristales
miento exponencial en lugar de armónico con respecto al tiempo, como se verá más
adelante en un capítulo posterior.
En un sistema compuesto de osciladores armónicos ideales, los diversos modos
normales de oscilación del sistema son completamente independientes los unos de
otros, no existiendo en absoluto ningún acoplamiento entre los diferentes modos
normales de vibración. Si se excita un modo normal dado de dicho sistema, éste
vibrará en forma estable en ese mismo modo normal durante un periodo indefinido.
En un sistema de este tipo, la energía de vibración se propaga directamente por
radiación acústica en lugar de hacerlo por un proceso mucho más lento que se
asocia con la conducción térmica. Así pues, la energía fluye a través del sistema con
la velocidad del sonido, y no existe un mecanismo mediante el cual se pueda hacer
aleatoria esta energía y mediante el cual se crea una resistencia térmica, de modo
que la conductividad térmica del espécimen es esencialmente infinita. Estas observaciones son aplicables a los osciladores cuánticos al igual que a los osciladores clásicos. Este estado de cosas se puede describir en función de los fonones mediante la
proposición de que los fonones correspondientes a diferentes vibraciones armónicas
de modo normal no interactúan entre sí en absoluto -o que su sección transversal
de interacciones mutuas es cero.
Si se introduce una pequeña inarmonía en dicho sistema, se produce un acoplamiento entre los diversos modos normales. En este caso, si en un principio se
excita un solo modo normal, la energía que inicialmente pertenece a este modo se
transferirá gradualmente a otros modos normales que pueda tener el sistema y, así.
quedará aleatorizada. En el lenguaje de los fonones, se puede decir que los fonones
que representan las diferentes vibraciones de modo normal del sistema, interactúan
(o chocan) unos con otros. En otras palabras, un grupo de fonones correspondientes
a un solo modo normal del sistema armónico interactúan (o dispersarán unos a
otros) de tal forma que, después de cierto tiempo, las cantidades de movimiento de
cada fonón y sus direcciones de propagación cambiarán de una manera esencialmente
aleatoria. La distribución de los fonones se convierte así, en una distribución que
representa una selección más o menos aleatoria de los modos normales del sistema.
dentro de las restricciones impuestas por la conservación de energía y la cantidad de
movimiento en las interacciones individuales.
De acuerdo con esto, es evidente que la conductividad térmica sería infinita.
de no ser por la inarmonía de las vibraciones de red. La fuerza de la componente
de inarmonía del potencial interatómico es, por tanto, un factor primordial en la
determinación de la conductividad térmica. Puesto que la magnitud de la inarmonía
aumenta de acuerdo con la amplitud de vibración, es de esperarse que la conductividad térmica disminuya conforme se incrementa esta amplitud, llegando a una reducción de la conductividad térmica de la red al aumentar la temperatura. Este
efecto se observa de un modo muy general en los experimentos efectuados a temperaturas lo suficientemente elevadas. Una medición inversa de la fuerza de la interacción inarmónica entre los átomos de cristal, está dada por la distancia promedio que
un fonón puede recorrer entre las colisiones aleatorizadoras o fenómenos de dispersión en que intervienen otros fonones. Esta distancia se conoce como la trayectoria
libre media para las interacciones fonón-fonón y la conductividad térmica de los
sólidos se puede entender con mayor facilidad sobre una base cualitativa en términos
de la trayectoria libre media. En secciones posteriores se tendrá la ocasión de analizar la trayectoria libre media de un modo más preciso y en una forma cuantitativa.
La conductividad térmica de los sólidos se comprenderá con mayor claridad
considerando al cristal como un recipiente que encierra un "gas" de fonones. Primero se desarrollará una fórmula para la conductividad térmica de un gas monoatómico ideal y luego se examinará cómo se puede aplicar a la red de un sólido
cristalino En primer lugar, se debe definir el número de partículas de un gas ideal
Conductividad térmica reticular de los sólidos
197
que tienen una velocidad en el rango de dv alrededor de v, que cruzan un elemento
de área dS por unidad de tiempo, desde una dirección que queda dentro del rango
angular d(J alrededor del ángulo polar fJ. Esta cantidad es la mitad del número
dentro del rango de velocidad en el interior de una columna cuya sección transversal
es dS cos (J (que es la proyección del área dS sobre un plano normal a la dirección
fJ) que queda a una distancia de v centímetros del elemento de área propiamente
dicho. Esta situación se ilustra en la figura 6.6. El factor un medio se incluye
porque, en promedio, sólo la mitad de las partículas dentro de la columna que va a
lo largo de la dirección (J, están encaminadas hacia el elemento de área, y el resto
va en dirección opuesta. Si n(v) dv es el número de partículas por unidad de volumen
que tienen la velocidad dentro del rango v alrededor de v, entonces, el número que
cruza el elemento de área es
dn = fv · n(v) dv ·
4n sen 9 d(J
• dS cos 9 = fvn(v) sen(} cos (} dv d(J dS.
41t
(6.6-4)
El factor asociado con sen (J anterior representa la relación del ángulo sólido
subtendido por d(J alrededor de O y e1 ángulo sólido 41T subtendido por todo el
espacio; es evidente que ese factor debe aparecer también en la expresión. Si se
integra sobre v utilizando la distribución Maxwell-Boltzmann (5.4-14) (y recordando
que la distribución de velocidad es independiente de fJ), se obtiene
n(9) d(J = fnc sen 9 cos (} d(J dS
(6.6-5)
con e dada por (5.4-20), como el resultado deseado.
En este punto conviene hacer notar que el problema de la conducción térmica
siempre implica un flujo de energía y un gradiente de temperatura, es decir que el
sistema en cuestión nunca se encuentra en un estado de equilibrio térmico. Por esta
razón, no es estrictamente correcto utilizar las funciones de distribución estadística
que se aplican a sistemas en equilibrio. Sin embargo, si el gradiente de temperatura
del sistema es tan pequeño que la variación fracciona! de la temperatura absoluta
sobre una trayectoria libre media es reducida, se justifica el uso de la distribución en
equilibrio como una aproximación. En todo caso, el problema se limitará aquí al
estudio de sistemas de esta naturaleza. La cuestión del uso de distribuciones estadísticas en sistemas que no están en equilibrio, se examina en el siguiente capítulo.
FJgUra 6.6.
Geometría de partículas que fluyen a través de un plano, usadas en el cálculo de la
sección 6.6.
198
Vibraciones reticulores y propiedades térmicas de los cristales
Por lo pronto, considérese la situación Ilustrada en la figura 6. 7. Se supone
que existe un gradiente de temperatura a lo largo del eje x, de tal manera que las
partículas en el origen tienen una energía promedio e y las que se encuentran a una
corta distancia hacia la izquierda tienen la energía promedio e+ &. Supóngase que
una partícula principia a una distancia 1 del origen y cede su energía a la distribu·
ción en el origen, en una colisión que se produce en ese lugar. De acuerdo con la
expansión de Taylor, la energía de esta partícula es
(6.6-6)
Por supuesto, para esta partícula se tendrá otra que va en dirección opuesta y
que transporta e energía desde el origen hasta el punto inicial de la primera partícula. El transporte neto de energía es & = (1 cose) (3ef3x ), y, puesto que el valor
promedio de 1 es simplemente la trayectoria libre media entre las colisiones aleatorias, que se denominará X, el transporte neto de energía por partícula, promediada
sobre la distribución de las longitudes de trayectoria 1, es
oe
e = (A. cos 8) ox.
(6.6-7)
Para partículas con un ángulo polar e, de acuerdo con ( 6.6-5) y ( 6.6-7), se
produce un flujo neto de energía !lF por unidad de área, en donde
!l.F =
!l.e · n(O) dO 1
oe
= - ncA.- cos 2 Osen O dO
dS
2
ox
.
(6.6-8)
Al integrar sobre el ángulo polar e entre los límites de O y 1r se puede ver
fácilmente que el flujo total de energía debe ser -tncX (3e/3x). No obstante, de
acuerdo con la definición de la conductividad térmica, K (6.6-l), esto debe ser igual
también a K (3Tj3x). De acuerdo con esto,
oT 1
oe 1
oe oT
K - =-nCA.- =-nCA.- - ,
ax 3 ax 3 ar ax
• +Ó•
Figura 6.7.
(6.6-9)
•
Trayectoria de una partícula en un sistema que contiene un gradiente de temperatura en la dirección x.
Conductividad térmica reticular de los sólidos
199
por lo cual,
1
ae 1
K = - ncA. - = - e A.c
3
ar
3
u
•
(6.6-10)
de donde, por definición, el calor específico cv es n(oe/31).
Este resultado, que se acaba de derivar para un gas ideal de Maxwell-Boltzmann, es aplicable también a una distribución de fonones, a condición de que se
sobreentienda que la velocidad e se refiere a una velocidad promedio de fonón, esto
es, a una velocidad promedio de sonido dentro del cristal. [Se recordará que la
distribución de Boltzmann se utilizó sólo para velocidades promedio al obtener
(6.6-5).] Entonces, de acuerdo con (6.6-10), el problema de determinar la conductividad térmica de red se puede reducir esencialmente a la determinación de la trayectoria libre media de los fonones en el cristal, ya que la velocidad del sonido y el
calor específico se pueden medir o calcular con facilidad. Desgraciadamente este
problema no es tan sencillo. Reproducir el trabajo comprendido en su cálculo queda
más allá del alcance de este libro. Peierls,l 0 fue el primero en resolver este problema, y encontró que X es proporcional a 1/T a temperaturas elevadas y a eE>/lT a
temperaturas bajas. De acuerdo con esto, la conductividad térmica se deberá hacer
infmitamente grande conforme la temperatura se acerca al cero absoluto, ya que el
producto de Cv y X divergirá al infmito en este límite. Sin embargo, en realidad, a
temperaturas muy bajas la trayectoria libre del fonón deja de estar limitada por las
interacciones fonón-fonón y se ve limitada, por el contrario, por la dispersión de
fonones mediante impurezas e imperfecciones en el cristal o bien, en cristales muy
puros, por las superficies de la misma muestra de cristal. ¡En este último caso, se ha
encontrado que la conductividad térmica del cristal es una función del tamaño de la
muestra! En cualquier caso, la trayectoria libre media tiende a un límite finito
conforme T se acerca a cero, y la conductividad se acerca a cero conforme T tiende
a cero, debido al hecho de que Cv se desvanece en el límite de la temperatura cero.
Entonces, al incrementarse la temperatura la conductividad térmica aumenta de cero
a cierto valor máximo y luego disminuye conforme la temperatura se incrementa
más todavía. Este comportamiento cualitativo se ha observado, efectivamente, de un
modo experimental en la mayoría de los casos y las magnitudes de los valores
calculados ( 6.6-1 O) a partir de los valores calculados de X, concuerdan con los datos
experimentales en el orden de magnitud. Casimir 11 fue el primero en estudiar el
efecto de la dispersación a través de las fronteras del cristal, y Klemens 12 fue quien
trató detalladamente el efecto de ciertos tipos de imperfecciones.
EJERCICIOS
l. Demuestre de un modo explícito, utilizando la estadística de Maxweli-Boltzmann, que la
energía promedio de un oscilador armónico clásico tridimensional es sencillamente tres veces la
de un oscilador armónico clási.::o unidimensional a la misma temperatura y que, por tanto, no
unporta si el cristal de N átomos se considera como un conjunto de N osciladores tridimensionales o bien, como 3N osciladores unidimensionales.
2. Calcule, por el método de Debye, la capacidad calorífica de una red cristalina periódica
bidimensional que contiene N átomos idénticos, y demuestre que a temperaturas bajas, la capacidad calorífica varía con la temperatura como 'J'2. ¿Cuál es el límite en alta temperatura para la
capacidad térmica?
lO R. Peierls, Ann. Physik 3, 1055 (1929).
11 H. B. G. Casimir, Physica 5, 495 (1938).
12 P. G. Klemens, Proc. Roy. Soc. A208, 108
(1951).
200
Vibraciones reticulares y propiedades térmicas de los cristales
3. Calcule la temperatura de Debye 8 para (a) diamante, (b) germanio, (e) cobre y
(d) plomo, y compare sus resultados con Jos valores publicados derivados de los datos experimentales de la capacidad térmica.
4. Utilice la relación de Planck para expresar la energía de un fonón en relación con su
frecuencia y la relación de De Broglie para expresar la cantidad de movimiento en función del
número de onda; encuentre una expresión para la "masa" equivalente de un fonón de energía
térmica promedio a 300° K, y compare este valor con la masa electrónica. Puede suponer que k
es tan pequeña que se puede hacer caso omiso de Jos efectos de dispersión.
S. Demuestre que el valor promedio <x>n de la amplitud de un oscilador armónico cuántico, en el nésimo estado de energía, es cero.
6. Utilice las leyes de la termodinámica para demostrar que la difer~::ncia entre el calor
específico de una substancia a presión constante y a volumen constante está dada por
9oc 2 VT
Cp-Cu = - - -
K~oo
en donde a es el coeficiente lineal de expansión y Kiso es la compresibilidad isotérmica - V-1
(iW/aP>r· Nota: Observe que, de acuerdo con las relaciones de Maxwell (os/aP)r=-(av¡aT)p.
7. Sea un conjunto de N sistemas idénticos que tienen sólo dos niveles de energía, a las
energías cero y € 0 . Suponiendo que los sistemas son distinguibles, encuentre (a) la energía
interna del conjunto, (b) la capacidad térmica, (e) las expresiones aproximadas para la capacidad
térmica en los límites de temperatura alta y baja. Grafique la capacidad térmica en función de la
temperatura.
8. Para el conjunto de sistemas que se vio en relación con el ejercicio 7, demuestre que la
capacidad térmica alcanza un valor máximo a una tt.>mperatura T 0 para la que
xtanhx=l
en donde x =e0 /2kT. Demuestre también que la capacidad térmica a esta temperatura está dada
por
c. (max) = Nk (x~ - 1)
en donde X o = e0 /2kT0 • Las contribuciones a la capacidad térmica de sistemas de esta naturaleza, se encuentran con frecuencia a temperaturas bajas en substancias paramagnéticas y se conocen también con el nombre de anomalías de Schottky.
9. De acuerdo con la expresión de la mecánicd cuántica e=<1 +nx +ny +nz)hvo (en
donde nx, nY. y nz pueden ser cero o enteros positivos) para los niveles de energía de un
oscilador armónico tridimensional, demuestre, en el límite de las energías grandes en donde
e>% y de:lil>%, que el número de estados cuánticos dentro de un rango de alrededor de la
energía e, está dado por g(e) de= e2de/2(flwo) 3 •
10. Utilice el resultado del problema 9 para demostrar que la expresión (e)= 3kT para la
energía promedio de un oscilador armónico clásico tridimensional de un sistema cuyos miembros
están distribuidos en energía de acuerdo con la ley de Boltzmann, se puede obtener sencillamente evaluando la expresión
fef(e)g(e) de
(e) =
Jt(e)g(e) de
Compare críticamente los aspectos físicos de este método y el que se utilizó para obtener el
mismo resultado en la sección 6.1.
REFERENCIAS GENERALES
P. G. Klemt'ns, Thermal Conductivity and Lattice Vibrational Modes, en Salid State Physics,
Advances in Research and Applications, Vol. 7, Academic Press, Nueva York (1959), pp.
l-98.
Conductividad térmica reticular de los sólidos
201
1. de Lannay, The Theory of Specific Heats and Lattice Vibrations, en Salid State Physics,
Advances in Research and Applications, Vol. 2, Academic Press, Nueva York (1956), pp.
219-303.
LB. Leighton, Principies of Modern Physics, McGraw-Hill Book Co., Inc., Nueva York (1959),
capítulo 6.
1l. B. Peierls, Quantum Theory o[ Solids, Clarendon Press, Oxford (1955), capítulo 11.
f Seitz, Modern Theory of Solids, McGraw-Hill Book Co., Inc., Nueva York (1940), capítulo Ill.
CAPITULO
7
Teoría del electrón
libre de los metales
7.1
INTRODUCCION
En 1900, Drude 1 fue el primero en formular la hipótesis de que la gran
conductividad eléctrica y térmica de las substancias metálicas podría explicarse debido a la presencia de grandes concentraciones de electrones libres móviles en estos
materiales. Más tarde, Lorentz 2 investigó exhaustivamente las implicaciones de esta
idea. Drude y Lorentz supusieron que los electrones libres de un metal podían
considerarse como un gas ideal de partículas libres, el cual obedece a la estadística
de Maxwell-Boltzmann, cuando se encuentra en equilibrio térmico. Para examinar lo
que puede suceder cuando se permite el flujo de corrientes eléctricas o térmicas,
estableciéndose así un estado de desequilibrio, fue necesario investigar cómo se modificaría la distribución de equilibrio mediante una (pequeña) corriente eléctrica o
térmica. También fue necesario estudiar el comportamiento cinético de los electrones
como el de partículas libres sujetas a colisiones instantáneas que sirven para volver la
distribución a una condición de equilibrio, y para expresar el resultado final de la
conductividad eléctrica y térmica en términos de una trayectoria libre media o tiempo libre medio entre estos choques aleatorios. La teoría Drude-Lorentz explicó satisfactoriamente la ley experimental bien conocida de Wiedemann y Franz, 3 según la
cual la relación existente de la conductividad eléctrica a la térmica es casi la misma
para la mayoría de los metales. Además, para calcular las magnitudes de la conductividad eléctrica y térmica se podrían utilizar los valores más elevados para la trayectoria libre media.
Sin embargo, la teoría del electrón libre en su forma más sencilla llevó a una
predicción de la componente electrónica del calor específico que (suponiendo que la
teoría de Debye para el componente reticular esté en lo correcto) estaba en gran
desacuerdo con los resultados experimentales. Sommerfeld4 resolvió esta dificultad
Uunto con algunas otras) utilizando la estadística de Fermi-Dirac en lugar de emplear
la estadística clásica de Boltzmann. La representación del electrón libre empleando la
estadística de Fermi-Dirac constituye una forma teórica muy directa y sencilla de
analizar y entrever los efectos de transporte en los metales. Puesto que principia con
una idea preconcebida del aspecto de un metal, no tiene ningún valor para explicar
1 P. Drude,
Ann. Physik 1, 566 (1900).
2 H. A. Lorentz, The Theory of Electrons, Teubner Verlag, Leipzig
3 Wiedemann y Franz, Ann. Physik 89, 497 (1853).
4 A. SommerfeJd, Z. Physik, 47, 1 (1928).
203
(1909).
204
Teoría del electrón libre de los metales
por qué algunas substancias son metales y tienen electrones libres en abundancia y
otros son aisladores con sólo unos cuantos electrones libres, si es que los tienen.
Para encontrar una explicación a estas cuestiones fundamentales, es necesario comenzar examinando el comportamiento mecánico cuántico de los electrones en los campos periódicos de potencial, examinando el mismo tema en un nivel mucho más
fundamental. El último planteamiento se pospondrá hasta el siguiente capítulo, en el
que se demostrará que las propiedades de los metales y los aisladores se pueden
comprender de acuerdo con la teoría cuántica, y que las bases en las que descansa
la teoría del electrón libre son, en su mayor parte, compatibles con los requisitos de
la mecánica cuántica.
7.2
LA ECUACION DE BOLTZMANN Y LA TRAYECTORIA
LIBRE MEDIA
En cualquier problema de mecánica estadística, lo más importante es conocer
la forma de la función de distribución. Por supuesto, en un sistema de equilibrio
térmico, la función de distribución será una de las que ya se estudiaron en el
capítulo 5, pero si el estado del sistema no es de equilibrio (por ejemplo, si fluye
una corriente o hay un gradiente de temperatura), la función de distribución será
algo distinta. Naturalmente, en el límite en que desaparece la perturbación de la
condición de equilibrio, la función de distribución de desequilibrio debe aproximarse
a la distribución de equilibrio apropiada. Entonces, para cualquier estudio estadístico
de procesos en desequilibrio debe darse un paso preliminar que consiste en la determinación de una forma para evaluar la función de distribución cuando el sistema se
encuentra en un estado de desequilibrio. Esto se logra mediante la ecuación de
Boltzmann.
Para deducir esta ecuación, debe considerarse una región de espacio de fase
alrededor del punto (x,y,z,px,Py.Pz). El número de partículas que entra en esta
región en el tiempo dt, es igual al número de las que estaban en la región del
espacio de fase en (x- Vxdt, y - Vydt, z - Vzdt, Px - Fxdt, Py - Fydt, Pz - Fzdt) en
un tiempo anterior dt. En este caso, F representa la fuerza que actúa sobre las
partículas de la distribución en el punto (x, y, z) y el tiempo t, y se sigue de la ley
de Newton, F = dpfdt. Si f(x, y, z, Px• Pv• Pz) es la función de distribución que expresa el número de partículas por estado cuántico en la región, entonces, habrá un
cambio df que ocurre durante el tiempo dt, debido al movimiento de las partículas
en el espacio de las coordenadas y debido a que los campos de fuerza que actúan
sobre las partículas tienden a moverlas de una región a otra en el espacio de la
cantidad de movimiento; este cambio df es
df = f(x- v"dt, y- v,dt, z - v.dt, Px- F"dt, p1 - F,dt, Pz- F.dt)
- f(x,y,z,p",p,,p.).
(7.2-1)
Utilizando la expansión de Taylor y manteniendo sólo los términos de primer
orden dentro del límite dt ~O, esta expresión se puede escribir como sigue
La ecuación de Boltzmann y la trayectoria libre media
205
o bien,
df
= -v ·
dt
-
vrF ·V f
J
(7.2-2)
p '
en donde el símbolo VP se refiere al operador del gradiente en el espacio de cantidad de movimiento (px, Py. Pz). Hasta ahora sólo se ha explicado el cambio en la
función de distribución debido al movimiento de las partículas en el espacio de las
coordenadas y debido a los cambios en la cantidad de movimiento originados por los
campos de fuerza que actúan sobre las partículas. Las partículas también se pueden
~ransferir hacia dentro o hacia afuera de una región dada del espacio de fase, por
medio de colisiones o interacciones de dispersión que abarcan otras partículas de la
distribución o centros de dispersión externos al conjunto de partículas que se están
estudiando. Si la velocidad de cambio de la función de distribución debida a las
colisiones o a la dispersión se representa mediante (a¡;at) col• entonces, la velocidad
total de cambio de f se puede obtener sumando esta cantidad al lado derecho de
(7.2-2), lo cual da
# = -v•Vf-F·VPJ+
dt
(~)
at
(7.2-3)
col
Esta es la ecuacton de Boltzmann. Si se conoce el campo de fuerza F y la
velocidad de cambio (a¡;at) col• de la ecuación diferencial (7.2-3), en principio, se
puede despejar la función de distribución.
Por supuesto, a fin de hacer esto se debe adoptar para la interacción de
dispersión algún modelo que pueda proporcionar la velocidad a la que las partículas
a consecuencia de colisiones pueden entrar en cualquier región dentro del espacio de
fase a salir de ella. Por ejemplo, se pueden suponer condiciones de estado estacionario que indican que df/dt =O, y, además, especificar que no existen campos de
fuerza que actúen sobre las partícula~ y que las partículas de la distribución son
esferas duras, perfectamente elásticas y de un radio dado, que sufren colisiones que
pueden tratarse mecánicamente de acuerdo con las leyes clásicas del movimiento,
para obtener un valor promedio para (a¡;at) col· Este cálculo mecánico proporciona
fundamentalmente una sección transversal de la dispersión de una partícula de la
distribución. En este caso, se puede demostrar que la ecuación de Boltzmann lleva
directamente a la distribución Maxwell-Boltzmann del capítulo 5.
La ecuación de Boltzmann se usa más comúnmente para analizar las propie·
dades de un sistema que se encuentra desplazado del estado de equilibrio debido a
una fuerza perturbadora pequeña -por ejemplo, un campo eléctrico o un gradiente
de temperatura- cuando se conoce la función de distribución / 0 , que es la función
de distribución en equilibrio, cuando no hay perturbación. En estos casos, con frecuencia se supone que el término de la colisión tiene la forma
(-a¡) -_-f-- -Jo
at
col
(7.2-4)
T
en donde T es un parámetro denominado tiempo de relajación o tiempo libre medio.
L~ ecuación (7.2-4) representa la velocidad a la que la función de distribución se
acerca a la condición de equilibrio (habiéndose eliminado repentinamente la fuerza
de perturbación), siendo proporcional en cualquier tiempo a la desviación, desde el
equilibrio.
206
Teoría del electrón libre de los metales
Por ejemplo, suponga que un campo eléctrico E0 ongma una corriente en un
circuito que se compone de una substancia metálica uniforme, de tal modo que f es
la misma en todos los puntos y, por ende, Vf = O. Mientras el campo se aplica, la
fuerza F de (7.2-3) debe representarse como -eE0 ; pero si el campo se suprime de
un modo repentino, por ejemplo, cuando t =O, entonces, para valores positivos de t,
F = O, y la ecuación de Boltzmann, utilizando la aproximación del tiempo de relajación (7.2-4), se convierte en
f-fo
=---
(t >O)
(7.2-5)
que se puede resolver fácilmente y se obtiene
f- fo = (const.)e-'1'
(t > 0).
(7.2-6)
Así es como la función de distribución se aproxima exponencialmente junto
con la constante de tiempo 7, a la función de distribución en equilibrio y se descubrirá
que la corriente del circuito disminuye de su valor inicial esencialmente en la misma forma, tendiendo a cero exponencialmente con la constante de tiempo 7.
A primera vista, este resultado parece contradecir la evidencia experimental;
pero en realidad no se opone a ella, ya que la constante de decaimiento 7 en
circunstancias ordinarias, es muy corta, casi siempre del orden de 1o- 13 segundos.
Un estudio más cuidadoso puede ayudar a verificar la factibilidad de (7.2-6), ya que
la acción del campo eléctrico es darle a los electrones del circuito una velocidad de
arrastre en dirección opuesta a la corriente que, de acuerdo con la ley de la inercia,
debe persistir durante un corto tiempo después de la supresión de la fuerza, hasta
que los electrones del conductor pasen los procesos que aleatorizan su velocidad
reduciendo la velocidad promedio de arrastre a cero. Es evidente que las colisiones
ejercen influencia en una distribución que es perturbada de un modo u otro, pero
tiende a restaurarse al estadd de equilibrio y, si dicha perturbación se suprime, esta
restauración se logra en un tiempo del orden del tiempo de relajación 7. Los detalles del
proceso de dispersión determinan el tiempo de relajación que, en general, es una función de la energía, debido a que la sección transversal de la dispe1sión puede depender
de la energía.
Este efecto de restricción de las colisiones es esencial para determinar la ley
que relaciona la densidad de corriente con el campo eléctrico en un conductor
ordinario. Si un sistema que contiene electrones perfectamente libres recibe la influencia de un campo eléctrico constante, sin que hayan colisiones, los electrones
sometidos a una fuerza constante adquieren una aceleración constante y, por tanto,
una velocidad linealmente creciente. Por consiguiente con un campo dado, la densidad de corriente en un conductor largo sería mayor que en uno corto, ya que la
velocidad promedio de los electrones principiando en repo'so en un extremo y fluyendo hacia el otro, sería mayor en la trayectoria más prolongada que en la más
corta. Por supuesto, esto no es lo que sucede en absoluto. En realidad, un electrón
que principia en reposo es acelerado por un campo y adquiere una velocidad de
arrastre que aumenta linealmente durante un corto tiempo; pero a continuación sufre
una colisión que (en promedio) reduce su velocidad de arrastre a cero y el proceso
se repite. Durante un periodo dado, al electrón puede asignársele una velocidad de
a"astre constante promedio, proporcional al campo e inversamente proporcional al
tiempo de relajación. Esto lleva a la ley de Ohm, según la cual la densidad de
corriente es proporcional a la fuerza del campo eléctrico. Se puede hacer una estimación aproximada de la conductividad basándose en esos datos. La fuerza ejercida
La ecuación de Boltzmann y la trayectoria libre media
207
sobre un electrón es -eE0 , en donde E 0 es el campo aplicado, por lo que la
aceleración es -eE0 /m, siendo m la masa del electrón. Si la fuerza actúa durante el
tiempo t, produce una velocidad de arrastre -eE0 t/m y si el tiempo promedio que
hay entre las colisiones aleatorias es 7, la velocidad de arrastre promedio está dada
por
_
eE0 r:
V=---,
2m
(7.2-7)
suponiendo, por supuesto, que la velocidad de arrastre se ha reducido a cero en
promedio de bido a una colisión. Si la densidad de electrones libres es n 0 , la densidad de corriente I será, por definición,
(7.2-8)
en donde la conductividad se expresa mediante
(7.2-9)
La ecuación (7.2-8) es, sencillamente, la ley de Ohm; este simple planteamiento en
el que se hace caso omiso de los promedios, da un valor de 7 demasiado pequeño al
multiplicarlo por 2, como se verá en breve.
El hecho de considerar el tiempo de relajación 7 como el tiempo libre medio
entre las colisiones aleatorias, se puede explicar si se analiza un grupo compuesto
inicialmente de n 0 partículas, en el tiempo t = O, cada una de las cuales puede sufrir
una colisión que aleatoriza por completo su velocidad con una probabilidad dt/7 en
cualquier intervalo de tiempo dt. Suponga que en el tiempo t, quedan n(t) partículas
que todavía no han tenido un choque. El número de partículas que chocan en un
tiempo dt, con respecto a t es, en promedio, n(t'ylt/7, de modo que,
dn(t)
n(t)
-dt- = - 1:-
(7.2-10)
al integrarse (haciendo que n = n 0 a t = 0), da
(7.2-11)
El número de partículas existentes en el grupo original decae exponencialmente, volviendo a la distribución de equilibrio de acuerdo con (7.2-11). Este es
exactamente el comportamiento que predice la ecuación de Boltzmann en la aproximación del tiempo de relajación (7.2-6). Es más, la distribución de los tiempos
libres, de acuerdo con (7.2-11), también es exponencial, en tal forma que el número
de tiempos libres dn(t) en un intervalo dt con respecto a t es
no
1
dn(t) =-e-'
• dt.
1:
(7.2-12)
208
Teoría del electrón libre de los metales
El tiempo libre promedio se puede calcular del modo acostumbrado y esto da
t'"
f:
t dn(t)
Ia''" dn(t) =
J:
te-''' dt
(7.2-13)
e-r!< dt = T.
Entonces, se puede llegar a la conclusión de que la supostcwn de una probabilidad de colisión que es constante con el tiempo para una partícula dada, conduce
al mismo resultado que la aproximación del tiempo de relajación en la ecuación de
Boltzmann, y que el tiempo de relajación de esta ecuación es idéntico al tiempo
libre medio que hay entre colisiones. En el desarrollo anterior se supuso que basta
una sola colisión para hacer que la partícula vuelva a la distribución de equilibrio. Si
no es así (por ejemplo, si se requieren varias colisiones para aleatorizar por completo
la velocidad de una partícula), el tiempo de relajación se debe interpretar como algo
que se refiere al tiempo requerido, en promedio, para que una partícula adquiera
una velocidad totalmente aleatoria, a pesar de que ésta pueda ser muchas veces
mayor que el tiempo medio real entre colisiones.
En el estudio anterior se supuso que en el grupo inicial, todas las partículas
tenían la misma energía. Si la sección transversal de las colisiones varía con la
energía de la partícula incidente, como sucede a menudo, el tiempo de relajación
será diferente para cada valor de energía de partícula, y T será una función de la
energía. También es posible que el tiempo de relajación sea no isotrópico, variando
con la dirección del vector de la cantidad de movimiento de la partícula. Sin embargo, este estudio se limitará solamente al caso isotrópico en el que T puede ser
una función de la energía; pero no de la dirección.
La trayectoria libre media existente entre colisiones se puede definir en la
misma forma que el tiempo de relajación. Si la probabilidad para que una sola
partícula sufra una colisión al atravesar una distancia dx es el valor constante dx(A,
y si se tienen n(x) partículas de un grupo inicial en el que quedan n 0 después de
haber recorrido una distancia x, el número de partículas que choca en un intervalo
de trayectoria dx con respecto a x será n(x)dxj'll., por lo cual,
dn(x)
dx
n(x)
A.
--= --dx
(7.2-14)
•
Al igual que antes, esto lleva a
(7.2-15)
Nuevamente, la distribución de longitudes de trayectoria dn(x) dentro de un
intervalo dx alrededor de x es, pues,
dn(x) =no e-x/A dx
(7.2-16)
).
y la trayectoria libre media está dada por
_
L"'xdn(x)
X =
·---
t"'
---- =
dn(x)
f
,.,xe-x1Adx
0
.
--- A
L'"
e-x/A dx -
.
(7.2-17)
Conductividad eléctrica de un gas de electrones libres
209
La cantidad A que, como se vio antes, es la recíproca de la probabilidad de
.-:olisión por unidad de distancia, se denomina trayectoria libre media.
La trayectoria libre media se define también en relación con un grupo de
partículas que tienen, todas ellas, la misma energía inicial y que en general debe
.-:onsiderarse como una función de la energía. En el caso de las interacciones elásticas
mutuas que hay entre esferas duras o colisiones elásticas entre partículas esféricas
rígidas y centros de dispersión fijos en forma de esferas duras, se puede ver fácilmente que la trayectoria libre media es una propiedad geométrica del sistema y, por
ende, independiente de la energía. Se verá que la dispersión de electrones mediante
fonones de modo acústico en metales y semiconductores, se puede aproximar a
través de este modelo y, en consecuencia, se puede describir de acuerdo con una
:rayectoria libre media independiente de la velocidad. Por supuesto, cualquier trayec:oria libre individual l y el tiempo libre correspondiente t están relacionados, por
l = vt,
(7.2-18)
ii.n embargo, la relación existente entre la trayectoria libre media A y el tiempo libre
"'"edio T se deben obtener sacando el promedio de la distribución de velocidades y
iependerá en detalle de la forma en que la trayectoria libre media y el tiempo de
~elajación dependan de la energía.
73
CONDUCTIVIDAD ELECTRICA DE UN GAS
DE ELECTRONES LIBRES
Ahora se utilizará la ecuación de Boltzmann para predecir la conductividad
liéctrica y térmica de un gas de electrones libres. En primer lugar se verá una
substancia isotrópica uniforme a temperatura constante en una condición de estado
estacionario bajo la influencia de un campo eléctrico constante aplicado E 0 • Puesto
que el sistema se encuentra en un estado estacionario, df/dt =O y, dado que el
material es uniforme y está a temperatura constante, la función de distribución debe
ser la misma en todas las partes de la muestra, de donde, V/= O. En estas condiciones, la fuerza ejercida sobre un electrón es -eE0 y la ecuación de Boltzmann en la
aproximación del tiempo de relajación se puede escribir como sigue, utilizando
(7.2-3) y (7.2-4)
f-fo
eE0 • V,f= - - .
't
(7.3-1)
Si se escoge un sistema de coordenadas de tal modo que el eje z esté en la
dirección E 0 , entonces, E0 sólo tiene una componente z y la ecuación anterior se
puede expresar como sigue
eE0 -r a¡
--=f-fo·
m
av,
(7.3-2)
En esta ecuación, se supone que la diferencia existente entre f y fo es muy
pequeña, de modo que offozz se puede aproximar por medio de ofo/OVz. Si además
se supone que la función de distribución fo, que describe el estado de equilibrio del
sistema, es una distribución Maxwell-Boltzmann de la forma (5.4-15), entonces,
a¡o = - mv, fo·
av,
kT
(7.3-3)
210
Teoría del electrón libre de los metales
En estas condiciones, la ecuación de Boltzmann se convierte en
eEo·r:vz)
(
f = fo ( 1 - ---¡:;¡- =Jo 1 -
0 -r
eE
)
k T v cos (} ,
(7.3-4)
dado que Vz = v cos {), en donde 8 es el ángulo que hay entre el eje polar z y la
dirección v.
Por definición, la densidad de la corriente eléctrica lz es
(7.3-5)
y vz se puede expresar como
_f
f
vzf(v)g(v)d 3 v
Vz =
(7.3-6)
f(v)g(v)d 3 v '
en donde g(v) es la densidad de estados por unidad de volumen del espacio de
velocidad y d 3 v es el elemento de volumen apropiado en el espacio de la velocidad.
La notación que se adoptará en esta obra y se utilizará sistemáticamente a partir de
ahora, es que una cantidad con una barra encima, a:, se refiere a un promedio sobre
la distribución real de desequilibrio, en tanto que una cantidad encerrada entre
paréntesis, (a:), se relaciona con un promedio de dicha cantidad tomado sobre la
función de distribución de equilibrio. La única excepción es la velocidad térmica
que, para seguir esta convención, debería escribirse realmente como (v), pero que, de
acuerdo con la convención tradicional, se conservará la notación C. Como se verá, es
más conveniente integrar sobre coordenadas esféricas (v, 8, cp) en el espacio de velocidad y, por tanto, se debe utilizar el elemento de volumen d 3 v = v2 sen 8 dvd8dcp.
Utilizando este elemento de volumen en combinación con la densidad de estados en
el espacio de velocidad, según está dado por ( 5.4-1 7) y la función de distribución
(7.3-4), y observando que Vz = v cos 8, (7.3-6) se puede expresar como
(7.3-7)
En (7.3-7), ya se realizó la integración sobre cp de O a 2rr. Puesto que los
integrandos son independientes de e/>, los factores 2rr obtenidos en el numerador y el
denominador se anulan. Así también, puesto que <vz> es cero (para la situación de
equilibrio), la integral que incluye sólo / 0 en el numerador de (7.3-7) debe ser cero;
es más, en el término dependiente del campo del denominador aparece una integral
angular de cos 8 sen 8 =+sen 28 sobre el rango O< 8 < 7T y, por tanto, este término
también se integra a cero. En consecuencia, la ecuación (7.3-7) se puede reducir a
(7.3-8)
Conductividad eléctrica de un gas de electrones libres
211
Las integrales angulares se pueden evaluar con facilidad, dando
f f'"'
'"'v 2 t(v) · v2j 0 (v) dv
E
eEo o
e o 2
Vz = - 3kT
= - 3kT (v t),
_
(7.3-9)
v%(v) dv
o
las integrales restantes representan sólo el promedio (v 2 r (v)> sobre la función de
distribución de equilibrio. No obstante, en un gas de partículas libres de Boltzmann,
la energía cinética promedio por partícula es 3kT/2, de tal manera que
de donde,
(7.3-10)
Al substituir esto en (7.3-9), se puede escribir, finalmente,
(7.3-11)
en donde,
(7.3-12)
El resultado de este método más exacto concuerda con (7.2-7) que se obtuvo
de un modo muy aproximado, excepto por un factor de 2 y por el hecho de que la
cantidad 7, según la da (7.3-12) y (7.3-9) no es precisamente igual a r, excepto
cuando r, es independiente de v.
En este aspecto, es muy común defmir la movilidad de una partícula como la
magnitud de la velocidad promedio de arrastre por unidad de campo. De acuerdo
con (7.3-11), la movilidad ¡.¡. debe estar dada por
-1 1-
p.Vz- - ei.
E0
m
(7.3-13)
La unidad de movilidad es la velocidad por unidad de campo que, en el
sistema cgs-gaussiano es cm 2 volt- 1 seg- 1 • La densidad de corriente /z es, de acuerdo
con (7.3-5) y (7.3-11),
(7.3-14)
por lo cual,
212
Teoría del electrón libre de los metales
Se debe observar que estos resultados también se pueden establecer de acuerdo
con la movilidad, como sigue,
(7.3-16)
de donde,
(7.3-17)
u= nep.
Para evaluar a explícitamente en términos del tiempo de relajación r, es necesario especificar la dependencia de r con respecto a v. Entonces, si r es independiente de v, de acuerdo con (7.3-9) y (7.3-12), 7 = r. Para el caso en el que la
trayectoria libre media es independiente de la velocidad, r = 'A/v y (7.3-12). (7.3-10)
y (5.4-20) llevan a
_
A.(v)
(v2)
A.c
3kT/m
8 A.
'r=--=---=--
31t e'
(7.3-18)
En la expoSicton anterior se supuso, al igual que Drude y Lorentz, que el gas
electrónico se podía describir adecuadamente mediante la distribución de energía de
Maxwell-Boltzmann. Por supuesto, los electrones obedecen en realidad al principio de
exclusión de Pauli y, debido a ello, se tuvo que utilizar la función de distribución
de Fermi-Dirac para que los resultados fueran perfectamente correctos. Si la distribución de equilibrio es la de Fermi-Dirac (5.5-20), se debe escribir, en lugar de
(7.3-3),
(7.3-19)
Al substituir este resultado en (7.3-2) suponiendo nuevamente que offovz se
puede substituir mediante ofofovz, se tiene que
eE0 -r
f = fo - kT fo(l - fo)v cos O.
(7.3-20)
Al utilizar esta expresión como la función de distribución en (7.3-6) y observando que la integral incluida en el primer término de (7.3-20) en el numerador, y
la integral relacionada con el segundo término de (7.3-20) en el denominador, de la
expresión resultante se anulan igual que antes y, después de integrar sobre las coordenadas angulares, se llega a
(7.3-21)
En el caso general es imposible evaluar analíticamente estas integrales sobre la
función de distribución de Fermi-Dirac; en cambio, es muy fácil obtener un resultado aproximado que es casi correcto para T 4.. TF, lo cual por supuesto, es lo que
sucede casi siempre para la mayoría de los conductores metálicos en las condiciones
que se encuentran en la práctica.
Conductividad eléctrica de un gas de electrones libres
213
Para lograr esto, es muy conveniente expresar las integrales de (7 .3-21) como
integrales sobre la energía, y no la velocidad, por lo cual se obtiene
(7.3-22)
Se debe observar que para T~TF (es decir, kT~e1), la función de Fermi
f 0 (e) es muy pequeña para e, significativamente en exceso de e¡ y la función com-
plementaria 1 - fo es muy pequeña para valores de e que son mucho menores que
e1. Por tanto, la función producto [ 0 (1 - [ 0 ) es muy pequeña excepto en la cercanía
de e = e1 , como se ilustra en la figura 7.l. Partiendo de (7 .3-19), es fácil demostrar
analíticamente que [ 0 (1 - [ 0 ) es un máximo en e= e¡, en cuyo punto [ 0 (1 - [ 0 ) =
y que la región sobre la que [ 0 (1 - [ 0 ) no es pequeña en comparación con su valor
máximo, tiene una anchura del orden de kT. Por tanto, la integral del numerador de
(7.3-22) no aumentará de manera significativa, excepto en donde e tiene valores no
mayores de unas cuantas unidades kT de e1. Si e3 12 T(e) es una función que no
cambia mucho en este rango de energías, se puede considerar que [ 0 (1 - [ 0 ) es
esencialmente una función o de Dirac de e - e1 , y se puede escribir, 5
t
fo(e)(l - fo(e)) ~ A!5(e- e1 )
(7.3-23)
en donde A es un factor de normalización que se debe escoger de tal modo que
cuando (7.3-23) se integra sobre la energía, se obtiene el valor correcto de la integral del lado izquierdo.
.,
Figura 7.1.
Las funciones /o(€), 1 -!o y lo (1 - / 0 ) para un sistema de Fermi, graficadas en
función de la energía. El factor de escala vertical de la curva fo (1 -/o) no es el
mismo que el de las otras curvas.
Puesto que, mediante la integración directa (empleando la substitución u=
(e- e¡)/kT) se puede demostrar que
Joo
o
j 0 (1 -Jo) de = k T
Joo
e"du
kT
( + ") 2 = 1 + •¡tkT ~ kT
-•1 tkT 1 e
e
(7.3-24)
s Véase el apéndice A, donde hay una definición y una explicación de la función
Dirac.
o- de
214
Teoría del electrón libre de los metales
y, puesto que la integral de la función 6 es la unidad, es evidente que se debe
tomar A = kT en (7 .3-23), de donde,
j 0 (e)(l - j 0 (e)) g;; kTb(e- e1)
(kT ~ e1 ).
(7.3-25)
Esto se substituye en (7.3-22) y se evalúa la integral del denominador de la
ecuación, observando que fo(E) es la unidad para O< E< E¡ y cero para E> E¡, que
es una buena aproximación de kT ~ E¡, obteniéndose
f e -r(e)b(e - e de
00
_
Vz =
2eE0
3' 2
1)
0
(7.3-26)
- _3_m_ !:.....:....._f'"":-~-el_/_2d_e_ __
La densidad de corriente lz =-nevz y la conductividad a se pueden evaluar,
como antes, en relación con (7 .3-15), lo cual da
con
e-r(e1 )
J.L=--.
m
(7.3-27)
Parece que estos resultados son los mismos que se encontraron para el caso
Maxwell-Boltzmann (7.3-11), etc., excepto que el tiempo libre medio promedio r se
representa mediante el valor r(v) en la "velocidad de Fermi" v1 , en donde
tmv} = e1 .
(7.3-28)
En este caso, las estadísticas sólo establecen una diferencia en los detalles de
los promedios y no afectan la conductividad por órdenes de magnitud. Esto se
comprende desde el punto de vista físico, ya que, en cualquiera de los casos, el
campo sólo tiene el efecto de superponer una velocidad de arrastre del orden de
eE0 r/m en todos los electrones de la distribución, como se ilustra en la figura 7.2,
sin tener en cuenta los detalles de su distribución de energía. En todo caso, la
introducción de la estadística Fermi-Dirac, aunque modifica algunos de los detalles,
conserva las características esenciales de la representación del electrón libre de Drude-Lorentz-Boltzmann de la conducción eléctrica, que es básicamente correcta. Sin
embargo, como se verá a su debido tiempo, las capacidades térmicas predichas por
las estadísticas de Maxwell y Fermi-Dirac para electrones libres en metales, son
Figura 7.2.
Las distribuciones Maxwell-Boltzmann (MB) y Fermi-Dirac (FD) de la componente
de velocidad z en presencia de un campo eléctrico.
Conductividad térmica y efectos termoeléctricos
215
realmente muy diferentes y, en este caso, el uso de la estadística Fermi-Dirac es
esencial para explicar los resultados experimentales.
7.4
CONDUCTIVIDAD TERMICA Y EFECTOS TERMOELECTRICOS
EN SISTEMAS DE ELECTRONES LIBRES
Al estudiar la conductividad térmica de los electrones libres, es necesario considerar una muestra en la que no haya corriente eléctrica alguna, pero sí un gradiente
de temperatura. Entonces la función de distribución en cualquier punto se caracteriza, por la temperatura local y se debe considerar como una función de la posición
y de la energía. Al igual que antes, se supondrá que se trata de una muestra
isotrópica homogénea y, para simplificar, se supondrá que la temperatura varía únicamente a lo largo de la dirección z. Desde un principio se trabajará con las estadística de Fermi-Dirac; el caso de la estadística Maxwell-Boltzmann se puede obtener
para una situación especial del resultado Fermi-Dirac, cuando se permite que la
energía de Fermi aumente y sea negativa.
En estas condiciones, la ecuación de Boltzmann para el estado estacionario,
utilizando la aproximación del tiempo de relajación acostumbrada, con r = r(v) se
puede expresar como sigue
(7.4-1)
En esta ecuación, las derivadas de la función de distribución real con respecto
a z y Vz, se han aproximado mediante los valores de la correspondiente función de
distribución de equilibrio análogamente al razonamiento que se empleó para la ecuación (7.3-2). Se supone que el campo E0 sólo tiene una componente z. La ecuación
anterior se puede volver a escribir como sigue
f = fo +
-r(eEo aJo m avz
Vz afo).
az
(7.4-2)
Si se utiliza la expresión (5.5-20) para representar fo y si se recuerda que e1 es
una función de la temperatura, con la ayuda de (7 .3-19) se puede escribir la cantidad of0 /oz como sigue
=fo0-fo)[e-e1 + ae,]aT =[r!...(~) ~]f0 (1-f0 )aT
kT
T
aT az
aT T + T
kT
az .
(7.4-3)
A continuación, la ecuación de Boltzmann se puede escribir en la forma
(7.4-4)
216
Teoría del electrón libre de los metales
Al igual que antes, la densidad de la corriente eléctrica lz es
f
vzf(v,z)g(v) d 3 v
1 =-env =-en~---------z
z
f(v,z)g(v) d 3 v '
f
(7.4-5)
mientras que a la densidad de la corriente térmica Qz la representará la energía
portada por una partícula multiplicada por la compónente z de su velocidad, y por
la densidad de partículas, de donde,
_
J
Qz=n(ev,)=n
evzf(v,z)g(v) dv
-
J
(7.4-6)
f(v,z)g(v) dv
Al substituir la función de distribución (7.4-4) en (7.4-5) y (7.4-6), se obtienen
expresiones análogas a (7 .3-7). Debido exactamente a las mismas razones que se
indicaron en relación con dicha ecuación, la integral del primer término del numerador de
estas expresiones (incluyendo [ 0 ), deben anularse y también debe desaparecer la integral
del segundo término del denominador (incluyendo [ 0 (1 - [ 0 )). Por tanto, se tiene
en
f
e)
v!r
[
( iJ(e1 fT)
iJT] 3
kT/0 (1 - / 0) eE0 + T ---aT + T iJz d v
f
1 =~~--------~~~--------~--~-%
f 0 (v) d3 v
(7.4-7)
y
-n
f
v!r
[
(
iJ(e1 /T) e2 ) iJT] 3
kT/0 (1- / 0 ) eE 0 e + eT aT + T i)z d v
Q = ____;:;_,__ _ _
..;:,_;;--___;_---__;._____;;~
Jf
(7.4-8)
0 (v) d 3 v
z
Sin entrar en los detalles de la evaluación de estas integrales y gracias a los
resultados obtenidos en la sección anterior, es evidente, que estas ecuaciones se
pueden expresar como
en [ ( eE0 + 1 ,iJ(e1 iJT - ]
1 /T) iJT) _
- - t +-- (et)
1, =--
m
iJT
iJz
T iJz
(7.4-9)
y
-n [(
iJ(e1 /T) iJT)- 1 iJT2 ]
Q, =--;;¡- eE0 + T ---a;¡- iJz (er) + T 0 z (e t)
(7.4-10)
en donde las cantidades sobre las que se ha escrito una barra son los promedios
definidos por
(7.4-11)
Conductividad térmica y efectos termoeléctricos
217
Si se observa que mv; = mv 2 cos2 e, y se supone que a es independiente de
las variables angulares, entonces se puede integrar (7.4-11) sobre los ángulos para
obtener
_
(X
m
= -3kT
f
v2 tX(v)J0 (1 -Jo)· V 2 dv
f •o .
JI
v2 dv
f
= - '-----=-----f
2
e312 tX(e)J0 (l -Jo) de
3kT
e ¡,0 de
(7.4-12)
112
En las expresiones (7 .4-12) y (7 .3-1 0), se ve que cuando la distribución de
Fermi se reduce a una distribución de Maxwell (según la cual 1 -lo ~ 1 Y fo =
Ae-efkT), la Ci promedio se reduce a
(7.4-13)
análogamente a (7 .3-12) y los promedios se toman sobre la distribución de MaxwellBoltzmann. De igual manera, si la distribución es de tipo Fermi, para la que
kT <t. E¡, se puede emplear (7 .3-25) para representar f 0 (1 - fo ), en donde, aplicando
los mismos métodos usados para llegar a (7.3-26), fácilmente se puede demostrar que
ii = 1X(e1).
(7.4-14)
Si no fluye una corriente eléctrica, lz = O, por lo cual, de acuerdo con (7 .4-9),
se debe tener
o(e1 /T) ar
1 ar (er)
eE 0 + T - - - --= - - - oT oz
T oz i '
(7.4-15)
de donde,
Eo =
_! [_!_ (et) + T o(e1 jT)] oT
oT
e T i
oz
(7.4-16)
o bien,
Eo = T !..__ [(et)- e1
oT
eiT
i] oT
oz .
(7.4-17)
De acuerdo con esto, parece que aun en ausencia de una corriente, debe existir
un campo eléctrico cuando se tiene un gradiente de temperatura. De hecho, lo hay
y la ecuación anterior es la descripción fundamental del efecto termoeléctrico. Fenomenológicamente se puede definir el coeficiente de Thomson como el coeficiente de
proporcionalidad que relaciona el campo eléctrico con el gradiente de temperatura
que lo origina, como sigue,
q¡-ar
Eo = - ::/ oz
(7.4-18)
218
Teoría del electrón libre de los metales
según lo cual, el coeficiente de Thomson fí debe estar dado por
'f].
fí = _ T !..._ [(st)- e1
iJT
e'CT
(7.4-19)
De acuerdo con (7.4-9) y (7.4-10), también es evidente que si existe un campo
eléctrico aplicado que hace que fluya una corriente eléctrica, incluso cuando
oTjoz =O, la corriente térmica Qz no desaparece. Por el contrario, existe una corriente térmica que es proporcional al campo eléctrico E 0 y, por tanto, a la corriente eléctrica. Este efecto se denomina calentamiento Thomson y es muy diferente del
calentamiento ordinario irreversible de Joule que se relaciona con el paso de una
corriente por un medio resistivo. El voltaje que desarrolla un termopar por diferencia
unitaria de temperatura se defme como la diferencia de las potencias termoeléctricas
relacionadas con los dos constituyentes del par. Mediante un argumento termodinámico sencillo,6 se puede demostrar que la potencia termoeléctrica absoluta {!J de
una substancia está relacionada con el coeficiente de Thomson mediante
(7.4-20)
por lo cual, de acuerdo con (7.4-19), se debe tener
'f- (s-r).
f!jJ = e1
e'CT
Si lz =O, utilizando (7.4-15), el término relacionado con el campo eléctrico
más una contribución que incluye al gradiente de temperatura y la derivada de la
temperatura de la energía de Fermi, se puede eliminar de (7.4-10) para dar
--
__ 2
Qz = _u, iJT = - n ['f(e 2 t) - (st)]
iJz
mT
t
(7.4-21)
por lo cual, la conductividad térmica at es, sencillamente,
-2
__2
u = ~ ['f(s t)- (et)]
'
mT
'f
·
(7.4-22)
De acuerdo con esto, es evidente que la teoría del electrón libre de Fermi y la
representación del electrón libre de Boltzmann difieren sólo en algunos detalles de
los promedios y que ambos métodos llevan a una conductividad térmica del mismo
orden de magnitud, al igual que ambos predicen más o menos la misma conductividad eléctrica.
De acuerdo con las investigaciones experimentales de Wiedemann y Franz, la
relación atf(Tae), en donde ae es la conductividad eléctrica, es aproximadamente la
misma para casi todos los conductores metálicos, independientemente de la temperatura. Puesto que a, = ne 2 r/m, la relación Wiedemann-Franz, se puede expresar como
--
_ _2
L = ..!!.!_ = _1_ 'f(s 2 t) - (et)
Tue e2T2
t2
6 M. W.
(7.4-23)
Zemansky, Heat and Thermodinamics, McGraw-Hill Book Co., Inc., Nueva York
(1951) página 301.
Procesos de dispersión
219
Esto parece indicar que si r(e) es la misma función de energía para todas las
substancias metálicas, la relación Wiedemann-Franz será la misma para todos los
materiales. Puesto que cada factor de e contribuye kT a los promedios, la relación
Wiedemann-Franz será independiente de la temperatura. En realidad, si r(e) varía
lentamente con respecto a e, la relación Wiedemann-Franz será casi la misma incluso
si r(e) no es la misma función de energía para todas las substancias. En particular,
si la trayectoria libre media X e~ independiente de la energía, entonces, de acuerdo
con (7 .3-18), utilizando la representación clásica del electrón libre de Boltzmann, de
Drude y Lorentz, la conductividad térmica está dada por
(7.4-24)
en tanto que la relación Wiedemann-Franz se convierte en
(7.4-25)
independiente de la trayectoria libre media o la temperatura. La magnitud de L +
según está dada por (7 .4-25) y concuerda de manera aceptable con los valores determinados en forma experimental para casi todos los metales puros.
Si se trata de evaluar la conductividad térmica y la relación Wiedemann-Franz,
por medio de la estadística de Fermi y los valores promedio, como se calcularon de
acuerdo con (7 .4-14), entonces se obtiene el resultado at = L = O! Esta situación
sorprendente se origina debido a la representación de / 0 (1 - [ 0 ) como una función
de l> y el método sólo aproximado de la integral de Fermi en el denominador
(como en (7.3-26)) de las expresiones para los promedios que conducen a (7.4-14),
no es lo suficientemente exacta para estos cálculos. Si e¡ se expresa como kTF en
(7.4-23), es evidente que, en realidad, esto sólo se refiere a una pequefia diferencia
entre dos cantidades muy grandes del orden de (k 2 /e 2 ) (TpfT)l, y las dos cantidades
propiamente dichas se deben expresar con gran exactitud a fin de que su diferencia
sea más o menos correcta. Un método más preciso, como el presentado por Smith, 7
da el resultado
(7.4-26)
y
(7.4-27)
7 .S
PROCESOS DE DISPERSION
En todas las expostcwnes anteriores, la idea central era que los electrones
libres sufren colisiones instantáneas que tienden a hacerles volver a la distribución de
equilibrio; sin embargo, hasta ahora se ha evitado conscientemente el responder a la
7 R. A. Smith, Wave Mechanics of Crystalline Solids, Chapman and Hall, Londres (1961)
página 328.
220
Teoría del electrón libre de los metales
pregunta "¿colisiones con qué? " La fmalidad de esta sección es analizar cualitativamente la respuesta a tal pregunta. Como se verá en detalle en el siguiente capítulo,
los electrones libres que se mueven en forma independiente dentro del potencial de
una red cristalina perfectamente periódica no están sujetos en absoluto a interacciones de dispersión con todos los átomos de la red. Es más, en las colisiones
elásticas que suceden entre los electrones se conservan la energía y cada componente
de la cantidad de movimiento; debido a ello, no se origina ningún cambio neto en la
corriente eléctrica ni en la térmica. Por tanto, los mecanismos de colisión que producen la aleatorización de la distribución electrónica deben estar asociados con impurezas, imperfecciones o faltas de periodicidad de un tipo u otro en el cristal.
Sea un cristal que no contiene átomos de impurezas o imperfecciones estructurales en absoluto. Si no existiera el movimiento térmico de los átomos alrededor
de sus posiciones de equilibrio, el potencial eléctrico experimentado por un electrón
dentro del cristal sería perfectamente periódico y no habría mecanismos en absoluto
para hacer que los electrones volvieran al estado de equilibrio térmico por acción de
fuerzas eléctricas o magnéticas externas. Sin embargo, debido a las vibraciones térmicas de los átomos, en cualquier momento dado hay una leve aperiodicidad del
potencial dentro del cristal; ésta sirve para dispersar los electrones de conducción.
disipando cualquier velocidad de arrastre que puedan haber adquirido de los campos
aplicados externamente y devolviéndolos al estado de equilibrio térmico. Es evidente
que mientras más alta es la temperatura, tanto más fuertes son las vibraciones de red
y más alta la probabilidad de dispersión por unidad de tiempo. Por tanto, este
mecanismo de dispersión conduce a un tiempo libre medio [y, en consecuencia, de
acuerdo con (7.3-15), a una conductividad] que decrece al aumentar la temperatura.
Esto concuerda con las observaciones experimentales de metales puros.
Puesto que las vibraciones de red se pueden considerar como cuantos semejantes a partículas de energía vibratoria (fonones), la interacción de dispersión entre los
electrones y los fonones se puede describir como un proceso de colisión casi mecánico que incluye a los electrones libres y a los fonones, donde estos últimos se
comportan como partículas neutras cuya masa es mucho mayor que la del electrón. 8
Debido al hecho de que los fonones son neutros, la corriente no se conserva en
estas colisiones. Puesto que la "masa" del fonón es mucho mayor que la masa
electrónica, la fracción de energía que pierde el electrón en la interacción electrónfonón es pequeña, aunque por supuesto, el cambio de cantidad de movimiento del
electrón puede ser muy grande. Los electrones pueden interactuar con fonones de
modo acústico u óptico, aunque, dado que se requiere una energía térmica mucho
mayor para excitar a los fonones de modo óptico, la principal interacción a temperaturas moderadas es con fonones acústicos. Las dos interacciones son similares en
sus aspectos cualitativos, aunque conducen a ciertas diferencias cuantitativas en los
coeficientes de transporte, sobre todo la dependencia del tiempo de relajación en
función de la temperatura (de ahí que la movilidad dependa de la temperatura).
A cualquier temperatura dada, el número de fonones disponibles es constante. Puesto
que los fonones se comportan como partículas masivas casi estacionarias, la probabilidad de dispersión por unidad de distancia a lo largo de la trayectoria de un
electrón es una cantidad determinada de un modo puramente geométrico, la cual
sólo depende de la sección transversal geométrica efectiva relacionada con el fonón e
independiente de la velocidad del electrón. Por tanto, la trayectoria libre media es
independiente de la velocidad de partícula en estas circunstancias, como se hizo notar
en la sección 7 .2. El tiempo libre medio está dado por
A.
-r(v) =V
8 Véase,
por ejemplo, el problema 4 que aparece al final del capítulo 6.
(7.5-1)
Procesos de dispersión
221
en donde A es independiente de v, llegando a la relación (7.3-18) entre 7 y A. Por
supuesto, el número de fonones disponibles es una función de la temperatura y, por
tanto, A será una función de la temperatura a pesar de que es independiente de la
velocidad. Este mecanismo de dispersión de red o dispersión de fonón, es el proceso
dominante de dispersión en cristales relativamente puros y estructuralmente perfectos, sobre todo en los rangos de temperaturas elevadas.
Generalmente, si hay un átomo de impureza en un cristal, esto altera el potencial electrostático en las cercanías y crea una aperiodicidad en el campo de potencial
dentro del cristal, que puede actuar para dispersar electrones de conducción. Obviamente, los detalles del proceso de dispersión dependen de la naturaleza del átomo de
impureza, su tamaño iónico, su valencia y la forma en que está enlazado dentro de
la red cristalina. En lo que respecta a otras cosas, la presencia de átomos de impurezas en un cristal puro aumenta el tiempo libre medio que haya entre los eventos
de dispersión y lleva a una reducción de la conductividad eléctrica que será proporcional al contenido de impurezas. A decir verdad, este efecto se observa experimentalmente en gran número de substancias. 9 El mecanismo de dispersión de impurezas
casi siempre es dominante en cristales que son relativamente impuros o incluso en
muestras muy puras a temperaturas muy bajas, cuando el mecanismo de fonones es
débil. Las imperfecciones estructurales en la red cristalina, tales corno vacíos de red,
átomos intersticiales, dislocaciones y fronteras de grano, también conducen a aperiodicidades en el potencial del cristal y, por tanto, a centros de dispersión con los que
los electrones de conducción pueden interactuar. Entonces las propiedades de transporte del cristal reciben la influencia en mayor o menor grado, de la perfección
estructural de la red. En algunas circunstancias, la dispersión de electrones por las
superficies de la muestra también puede ser importante. Ya se vio (en la sección 6.6) la forma en que la dispersión de superficie de los fonones es a veces un
factor importante en la componente reticular de la conductividad térmica a temperaturas bajas.
Si dos mecanismos independientes de dispersión (por ejemplo, la dispersión de
red y la de impurezas) operan simultáneamente para termalizar la función de distribución de energía electrónica, se tendrán dos tiempos de relajación T 1 y T 2 , asociados con los mecanismos respectivos. En el ejemplo anterior, T 1 puede representar el
tiempo de trayectoria libre que transcurre entre los sucesos de dispersión de red y
r 2 el tiempo libre medio que pasa entre las dispersiones de impurezas. En estas
condiciones, el término de colisión de la ecuación de Boltzrnann se puede escribir
corno sigue
f- fo f- fo
f- fo
=------=---
(7.5-2)
en donde
1
1
1
T
T¡
T2
-=-+-.
(7.5-3)
Esto hace ver que el efecto combinado de dos mecanismos de dispersión se
puede representar mediante un solo tiempo de relajación T relacionado con T 1 y T 2
mediante la fórmula de suma recíproca (7.5-3). De igual manera, si se tienen más de
9 Por ejemplo, esta es la razón por la que se requiere cobre de muy alto grado de pureza
para conductores eléctricos en sistemas comerciales de transmisión de potencia.
222
Teoría del electrón libre de los metales
dos mecanismos, su efecto se puede representar por medio de un solo tiempo de
relajación r dado por
1
1
-=¿-.
•
1 't¡
(7.5-4)
Puesto que, de acuerdo con (7.3-13), las movilidades son directamente proporcionales a los tiempos de relajación, las movilidades producidas por mecanismos
independientes de dispersión por separado pueden sumarse recíprocamente en la
misma forma para dar una movilidad combinada de la forma
1
1
-=¿-.
J1.
i Jl.¡
(7.5-5)
Las trayectorias libres medias originadas por procesos de dispersión separados
también se pueden sumar recíprocamente para llegar a una trayectoria libre media general No obstante, debe observarse que las fórmulas de suma (7.54) y (7.5-5) han de
aplicarse antes y no después de promediar sobre la velocidad.
7.6
EL EFECTO DE HALL Y OTROS EFECTOS
GALVANOMAGNETICOS
Hasta ahora se han estudiado sólo casos en los que un campo eléctrico actúa
sobre las partículas de un sistema de electrones libres. Si además se tiene un campo
magnético, la fuerza ejercida sobre una partícula de carga q está dada por la fuerza
de Lorentz
1
e
F = q(E + - v X B)
(7.6-1)
y la ecuación de Boltzmann en el estado estacionario, utilizando la aproximación del
tiempo de relajación, se convierte en
(7.6-2)
La solución de esta ecuación incluye varios efectos galvanomagnéticos que se
originan en la interacción de campos eléctricos y magnéticos, y gradientes térmicos,
con las partículas de la distribución. Por ahora no se verán los detalles de la solución de la ecuación de Boltzmann, sino que la explicación se restringirá a la descripción
fenomenológica de estos efectos. En un capítulo posterior se hará un análisis más riguroso
de los fenómenos galvanomagnéticos y la forma en que se aplican a semiconductores,
en donde será más fácil llegar a soluciones analíticas exactas.
El más importante de los efectos galvanomagnéticos es el efecto de Hall, en el
que se produce un campo eléctrico en la dirección y como resultado de una corriente que fluye en la dirección x y un campo magnético a lo largo de la dirección z,
según se ilustra en la figura 7.3. En esta figura, un electrón que se mueve con
velocidad vx está sometido a un empuje descendente debido a la fuerza de Lorentz.
En el estado estacionario no puede haber una fuerza neta ejercida sobre el electrón
El efecto de Hall y otros efectos galvanomagnéticos
Io-
Figura 7.3.
223
vH (Medido con un
potenciómetro en
condiciones de
circuito abierto)
Geometría del experimento del efecto de Hall.
~- por tanto, lo que sucede es que se desarrolla un exceso de concentración de
electrones en el borde inferior de la muestra, hasta que se genera un campo electrostático Ey que equilibra exactamente a la fuerza de Lorentz. Por tanto,
q
evxBo
e
F1 = - (v X B0 ) 1 - eE1 = - - - eE = O
(7.6-3)
E = vxBo
(7.6-4)
c
1
'
por lo cual,
'
e
Sin embargo, la densidad de corriente 10 es
10 = -nevx.
(7.6-5)
Si se expresa Vx de (7.6-4) en función de 10 por medio de (7.6-5), el campo
.ie Hall Ey se puede expresar como
-loBo
E , = - - = Rl 0 B0
nec
(7.6-6)
m donde el coeficiente de Hall R está dado por
1
R=--.
nec
(7.6-7)
El campo de Hall es directamente proporcional tanto a 10 , como a B 0 • El
.:oeficiente de Hall R es, sencillamente, la constante de proporcionalidad entre el
:.ampo de Hall y el producto 10 B 0 • El campo de Hall se puede determinar midiendo
ei voltaje de Hall VH de la figura 7.3 de una manera potenciométrica. Por tanto, el
.:ampo de Hall y el voltaje de Hall están relacionados por medio de
(7.6-8)
en donde y 0 es la anchura de la muestra. El coeficiente de Hall R se puede medir si
te conocen VH, 10 y Bo.
El coeficiente de Hall es inversamente proporcional a la densidad n de portadores de carga de la muestra, y una medición de R constituye un modo sencillo de
224
Teoría del electrón libre de los metales
determinar n. Combinando las mediciones del coeficiente de Hall y la conductividad,
se puede obtener la movilidad /J., ya que, de acuerdo con (7 .6-7) y (7 .3-17),
1
JJ.
Ru= --(nep)= - nee
e
o bien,
1
p = - - Ru.
e
(7.6-9)
El análisis anterior del efecto de Hall se ha simplificado en exceso en el
sentido de que todos los portadores de carga no tienen la misma componente de
velocidad Vx y, por tanto, se debe promediar sobre la distribución de Vx. Por lo
general, el efecto de esto es cambiar el valor (7.6-7) por R mediante un pequeño
factor numérico.
De acuerdo con (7 .6-7) si los portadores de carga son electrones, R siempre
debe ser negativo. Se ha encontrado experimentalmente que R es positivo para
muchas substancias metálicas y semiconductoras. La aparición de un coeficiente de
Hall positivo se puede explicar, suponiendo que los portadores de carga son positivos, en lugar de negativos; pero la teoría del electrón libre de los metales no
proporcionan un modo racional para explicar la presencia de portadores de carga positivos. Los coeficientes de Hall positivos y la existencia de portadores de carga positivos se
pueden explicar mediante la teoría cuántica, como se verá en el siguiente capítulo.
En el arreglo experimental de la figura 7.3, se establece un gradiente de temperatura a lo largo de la dirección y junto con el campo de Hall Ey. Esto se debe a
que, de acuerdo con la ley de Lorentz de la fuerza, toda fuerza ejercida verticalmente hacia abajo sobre los electrones es proporcional a Vx y, por tanto, sobre los
electrones más energéticos y rápidos, la fuerza ejercida v x 8 0 es mayor; en consecuencia, estos electrones tienden a acumularse en la parte inferior de la muestra,
elevando su temperatura con respecto a la parte superior, donde permanecen los
electrones "más fríos". El gradiente de temperatura resultante crea un campo termoeléctrico en la dirección y, el cual está dado por (7.4-17) y origina un voltaje
adicional diferente del voltaje de Hall, en las terminales y de la muestra. Este
fenómeno se conoce como efecto de Ettingshausen, y en algunos casos, puede interferir mucho en las mediciones de voltaje de Hall. Tal efecto en las mediciones de
Hall se puede eliminar si se utiliza una corriente alterna de muestra, cuyo periodo
sea corto en comparación con la constante térmica de tiempo de la muestra, en
combinación con un detector de corriente alterna.
Cuando la corriente eléctrica / 0 en el experimento del efecto de Hall, se
substituye por una corriente térmica, se puede medir todavía un campo eléctrico a
lo largo de la dirección y. En este caso, existe en promedio un transporte neto de
electrones más rápidos, dentro de la dirección x, desde el extremo vivo o caliente,
hasta el extremo frío de la muestra, y la fuerza v x B0 actúa sobre ellos, para
producir un campo eléctrico, más o menos en la misma forma en que se produce el
campo de Hall, cuando fluye una corriente eléctrica. Este fenómeno se denomina
efecto de Nernts. El campo de Nernst va acompañado por un gradiente de temperatura a lo largo dat la dirección y al igual que lo que sucede con el campo de Hall;
esto origina un voltaje termoeléctrico adicional análogo al de Ettingshausen. El efecto termoeléctrico originado por el efecto de Nernst se denomina efecto de RighiLeduc.
En un campo magnético, los electrones se desplazan siguiendo trayectorias curvas y no rectas; gracias a este hecho se ha descubierto que, por lo general, la
conductividad depende del campo magnético. Este fenómeno se llama magneto"esistencia y se estudiará más detalladamente en un capítulo posterior.
Capacidad térmica de sistemas de electrones libres
7.7
225
CAPACIDAD TERMICA DE SISTEMAS DE ELECTRONES LIBRES
La teoría clásica del electrón libre de Drude-Lorentz, en la que se supone que
los electrones libres obedecen a la estadística de Maxwell-Boltzmann, lleva a la conclusión de que (suponiendo un electrón libre por átomo) la capacidad térmica de los
electrones libres debe ser -fnk, como lo da la figura (5.4-11). Entonces la capacidad
térmica total sería igual a la suma de la contribución reticular dada por la teoría de
Debye, y la contribución electrónica -fnk, y a temperaturas altas, en comparación
con la Debye, el valor límite de la capacidad térmica, sería -!nk. Sin embargo, esta
conclusión está en discordancia con los experimentos, ya que las observaciones indican que el valor asintótico de la capacidad térmica a altas temperaturas difiere
muy poco del valor 3nk predicho por la teoría de Debye para la contribución
reticular sola. Aparentemente, esto indica que la capacida-d térmica de los electrones
libres es mucho más pequeña que el valor predicho a bc;se del modelo Drude-Lorentz-Boltzmann. Esta fue una de las principales fallas del modelo original DrudeLorentz, que se propuso primero.
Como se verá más tarde, resulta que cuando se utilizan las estadísticas de
Fermi-Dirac, para describir la distribución de energía drl electrón libre, la capacidad
térmica electrónica calculada es mucho más pequeña q~tl' el valor 3/2nk dado por la
estadística de Boltzmann y, en efecto, es despreciable en comparación con la con tribución reticular a temperaturas moderadas y altas. En consecuencia, el modelo del
electrón libre de Fermi está mucho más de acuerdo con las observaciones experimentales que la teoría original de Drude-Lorentz. La explicación de calor específico
electrónico de substancias metálicas fue uno de los triunfos originales de la estadística cuántica.
La capacidad térmica del sistema del electrón libre de Fermi-Dirac es mucho
más pequeña porque ~AJo los electrones dentro de unos cuantos kT de la superficie
de la esfera de Fermi pueden recibir energía de una fuent~, térmica externa. Por lo
común, una partícula de un baño térmico externo a la temperatura T sólo dispone
de una energía de unos cuantos kT, para transmitirla a un electrón del sistema de
electrones libres de Fermi. Los electrones que se encuentran en un lugar profundo,
dentro de la esfera de Fermi no pueden interactuar con este tipo de cuerpos externos excitantes, ya que no existen estados desocupados dentro de unos cuantos kT
de energía, hacia los que puedan excitarse. Sólo los electrones que están cerca de la
superficie de Fermi, en donde existen estados desocupados disponibles, pueden participar en las interacciones con una fuente térmica externa.
Para hacer un cálculo exacto de la capacidad térmica, es necesario tener en
cuenta la variación de primer orden de la energía de Fermi con la temperatura. Para
lograr esto, será necesario evaluar la integral
1=
f
oo
0
acb(e)
f 0 (e) &
(7.7-1)
de.
en donde / 0 es la función de Fermi y q¡{e) es una función de e que tiene la
propiedad de que
l/J(O) =O.
(7.7-2)
Si (7.7-1) se integra por partes, puede verse con facilidad que 1 se puede
expresar en la forma
l =
a¡; = - feo l/J(c) ~
a¡; de,
[f (e)c/J(e) ]eo - feo l/J(e) ~de
0
o
o
oe
o
iJ¡;
(7.7-3)
226
Teoría del electrón libre de los metales
ya que el producto f 0 (e)r/>(e) se anula en ambos límites. En la expansión de cf>(e)
como una serie de Taylor en torno al punto e= e1, puede escribirse como
2
2
1
f/>(e) = f/>(e¡) +(e- e¡) (of/>)
oe t¡ + 2(ee¡) (oiJe2f/>) t¡ + ... '
(7.7-4)
por lo cual, (7.7-3) se puede expresar como
- 2
1 = a0 fj>(e1 ) + a 1 (of/>)
+ a2 (a24>)
+ ... ,
oe t¡
oe •J
(7.7-5)
1 J<Xl(e- e¡)"~
a¡; de.
an = - n! o
oe
(7.7-6)
en donde
Ahora bien, si kT <{ e1, de acuerdo con (7 .3-19), a¡0 jae es despreciable para valores
negativos de e y los límites de la integral (7.7-6) se pueden extender a oo y - oo. Si
esto se hace, se encontrará que
a0 = -
J
J
<Xl
-a;¡
a1 = -
ofo
[ J<Xl = 1
- de = fo
oe
-oc
(7.7-7)
ofo
(e- e1 ) - de= O
oe
(7.7-8)
<Xl
-a;¡
(7.7-9)
La integral de (7.7-8) se anula porque at0 /ae es una función par de e- e¡ y
el integrando es, por tanto, una función impar de dicho argumento que, cuando se
integra desde - oo a + oo, debe dar cero. La integral de (7.7-9) se pone en la forma
antes indicada, mediante la substitución de x =(e- e¡)/kT; esta forma aparece en
casi todas las tablas estándar de integrales definidas. Al substituir estos valores en
(7.7-5), el resultado es
1=
f
<X>
p
of/>
1t2
(a2 4>) + ...
f 0 (e)de= fj>(e1 ) +- (kT) 2 - 2
oe
6
oe
(7.7-10)
•¡
Esta fórmula es conveniente para sacar valores aproximados de las integrales de
Fermi, donde la aproximación de la función 8 para a¡0 jae no es suficientemente
buena. Está restringida por la condición (7 .7 -2) y por la condición de que kT <{ e1. Este
método se puede usar para evaluar la relación Wiedemann-Franz para un gas de Fermi;
los detalles quedan como ejercicio para el lector.
Ahora suponga que se escoge
f/>(e) =
f~g(e) de
(7.7-11)
en donde
a¡p¡ae = g(e)
(7.7-12)
Capacidad térmica de sistemas de electrones libres
227
siendo que g(e), como lo establece (5.2-22), se refiere a un sistema de electrones
libres. Por tanto, de acuerdo con (7.7-10),
n=
f
oo/ 0 (e)g(e) de =
o
i''<TJ g(e) de + -nz (kT) (a.!!...) .
2
6
o
oe .,
(7.7-13)
Sin embargo, de acuerdo con (5.5-24),
1''(0)
n
=Jo
g(e) de.
(7.7-14)
Al restar (7.7-14) de (7.7-13), se tiene,
o= f. •,<TJg(e) de+ n2
6 (kT) 2(aag ) ~ g(e¡) [e¡(T)- e¡(O) J+ 6n2 (kT) 2 (aag ) .
e .,
s¡(OJ
e .,
(7.7-15)
En la ecuación anterior se supuso que g(e) no varía mucho en el intervalo de
e¡(O) a e¡(1), que, para kT ~e¡ será sólo una pequeña fracción de e¡(O). Puesto que
g(e) es de la forma ce 1 12 con e igual a una constante. (7.7-15) se puede escribir
como sigue
n2 (kT)z
e1(T) = e1 (0)- - - - .
12 e¡(T)
(7.7-16)
Para kT <{ e1 , el segundo término será una pequeña corrección que debe restarse de la cantidad relativamente grande e¡(O) y la diferencia y e¡(1) y e¡(O) será
pequeña, en comparación con e¡(O). En estas circunstancias no se producirá un error
grande si e¡(1) en el término de corrección de (7.7-16) se substituye con e¡(O), lo
cual da, finalmente,
nz(kT\z]
e¡(T) = e¡(O) [ 1 - 12 e¡(O)/ .
(7.7-17)
Para evaluar el calor específico electrónico, se escoge
cjJ(e) =
f~ e g(e) de
(7.7-18)
en donde
ocjJfoe = e g(e)
(7.7-19)
y
Entonces, al substituir en (7.7-10), se tiene que
oo
ocjJ
ioo
i f 0 (e)- de = e g(e)f0 (e) de = U
o
oe
o
(7.7-20)
228
Teoría del electrón libre de los metales
y
U =
l
•,<T>
n2
[ 0
o
6
oe
e g(e) de +- (kT) 2 -(e g(e))
J.
.,
También en este caso, si se usa el hecho de que g( e)= ce 1 12 , esto se puede
escribir como,
l
<¡(O)
U =
fe¡(T)
¡¡;2
3
e¡(O)
6
2
e g(e) de +- (kT) 2 ·- g(e1 )
e g(e) de+
O
(7.7-21)
Aquí, U0 es el valor de cero absoluto de la energía interna, según se representa mediante la integral de e g(e) desde O hasta efO), y la integral de esta cantidad en el rango pequeño e,(O) a efT) se ha aproximado, siguiendo el mismo procedimiento que se utilizó en relación con (7.7-15). En el último término de (7.7-21),
g(e) se evalúa a efO) más que en ef1), lo cual introduce sólo un pequeño error. Al substituir el valor de ef1)-ef0) dado por (7.7-17) en (7.7-12), se puede escribir
(7.7-22)
De acuerdo con (5.2-22) y (5.5-25), g(ej(O)) se puede expresar como
sJ2n
g(e¡(O)) = ---¡;J m3f2[e¡(O)]If2 =
(3n)
4nm
-¡;r- -; l/J ,
que, puesto que según lo indica (5.5-25), la relación mjh 2 es igual a (3n/rr)21 3 j
(8et(O)), se puede escribir
3n
3n
g(e¡(O)) = 2e1 (0) = 2kTF.
(7. 7-23)
Substituyendo este valor en (7. 7-22), se tiene, por último,
(7. 7-24)
La capacidad térmica se obtiene en la forma acostumbrada y el resultado es
e = au = n2
" ar
2
nk(I..).
TF
(7. 7-25)
Esta expresión difiere del resultado clásico i:nk multiplicado por un factor
(rr 2 /3)(T/Tp), que resulta 0.03 para T=300°K y Tp=30,000°K [un valor típico
para metales simples, calculado a partir de (5.5-25)]. Por tanto, la componente
Capacidad térmica de sistemas de electrones libres
229
electrónica del calor específico, según se calcula mediante la estadística de Fermi,
resulta de sólo una pequeña fracción del valor de Drude-Lorentz fnk, y -es pequeñaexcepto a temperaturas muy bajas en comparación con la contribución reticular.
A temperaturas pequeñas, en comparación con la de Debye, la contribución reticular se
hace muy pequeña, aproximándose a cero, al igual que t 3 conforme T-+ O. En este
rango, la contribución electrónica frecuentemente es un factor importante y, en
ciertas gamas de temperaturas, puede ser incluso el efecto dominante. Se puede
reconocer fácilmente en los datos experimentales, debido a su dependencia lineal de
la temperatura, como lo indica (7. 7-25).
EJERCICIOS
l. Demuestre que si 'T es independiente de v, la función de distribución es una solución apro-m(v-vo) 2
2kT
f(v) = Ae
(donde Vu = ;;;-
Eo)
ximada de la ecuación de Boltzmann en el caso en que la distribución de Maxwell-Boltzmann represente la función de distnbución de equilibrio y en donde v0 <{,(kT/m) 112 .
2. Suponiendo la estadística de Maxwell-Boltzrnann, evalúe fa partir de (7.3-12), suponga
que la dependencia de 'T sobre la energía está dada por 1 (E) =A e-s, en donde A y s son
constantes.
3. En un metal como el cobre (resistividad 1.7 X I0-6 ohms-cm), ¿Cuál es, aproximadamente, el máximo campo eléctrico para el que podría aplicarse el método del electrón libre de
Drude o Fermi estudiado en la sección 7 .3? ¿Cuál es la densidad de corriente para este valor
del campo?
4. A partir de (7.7-10) y (7.7-17), deduzca las fórmulas (7.4-26) y (7.4-27) para la conductividad térmica y la relación de Wiedemann-Franz de un ga• de Fermi de electrones libres,
usando la aproximación kT 4;.efi0).
5. Si se adopta la representación del electrón libre de Fermi de una superficie metálica,
como se ilustra en el diagrama incluido, demuestre que existe una corriente de emisión termoiónica que puede fluir desde la barrera de potencial superficial, y que la densidad de la corriente
termoiónica está dada por
1 - 4TTem(kT)2
-
h'
e
-<PotkT.
Jx.
Suponga que r/>0 , la función de trabajo es ~k T.
6. Demuestre que si la trayectoria libre media es independiente de la velocidad, la conductividad eléctrica de un gas de electrones libres de Maxwell-Boltzmann, puede expresarse como
a= 4ne 2Afy2TTmkT.
7. Describa físicamente el origen del efecto termoeléctrico. (Nota: considere una barra
larga, la mitad de la cual se mantiene a la temperatura T 1 y la otra a la temperatura T2 (>T 1 )
Y calcule los flujos electrónicos en ambas direcciones en la interfaz entre las dos regiones. Use la
estadística de Maxwell-Boltzmann.)
t
r-
</>(x)
T
<Po
~~~~~~~~~~~~~•=O
Superficie
230
Teoría del electrón libre de los metales
LECTURAS RECOMENDADAS
F. J. Blatt, Theory o[ Mobility o[ Electrons in Solids, Salid State Physics, Advances in Research
and Applications, Vol. 4, Academic Press, Inc., Nueva York (1957), pp. 199-366.
J. R. Drabble y H. J. Goldsmid, Thermal Conduction in Semiconductors, Pergamon Press, Oxford
(1961).
J.-P. Jan, Galvanomagnetic and Thermomagnetic E[[ects in Metals, Salid State Physics, Advances
in Research and Applications, Vol. 5, Academic Press, Inc., Nueva York (1957), pp. 1-96.
E. H. Putley, The Hall E[[ect and Related Phenomena, Butterworth & Co., Ltd., Londres (1960).
F. Seitz, Modern Theory o[ Solids, McGraw-Hill Book Co., Inc., Nueva York (1940), capítulo 4.
R. A. Smith, Wave Mechanics o[ Crystalline Solids, Chapman & Hall, Ltd., Londres (1961),
capítulo 1O.
J. Tauc, Photo-and Thermoelectric E[[ects in Semiconductors, Pergmon Press, Oxford (1962).
CAPITULO
8
Teoría cuántica de los electrones
en recles periódicas
8.1
INTRODUCCION
La teoría del electrón libre de los metales, desarrollada en el capítulo anterior,
se basa en la idea de que los electrones de conducción dentro de una substancia
metálica actúan como las partículas libres clásicas de un gas, sometidas sólo a las
limitaciones de la estadística de Fermi-Dirac. Desde el punto de vista de la mecánica
cuántica, no es evidente por qué debe suceder esto. Tampoco es evidente por qué
algunas substancias tienen gran cantidad de electrones libres y, por tanto son muy
buenas conductoras, mientras que otras apenas tienen algunos y se comportan como
aisladores.
El punto de vista más sencillo de la mecánica cuántica r<"specto a un electrón
. contenido en un cristal, es el de un solo electrón que se encuentra en un potencial
perfectamente periódico que tiene la periodicidad de la red. En este modelo de un
solo electrón de un sólido, el potencial periódico se puede considerar como resultado
de la distribución periódica de carga asociada con los núcleos iónicos situados en los
puntos reticulares, más el potencial "extendido" promedio (constante) aportado por
todos los demás electrones libres que pertenecen al cristal, de tal manera que se
tiene en cuenta la interacción promedio de un solo electrón con todos los demás.
En consecuencia, la solución de la ecuación de Schroedinger para un solo electrón
dentro de este potencial, proporciona un conjunto de estados de "un solo electrón"
que pueden estar ocupados exclusivamente por un electrón y, de hecho, que pueden
estar ocupados (de acuerdo con las limitaciones del principio de Pauli) por todos los
electrones del cristal, ya que el electrón único que se consideró inicialmente se
puede clasificar como típico de todos los electrones del sistema. La figura 8.1 muestra una representación unidimensional del potencial de un cristal periódico, como el
que podría obtenerse siguiendo una trayectoria a lo largo de una de las direcciones
;} 00> de un cristal cúbico con una constante de red a. En lo que respecta a la
representación cuántica de un electrón, normalmente se supondrá que la periodicidad
del cristal se extiende al infinito en todas las direcciones; pero, por supuesto, en la
ruperficie de cualquier cristal real la periodicidad se interrumpe siendo entonces la
función del potencial algo semejante a lo que se ilustra en el extremo izquierdo de
la figura 8.1. El espaciamiento reticular no será muy uniforme cerca de una superficie de esta naturaleza; pero, como cuestión práctica, generalmente se encontrará
que la periodicidad de red es casi perfecta después de unos cuantos espaciamientos
Jtómicos dentro del cristal.
231
232
Teoría cuántica de los electrones en redes periódicas
Se descubrirá que las funciones de onda de un ele~trón (denominadas funciones de Bloch) calculadas con el método anterior, siempre tienen ciertas propiedades
íntimamente relacionadas con la periodicidad reticular y que las energías electrónicas
permisibles ocurren en bandas de estados permitidos que están separados por regiones de energía prohibidas. Dentro de las bandas de energía permitidas se notará que
el comportamiento dinámico de los electrones es muy similar al de las partículas
libres. La cuestión de si un cristal es un conductor o un aislador, dependerá de si
los estados electrónicos dentro de una banda o conjunto de bandas permisibles dadas
están llenos por completo o parcialmente vacíos. Además, se verá que el comportamiento colectivo de los electrones dentro de una banda de estados permisibles casi
llena, es muy semejante al de unos cuantos portadores de carga positiva en una
Superficie
Figura 8.1.
-x
Representación esquemática del potencial dentro de una red cristalina perfectamente
periódica. La barrera de potencial de la superficie se muestra a la izquierda.
banda casi vacía. Por tanto, la representación de un solo electrón libre sirve para
justificar el modelo del electrón libre desde un punto de vista fundamental y también para contestar a ciertas preguntas difíciles que la teoría del electrón libre por sí
sola, ni siquiera podría tratar de explicar. No obstante, debe recordarse que el
método del electrón único es una aproximación en la que se omiten completamente
los detalles de las interacciones electrón-electrón.
8.2 EL TEOREMA DE BLOCH
El teorema de Bloch 1 es una proposición matemática relacionada con la forma
de las funciones de onda de un electrón para un potencial perfectamente periódico.
Sea una ecuación diferencial de la forma
d21/1
2 + f(x)ljl(x) =O
dx
(8.2-1)
1 F. Bloch, Z. Physik 52, 555(1928); los matemáticos han estado familiarizados con el
mismo resultado con el nombre de Teorema de Floquet. Por ejemplo, véase E. l. Whittaker y
(;.N. Watson, Modern Analysis. Cambrid~~e University Press (1948), página 412.
El teorémo de Bloch
233
en donde f(x) es una función dada que es periódica con un periodo a, de tal
manera que
f(x +a)= f(x).
(8.2-2)
Si es periódica la función de potencial V(x) para la ecuación unidimensional de
Schrodinger de la forma ( 4.8-5), entonces la ecuación de Schródinger será un caso
especial de la ecuación (8.2-1). Puesto que (8.2-1) es una ecuación diferencial lineal
de segundo orden, (para cualquier valor dado de energía e en 4.8-5) existen dos soluciones independientes g(x) y h(x) tales que
t/J(x) = Ag(x) + Bh(x)
(8.2-3)
representa la solución más general de (8.2-1). Puesto que f(x+a)=f(x), no sólo
g(x) y h(x), sino que también g(x+a) y h(x+a) satisfacen (8.2-1). Sin embargo,
.ualquier solución de (8.2-1) se puede expresar como una combinación lineal de g(x)
y h(x) de la forma (8.2-3). Entonces, en particular,
g(x + a)= o: 1 g(x) + o: 2 h(x)
(8.2-4)
h(x + a) = P1 g(x) + P2 h(x)
en donde a 1 , a 2 , {3 1 y {3 2 son constantes. Por tanto,
tf¡(x +a)= Ag(x +a)+ Bh(x +a)
(8.2-5)
Ahora, ¡J;(x +a) siempre se puede expresar en la forma
tf¡(x +a)= A.tf¡(x),
(8.2-6)
en donde A es una constante, a condición de que se escoja el valor adecuado para A.
Al comparar (8.2-5) y (8.2-3), se observa que si (8.2-6) debe satisfacerse, entonces,
. (8.2-7)
Este sistema de ecuaciones homogéneas en A y B tienen soluciones diferentes a
A = B =O, sólo si
(8.2-8)
La solución de esta ecuación cuadrática en A sirve para determinar los dos valores
posibles de A para los que (8.2-6) es cierta. Si se les desigana como A¡ y ;\.2 ,
tf¡(x +a)= A. 1 t/l(x)
tf¡(x + a) = A. 2 t/J(x).
(8.2-9)
234
Teoría cuántica de los electrones en redes periódicas
Si ahora se definen k 1 'y k 2 de tal modo que
(8.2-10)
y se define uk 1(x) y uk 2(x) como
uk,(x) = e-ik,xif¡(x)
(8.2-11)
si se utiliza (8.2·11), (8.2·9) y (8.2-10), es evidente que
(8.2-12)
La función uk entonces es periódica con un periodo a; de un modo similar esto
mismo es aplicable ~ uk 2 (x ). Por tanto, de acuerdo con (8.2-11 ), 1/l(x) puede escribirse siempre en la forma
(8.2-13)
en donde uk(x) es una función periódica con un periodo a, y en donde k representa
ya sea a k 1 o a k 2 tal y como se determinaron antes. Este es el teorema de Bloch
y todas las funciones de onda de un electrón para potenciales periódicos se pueden
escribir de este modo. En tres dimensiones, el teorema de Bloch se convierte en
(8.2-14)
Las funciones de onda (8.2-13) y (8.2-14) tienen claramente la forma de ondas
planas con un vector de propagación k modulado por una función cuya periodicidad
es la de la red cristalina.
La función de Bloch (8.2-13) se puede considerar como la manera más general
de escribir una solución de la ecuación de Schrodinger que conducr a la misma
densidad de probabilidad 1/1* 1/1 en cada célula unitaria del cristal. De acuerdo con
(8.2-13), es evidente que en la nésima célula unitaria, debido a la periodicidad de uk,
(8.2-15)
De igu?l manera,
1/J*(x + na)= e-iknal/l*(x)
(8.2-16)
1/J*(x + na)if¡(x + na)= 1/J*(x)if¡(x).
(8.2-17)
y
La función de onda tridimensional (9.3-14) tiene el mismo tipo de comportamiento.
En el caso unidimensional, para un cristal infinito, se puede encontrar una
solución formal a la ecuación de Schrodinger para cualquier valor de energía e
El modelo de Kronig-Penney de un cristal infinito unidimensional 235
dentro de ciertos rangos, y se tienen dos valores de k correspondientes a cada uno
de estos valores de e, por medio de (8.2-8) y (8.2-10). Los valores propios de
energía permitidos para dicho sistema, dentro de esos rangos, son continuos. Por
otra parte, si el cristal tiene una extensión finita, en cuyo caso, sobre la superficie
se deben satisfacer las condiciones físicas apropiadas de frontera, entonces, las soluciones que satisfagan la ecuación de Schrodinger y, a la vez, las condiciones de
frontera pueden encontrarse pero, sólo para ciertos valores propios de energía discreta. Puesto que por cada valor propio de energía se tienen sólo dos valores relacionados de k, los valores permisibles de k forman también un conjunto discreto. En
este caso, la solución es muy similar a la que se encontró en relación con las
vibraciones mecánicas de una red periódica y que se analizó en la sección 3.3. Por
supuesto, cuando el número de átomos dentro del cristal se hace demasiado grande,
los valores permitidos de e y k, aunque siguen siendo discretos, se amontonan
mucho y en la mayoría de los casos se pueden considerar como bandas casi continuas de valores permisibles. Los cristales tridimensionales tienen el mismo comportamiento cualitativo, excepto que en este caso, se tienen más de dos valores permisibles de k para cada valor propio de energía.
Por ejemplo, si se imponen condiciones periódicas de frontera a un cristal
unidimensional de N átomos (o si se supone que la red tiene la forma de un anillo
de N átomos), entonces, si la funcion de onda 1/1 debe tener un solo valor, es
necesario (utilizando (8.2-15)) que
t/l(x +Na)= eikNatf¡(x) = t/J(x)
(8.2-18)
.JOr lo cual,
eikNa = 1
o bien,
2n:in
eika = (l)lfN =e--¡¡-
(n = 0,1,2, ·· · N - 1),
(8.2-19)
recordando la forma de las Nésimas raíces de unidad. Si se toma el logaritmo de
ambos lados de esta ecuación y se resuelve para k, se encontrará que, en estas
condiciones de frontera, los valores posibles de k son
2nn
k=n
Na
(n = 0,1,2, ... N).
(8.2-20)
Si N es grande, habrá muchos valores permitidos de k dados por (8.2-20) y, en
este caso, se puede considerar que forman un rango casi continuo de valores. Por
supuesto, los N valores distintos de k permitidos por (8.2-20) no corresponden al
mismo valor de energía. Por cada valor constante de e se tendrán sólo los dos
valores permitidos de k dados por (8.2-10).
8.3
EL MODELO DE KRONIG-PENNEY DE UN CRISTAL
INFINITO UNIDIMENSIONAL
Para el caso del potencial periódico infinito de un pozo cuadrado unidimensional que se ilustra en la figura 8.2, se puede llegar a una solución exacta de la
236
Teoría cuántica de los electrones en redes periódicas
ecuación de Schródinger. Kronig y Penney 2 fueron los primeros en investigar esta
solución y, aunque se relaciona con un potencial periódico algo idealizado que cons·
tituye sólo una aproximación burda del que se encuentra en un cristal real, es de
gran utilidad porque sirve para ilustrar de un modo más explícito muchas de las
características físicas importantes del comportamiento cuántico de los electrones en
redes periódicas. Las funciones de onda asociadas con este modelo se pueden calcu·
lar con aproximación de un electrón, resolviendo la ecuación de Schrodinger
d 2 1/1
dx 2 +
2m
¡r- (e- V(x)(l/l(x) =O
(8.3-1)
para un solo electrón dentro del potencial periódico V(x) según se ilustra en la fi.
¡V (x)
-Vo
o
u-J
1
U2
Figura 8.2.
--__..,X
a+b~
(celda
unitaria)
u,(x)
Potencial periódico ideal de pozo cuadrado usado por Kronig y Penney para ilustrar
las características generales del comportamiento cuántico de los electrones en redes
periódicas.
gura 8.2. Puesto que, de acuerdo con la sección anterior, las funciones de onda deben
tener la forma de Bloch, se puede esperar que
(8.3-2)
Al substituir (8.3-2) en (8.3-1), se encuentra que la función u(x) debe satisfacer
d2u
du
(
2m V(x))
dx2 + 2ik dx- k2 - cx2 +
¡¡2
u(x) =O
(8.3-3)
en donde
(8.3-4)
Para el potencial de la figura 8.2, se encontrará que
(0 < x <a)
2. R. de L. Kroni~ y W. G. Penney, Proc.
Roy. Soc. Al30, 499 (1931).
{8.3-5)
El modelo de Kronig-Penney de un cristal infinito unidimensional
237
y
( -b <X< 0),
(8.3-6)
en donde u 1 (x) representa el valor de u(x) dentro del intervalo (O<x<a) y u 2 (x)
representa el valor de u(x) dentro de (- b < x < 0), y en donde
(8.3-7)
Las ecuaciones rliferenciales (8.3-5) y (8.3-6) se resuelven fácilmente mediante
procedimientos normales y se obtiene
(0 < x <a)
(8.3-8)
( -b <X< 0},
'(8.3-9)
en donde A, B, e y D son constantes arbitrarias. Se observará que la cantidad (3 es
puramente imaginaria para O< e< V0 .
El requisito de continuidad para la función de onda 1/J y su derivada en x = a
y x =- b, requiere que la solución u(x) satisfaga estas mismas condiciones, ya que
en (8.3-2) eikx es una función apropiada. Si se aplican estas condiciones de frontera
(y se recuerda que, dado que u(x) tiene la periodicidad de la red, u 1 (a)= u 2 (- b )), se
encuentra que
i(a. -
k)A -
Aei<cx-k)a
i(a. + k)B = i(p - k)e - i(P + k)D
(8.3-10)
+ Be-i<cx+k)a = ee-i<IJ-klb + Dei<IJ+k)b
i(a.- k)Aei(cx-k)a- i(a. + k)Be-i(cx+k)a = i(P- k)ee-i(/1-k)b- i(p + k)Dei(/l+k)b
Por tanto, los coeficientes A, B, e y D se pueden determinar como la solución
de un grupo de cuatro ecuaciones homogéneas simultáneas y lineales en dichas cantidades. Por supuesto, no existe ninguna otra solución aparte de A = B = e= D = O, a
menos que desaparezca el determinante de los coeficientes. Esto requiere que
1
a.-k
1
1
1
-(a.+ k)
P-k
-(P +k)
ei(cx-k)a
e-i(cx+k)a
e-i(/1-k)b
ei<fJH)b
(a._ k)ei(cx-k)a
-(a.+ k)e-i(cx+k)a
(p _ k)e-i<IJ-k)b
-(P + k)ei(/l+k)b
=O.
(8.3-11)
Al expander el determinante, se puede demostrar, después de muchas operaciones algebraicas tediosas, pero directas, que (8.3-11) se puede expresar como
a.2 + p2
- ·--:¡;¡¡-sen a.a sen Pb + cos a.a cos Pb = cos k( a + b).
(8.3-12)
238
Teoría cuántica de los electrones en redes periódicas
Puesto que en el rango (O< e< V0 ), {3 es imaginaria según lo define (8.3-7),
para estos valores de energía es más conveniente expresar (8.3-12) en una forma
ligeramente distinta. Haciendo que
f3 = iy
(8.3-13)
en esta región y observando que cos ix = cosh x
ción (8.3-12) se puede escribir como sigue
y sen ix = i senh x, la ecua-
y2 - a2
- 2- - senh yb sen aa + cosh yb cos cxa = cos k( a + b),
ay
(8.3-14)
en donde 'Y es una cantidad real positiva en el intervalo (O< e< V0 ), al igual que {3
lo es en el intervalo (V0 <e<""). En consecuencia, es más conveniente usar
(8.3-12) cuando (V0 <e<oo) y (8.3-14) cuando (O<e< V0 ).
Las funciones de onda (8.3-2), como todas las funciones de onda, deben tener
un comportamiento adecuado conforme x tiende a ± oo. Puesto que u(x) es una
función periódica cuyos valores son los mismos en cada célula unitaria, no se encuentran dificultades en este aspecto a condición de que el factor eikx de (8.3-2) se
mantenga finito en estas condiciones. Sin embargo, eikx cumple con lo anterior
tanto en + oo como en - oo sólo si k es real, por lo que eikx es oscilatoria. Si k
fuere imaginaria, eikx divergiría al infintio ya sea en + oo o - oo, y la expresión
resultante para ¡J¡(x) no se comportaría debidamente como función de onda. Por
tanto, se deben aceptar sólo funciones de la forma (8.3-2) con, valores reales de red
k. Las expresiones anteriores (8.3-12) y (8.3-13) tienen en el lado izquierdo una
función de la forma K 1 senaa+K 2 cosaa que debe ser igual a cosk(a+b). Si para
un valor dado de energía la función del lado izquierdo de estas ecuaciones cuenta
con un valor dentro del rango comprendido entre + 1 y - 1 . el valor requerido
para cos k(a+ b) se obtiene con un valor real para el argumento k(a+ b ), Por otro
lado, si el valor de la función del lado izquierdo de (8.3-12) o (8.3-14) queda fuera
de dicho rango, esto significaría que cos k(a + b) tendría que ser mayor que + 1 o
menor que - 1, lo cual, a su vez, requiere que el argumento k( a + b) sea un número
complejo con una parte imaginaria diferente a cero. En estas circunstancias, las
soluciones (8.3-2) no se comportarían debidamente en infinito y no satisfarían el
requisito físico para las funciones de onda del sistema. Las energías asociadas con
estos valores de k estarían prohibidas para el electrón.
Los lados izquierdos de (8.3-12) y (8.3-14) se pueden escribir en la forma
K 3 sen(aa -6), en donde K 3 =(K~ +KD 1 12 y tan 6 = K¡fK2. En esta forma (8.3-12)
y (8.3-14) se pueden escribir como sigue
(8.3-15)
en donde
tan éJ = -
a2 + {32
2af3 tan flb
CVo <e< oo)
y
[1 +
(a2 + /)2
] 1/2
2
cos(aa - <5) = cos k(a + b),
4a 2 y2 senh yb
rn clonde
tan <5 =
a2 + y2
2ay tanh yb
(O< e< V0 ).
(8.3-16)
El modelo de Kronig-Penney de un cristal infinito unidimensional
239
De acuerdo con estas expresiones, es evidente que en ambos casos, el lado
izquierdo tiene la forma de una función coseno por un factor de modulación cuya
amplitud es invariablemente mayor que la unidad. El valor de este factor de modu·
!ación en realidad, es un máximo para a= O (y, por tanto, para e= O), y se acerca
a la unidad en el límite de las energías grandes, en donde a ~ (3.
Cuando los lados izquierdos de (8.3·15) y (8.3-16) se grafican como una función de la energía, en cuyo caso se debe observar a partir de (8.3-4) y (8.3-7) que
(8.3-17)
los resultados son como se ilustra en la figura 8.3. En esta figura, el lado izquierdo
de (8.3·15) o (8.3-16) aparece graficado en función de la energía. Cuando la orde·
f(•)
+,.
k==-
o+b
Figura 8.3.
Gráfica de las funciones del lado izquierdo de (8.3-15) y (8.3-16) en función de la
energía. Las regiones sombreadas señalan las bandas de energía prohibidas en donde
el valor de k es complejo, las regiones no sombreadas son las bandas de energía
permisibles correspondientes a valores reales de k.
nada de la curva está entre + 1 y - 1, existe un valor real para k correspondiendo a
funciones de onda físicamente posibles. No obstante, fuera de estos límites, k debe
ser compleja con una parte imaginaria diferente a cero. Estos valores de k nunca
pueden producir funciones de onda con un significado físico; los rangos de energía
correspondientes están prohibidos y se ilustran en la figura 8.3 como las regiones
sombreadas. Por tanto, se tienen regiones alternas de valores propios permisibles y
regiones prohibidas. Estas regiones se denominan casi siempre bandas de energía
permisibles y prohibidas y el agrupamiento de los valores de energía permisibles en
estas bandas es una de las características típicas más importantes del comporta·
miento de los electrones en redes periódicas. Se puede demostrar que las bandas de
energía que tienen los mismos aspectos cualitativos que los que se indican en la
figura 8.3, se forman sea cual fuere la forma detallada del potencial, siempre y
cuando sea periódico.
240
Teoría cuántica de los electrones en redes periódicas
c(k)
1
1
1
1
1
1
1
/-Partícula libre
1 (e= ·Pk 212m l
1
A
'i
l\
1\
1 1
1 1
1
1
1
1
1
1
1
1
-3,.
o•b
Figura 8.4.
•o
1
1
\
1
1
1
1- k(•ol
lk(•ol
-2,.
o•b
~
o•b
o
_!!_
o•b
k
o+b
_k
o+b
-*
..1!_
o+b
La energía € graficada como una función de k de acuerdo con (8.3-15) y (8.3-16).
Si se usan (8.3-1 5), (8.3-16), (8.3-4) y (8.3-7), se puede grafic:.~r una curva que
presente a la energía e como una función de k. En la figura 8.4 se muestra el
resultado de una manera esquemática. Las bandas de energía prohibidas y la relación
de e en función de k dentro de las diferentes bandas permitidas, se han asignado de
acuerdo con el patrón que aparece en la figura 8.3. Puesto que cos- 1 k(a + b) n0 es
una función de un solo valor, esta asignación es necesariamente arbitraria. Para
energías grandes, es aparente que la función e(k) se acerca a la relación del electrón
libre e= h2 k 2 /2m (que se ilustra con la curva punteada de la figura 8.4) de un
modo muy semejante dentro de las bandas permitidas. Así también, para energías
grandes, se ha encontrado que las bandas permitidas se hacen muy anchas y las
regiones prohibidas muy angostas. No obstante, la curva e(k) siempre tiene una
pendiente cero en los bordes de las bandas permisibles, es decir, cuando k = ± mr/
(a+ b), siendo n un entero. Este resultado se puede corroborar mediante la derivación directa de (8.3-1 S) y ( 8.3-16); pero aquí no se verán los detalles de estos
cálculos. Esta característica de la curva e(k) es muy general y se puede demostrar
que se presenta incluso en el caso tridimensionaL independientemente de la forma
matemática precisa de la función de potencial.
8.4
CANTIDAD DE MOVIMIENTO DEL CRISTAL
Y MASA EFECTIVA
forma
Si la función uk(x) de (8.2-13) es una constante, la función de onda tiene la
e±ikx correspondiente a un electrón perfectamente libre cuya cantidad de
Cantidad de movimiento del cristal y moSil efectiva
241
movimiento es p = ± lik y cuya energía, de acuerdo con los resultados de la sección 4.9, sería
(8.4-1)
En la figura 8.4 se ilustra esta relación por medio de la curva punteada. Para
valores grandes de e, la relación real e en función de k se acerca mucho a esta
relación. De acuerdo con (8.2-13) y los resultados de la sección anterior, es evidente
que k es una constante del movimiento, que lik tiene las dimensiones de una cantidad de movimiento y que al aumentar la energía del electrón (haciéndose, por ende.
la partícula mucho más "libre"), los valores de k se aproximan en general a los de
la cantidad de movimiento de la partícula libre dividido.; entre h. Se puede ver con
facilidad que estas conclusiones se deben aplicar sea cual fu~re la forma partícular
que adquiera el potencial periódico. Por tanto, se acostumbra referirse a lik corno la
cantidad de movimiento del cristal y, corno se verá en breve, sucede en muchos
casos que el comportamiento dinámico del electrón dentro de la red cristalina, con
respecto a la cantidad de movimiento del cristal, es muy similar al de una partícula
libre con respecto a la cantidad de movimiento real. Para que quede perfectamente
clara la diferencia entre la cantidad de movimiento real y la cantidad de rnovi.Jnjento
del cristal, se debe observar que debido a la presencia del potencial de red, la
cantidad de movimiento real instantáneo de un electrón no es en absoluto una
constante del movimiento y no se calcula directamente por métodos de la mecánica
cuántica, excepto corno un valor promedio, en tanto que para un estado de energía
dado, la cantidad de movimiento del cristal lik es un valor constante perfectamente
bien definido al igual que lo es la cantidad de movimiento real de una partícula
libre de cierta energía.
Ahora se verá el movimiento de un electrón dentro de un cristal bajo la
influencia de un campo eléctrico aplicado. Para comprender mejor el movimiento de
un electrón en esta situación, se deberá localizar la función de onda superponiendo
soluciones que tienen distintos valores de k, corno se hizo en la sección 4.9. Si se
hace esto, la velocidad de grupo asociada con el "paquete de ondas" del electrón, es
dw
1 de
Vg = dk =
h dk'
(8.4-2)
en donde, por supuesto, e y w tienen una conexión a través de la relación de
Planck e= :liw. Supóngase que hay un campo eléctrico externo E que actúa sobre el
electrón, que adquiere un incremento en velocidad dvg en una distancia dx, en un
tiempo dt. Entonces, si se usa (8.4-2), se observa que
de
eE de
de=-dk= -eEdx= -eEv dt= - - - d t
dk
g
li dk '
(8.4-3)
de donde,
eE
dk= --dt
li '
(8.4-4)
dk dp
li - = - = -e E = F
dt
dt
'
(8.4-5)
o bien,
242
Teoría cuántica de los electrones en redes periódicas
en donde ahora se tiene el símbolo p para denotar la cantidad de movimiento del
cristal. La ecuación (8.4-5) indica que la capacidad de cambio respecto al tiempo de
la cantidad de movimiento del cristal es igual a la fuerza - eE. Por tanto, es análoga
a la ley de Newton, que demuestra que la cantidad de movimiento del cristal del
electrón en una red periódica cambia bajo la influencia de un campo aplicado, en la
misma forma que lo hace la cantidad de movimiento real de un electrón libre en el
vacío.
Si se deriva la expresión (8.4-2) con respecto al tiempo, el resultado es
(8.4-6)
que, usando (8.4-5), se puede escribir como sigue
(8.4-7)
en donde la masa efectiva m* está dada por
(8.4-8)
La expres10n (8.4-7) es fundamentalmente la ecuac10n de fuerza, de Newton.
El factor de proporcionalidad que relaciona a la fuerza eE y a la aceleración dgg/dt
se puede considerar como la masa efectiva del electrón. Sin embargo, la masa gravitacional real del electrón no se relaciona directamente con la masa efectiva; se trata
de la cantidad d 2 e/dk 2 que es el factor importante. Si el electrón en realidad es
libre, entonces e y k se relacionan por medio de (8.4-1) y (8.4-8) se reduce a
m*= m. Si la energía es una función parabólica de k, que tiene la forma
(8.4-9)
entonces, la masa efectiva tiene un valor constante m*= h2 /2C y el comportamiento
dinámico del electrón será el mismo que el de una partícula libre con esta masa
efectiva. Si la energía no es una función parabólica de k, entonces dicha masa no
será constante con la energía y el comportamiento dinámico será el de una partícula
de masa variable complicándose con ello la situación. En cualquier caso, para una
primera aproximación, todo el efecto del potencial del cristal periódico reside en
substituir la masa del electrón libre por una masa efectiva.
Afortunadamente, la relación que asocia a e con k es casi siempre parabólica o
casi parabólica sobre el rango de energías accesible a un electrón dentro del cristal.
De acuerdo con la figura 8.4, parece ser que la curva e en función de k tiene
siempre una forma parabólica en la base y la parte superior de las bandas de energía
permisibles. Sin embargo, incluso cuando los electrones del sistema están en otras
regiones, lo importante es que la masa efectiva sea fundamentalmente constante
sobre un intervalo de energía, del orden de la cantidad promedio de energía que una
partícula puede adquirir o perder en un solo evento de dispersión, o entre varios
eventos de dispersión en un tiempo del orden del tiempo de relajación. Esta cantidad de energía es del orden de kT No obstante, a 300°K, kT representa sólo
0.025 eV, y la anchura total de una banda de energía que puede desempeñar un
papel importante en los procesos de transporte en substancias cristalinas típicas es
Representación de zona reducida; electrones y huecos
243
mucho mayor que esto casi siempre del orden de 1 eV. En eventos de dispersión
independientes o en intervalos entre eventos de dispersión sucesivos, un electrón estará
confinado casi siempH~ dentro de un corto segmento de la curva E en función de k,
que casi siempre se puede considerar como aproximadamente parabólico.
Esto hace ver que la representación del electrón libre en un metal está justificada en su mayor parte, y la única corrección importante es que la masa del
electrón libre debe substituirse en todos los casos por una masa efectiva apropiada
relacionada con la forma de la curva E en función de k, por medio de (8.4-8). En
consecuencia, se llega a la conclusión de que todos los resultados derivados en el
capítulo 7 basándose en la teoría del electrón libre, son correctos a condición de
que la masa del electrón se substituya con la masa efectiva apropiada. La masa
efectiva se puede deducir por comparación de los datos del calor específico electrónico que se han obtenido a través de la experiencia, con el resultado del electrón
libre dado por la ecuación (7. 7-25); también se puede L alcular desde el punto de
vista de la mecánica cuántica principiando con las funcione~ de onda atómicas autoconsistentes para los átomos del cristal, que luego se combinan para dar un potencial
de cristal apropiado para la substancia en cuestión. Los valores calculados de este
modo concuerdan casi siempre con los que se determinan de un modo experimental.
Para la mayoría de los metales, la masa efectiva varía entre la mitad y el doble de
la masa del electrón libre, aunque para muchos metales de transición es mucho
mayor y para ciertos compuestos del tipo III-V puede ser mucho menor.
8.5
REPRESENTACION DE ZONA REDUCIDA;
ELECTRONES Y HUECOS
En la figura 8.3 se ilustra la asignacwn de rangos de valores para k dentro de
cada banda de energía permitida, lo cual produce la curva que aparece en la figura 8.4. Puesto que el único requisito que se debe llenar dentro de cada banda es
que - 1 .:;;; cos k(a + b) .:;;; + 1, es evidente que esa asignación de valores para k a
cada banda no es única. La ventaja de la asignación ilustrada en la figura 8.3 es que
lleva a lo que se llama representación extendida de la figura 8.4, en la que es muy
evidente la relación con la curva de la partícula libre E en función de k. Sin
embargo, se podría trasladar cualquiera de los segmentos de la curva que aparece en
la figura 8.4, a la derecha o a la izquierda, en forma paralela al eje k y a una
distancia 2mr/(a + b), en donde n es un entero y se seguirán satisfaciendo las relaciones (8.3-15) y (8.3-16), ya que cualquier transformación de esta índole no varía
el valor de cos k( a + b ).
A veces es muy útil hacer una transformación particular de este tipo trasladando los diferentes segmentos de la curva E en función de k a la derecha o la
izquierda, en forma paralela al eje k y a distancias que son múltiplos enteros de
2n/(a+b), de tal manera que todos queden dentro del intervalo -nf(a+b)<k<n/
(a + b). La representación resultante de la energía en función de la relaci0n de la
constante de propagación se conoce con el nombre de representación de zona reducida. La representación de zona reducida de la curva de la figura 8.4 se ilustra en
la figura 8.5. En cualquier caso, se observará que las funciones de onda de Bloch
(8.2-13) satisfacen la condición de reflexión de Bragg (2.1-1) en los puntos k= nn/
(a + b ), como se vio en relación con las vibraciones mecánicas de la red de la
sección 3.3. En estos puntos, la velocidad de grupo h- 1 dE/dK es cero, correspondiendo a una onda estacionaria que representa a un electrón en reposo. Se puede
considerar que el electrón sufre una difracción interna por medio del potencial de
244
Teoría cuántica de los electrones en redes periódicas
dk)
_,._
O+b
Figura 8.5. Representación esquemática de la gráfica de € en función de k, de la figura 8.4,
transformada a la representación de zona reducida.
red en estas circunstancias. En una sección posterior se ampliarán los conceptos relacionados con este tema.
En el cristal infinitamente grande de la sección 8.3, las energías permitidas
forman un continuo de valores dentro de las bandas permisibles. Sin embargo, si el
cristal tiene una extensión finita y contiene un total de N átomos, ya se vio, de
acuerdo con (8.2-20), que por el contrario, sólo se tendrán N estados propios permisibles específicos de la cantidad de movimiento del cristal k dentro de cada banda
de energía permisible. De acuerdo con la figura 8.4, se puede ver que para una
energía dada e0 , los dos valores de cantidad de movimiento de cristal permisibles son
k(e 0 ) y - k(e 0 ). Desde el punto de vista físico, el primero representa un estado en
el que un electrón se mueve hacia la derecha con la cantidad de movimiento positivo del cristal k(e 0 ), en tanto que el segundo representa un estado en el que un
electrón se desplaza hacia la izquierda con una cantidad de movimiento del cristal
igual y opuesta. Evidentemente, la energía es la misma en ambos casos. El efecto del
espín de electrón, en este caso, al igual que en sistemas atómicos aislados, es duplicar el factor de degeneración asociado con todos los niveles de energía del sistema,
ya que se debe considerar que cada estado cuántico se ha dividido en dos alojando
uno de ellos a un electrón con "espín ascendente" y el otro, un electrón con ''espín
descendente". Entonces, cuando se incluye el efecto del espín electrónico, se debe
llegar a la conclusión de que dentro de cada banda de energía permisible del sistema
se tienen exactamente 2N estados cuánticos.
A una temperatura de cero absoluto, los electrones del sistema ocuparán estos
estados, uno por cada estado, como lo requiere el principio de exclusión de Pauli, a
partir del estado más bajo y en forma ascendente, hasta una energía dada que se
determina mediante el número de estados disponibles, su distribución de energía y el
número de electrones del cristal. Por supuesto, esta energía es la de Fermi del cristal
a la temperatura cero. En un cristal unidimensional, algunas de las bandas permisibles estarán totalmente llenas, algunas completamente vacías y otras llenas sólo en
Representación de zona reducida; electrones y huecos
245
parte. 3 Si se aplica un campo eléctrico, es evidente que las bandas vacías no podrán
aportar ninguna corriente; sin embargo, también es cierto que no se puede obtener
una corriente de las bandas llenas. Esto se puede comprender observando que la
densidad de corriente que se produce en una banda dada será
(8.5-1)
en donde ¡:; es la velocidad promedio y n 0 el número de electrones por unidad de
volumen pertenecientes a dicha banda. No obstante, v se puede expresar como sigue
(8.5-2)
en donde la suma se toma de todas las velocidades a,.ociadas con los electrones
individuales dentro del volumen V del material. Por tanto, si se usa (8.5-2), la
expresión (8.5-1) se puede escribir como
(8.5-3)
Sin embargo, esto debe dar cero cuando se suma sobre una banda completa,
ya que debido a la simetría de las curvas de la figura 8.4 o la figura 8.5, alrededor
del eje E( k) por cada estado de velocidad positiva h- 1 aEjak correspondiente a un
punto de pendiente positiva, existe un estado correspondiente a una velocidad negativa de igual magnitud (con pendiente negativa) en k'=- k. Se debe llegar a la conclusión de que sólo las bandas que están parcialmente llenas pueden aportar un
flujo de corriente. Esto se comprende desde un punto de vista físico observando que
en la banda parcialmente llena existen siempre electroneo que se pueden excitar
gradualmente a estados desocupados de mayor energía y cantidad de movimiento,
mientras que en una banda llena, debido al principio de exclusión de Pauli, esta
excitación gradual de campo no puede ocurrir jamás debido a que todos los estados
están ya ocupados.
Un solo electrón en reposo en una banda vacía. ocupará el estado de energía
más bajo en la base de dicha banda, en ausencia de una excitación térmica, como se
puede ver en la figura 8.6. Si ahora se aplica un campo eléctrico E 0 al cristal, el
electrón experimentará una fuerza - eE0 y se excitará gradualmente a través de
estados de energía siempre creciente y cantidad de movimiento (negativa), adquiriendo una cantidad de movimiento cada vez mayor en la dirección - x, de acuerdo
con (8.4-5). De acuerdo con las predicciones de la teoría expuesta en las secciones 8.2-8.4, este proceso seguirá excitando al electrón a través de energías sucesivamente más altas, hasta que llegue a la parte superior de la banda en x = rrfa, en
donde a es el espaciamiento reti~.ular. Puesto que los puntos x = rrfa y x = - rrfa son
equivalentes, se puede considerar que el electrón "reaparece" en x = rrfa, disminuyendo su energía a lo largo de la porción derecha de la curva conforme k va de rr/a a
cero, llegando al punto inicial en el que todo el proceso se repite. En estas circunstancias, el movimiento del electrón es oscilatorio (oscilación de Zener). Es importante observar que no existe un mecanismo inherente a la teoría de las secciones 8.2-8.4 que sirva para limitar este movimiento; más bien, éste continuará de un
modo indefinido de acuerdo con la teoría aquí delineada. Si el potencial fuera
3 La situación en los sistemas bidimensionales y tridimensionales es más complc1a. Fn estos
casos, la energía de diferentes bandas se puede superponer y más de una banda puede estar
parcialmente llena. Estos sistemas se estudiarán Pn detalle más adelante.
246
Teoría cuántica de los electrones en redes periódicas
r(k)
----•w+-----~~~----_,~-k
o
Figura 8.6.
Un electrón que se encuentra cerca de la base de una banda permisible, sujeto a
fuerzas que tienden a acelerarlo a lo largo de la dirección -x.
perfectamente parabólico en lugar de tener la forma que se ilustra en la figura 8.6,
el electrón adquiriría una velocidad y energía ilimitadas. Entonces, se debe llegar a
la conclusión de que en cualquiera de los casos, el movimiento de un electrón libre
dentro de un potencial perfectamente periódico se realiza sin que lo impida la red,
en el sentido de que no se registran procesos de dispersión que detengan o aleatoricen la velocidad de un electrón, y que se relacionen con la misma
Sin embargo, si existe una desviación de la periodicidad perfecta de la red, este
resultado no se puede aplicar. En este caso existirá siempre la probabilidad de una
transición aleatoria repentina a un estado relacionado con otro valor de k dentro de
la banda. En promedio, estas transiciones aleatorias hacen que el electrón regrese a
k = O y se puede decidir que existe un proceso de dispersión asociado con el hecho
de que el potencial de red se aleja de la periodicidad perfecta. Esta desviación se
puede deber al hecho de que la red puede encontrarse a una temperatura superior al
cero absoluto, en cuyo caso las vibraciones térmicas que se establecen introducen
una leve aperiodicidad y las posiciones instantáneas de los átomos ya no coinciden
con precisión con la red periódica de sus posiciones de equilibrio. Esta situación se
puede analizar de acuerdo con una representación en la que los electrones se ven
dispersados por acción de los fonones. La desviaciones de la periodicidad pueden
causarse también por la presencia de átomos de impureza así como por vacíos de
red, átomos intersticiales dislocaciones y otros defectos estructurales de la red cristalina. Estos efectos dan como resultado los fenómenos de la dispersión de red, dispersión de impurezas y dispersión de defecto que se vieron en el capítulo anterior. El
estudio de los aspectos cuantitativos de estos procesos se pospondrá hasta un capí·
tulo subsecuente.
Estos procesos de dispersión hacen que el comportamiento de oscilación de Zener
no se presente jamás en la práctica. 4 Lo que en realidad sucede en todas las situaciones experimentalmente factibles, es que un electrón que principia en O de la
figura 8.6, se acelera como lo describe la teoría de las secciones 8.2-8.4, hasta que
llega a un punto A a una pequeña distancia a lo largo de la porción parabólica
inferior de la curva. Su compartimiento en este rango es el de un electrón libre de
masa m*, como lo establece (8.4-8). En el punto A se ve dispersado por uno de los
mecanismos antes descritos, llegando en promedio nuevamente a O, en donde se
4 Se puede encontrar un estudio cuantitativo de la oscilación de Zener en E. Spenke,
Electronic Scmiconductors, McGraw-Hill Book Co., Inc., Nueva York (1958), páginas 229, 257.
Representación de zona reducida; electrones y huecos
247
repite el ciclo. Entonces, el comportamiento es el de una partícula libre sujeta a
procesos de dispersión que se acaban de ver en el último capítulo, lo cual conduce a
la ley de Ohm, la conductividad térmica, el efecto termoeléctrico y todos los demás
resultados de la teoría del electrón libre de los metales, y la única diferencia es que
la masa del electrón se substituye por la masa efectiva en todos los procesos. La
distancia OA de la curva de e en función de k, de la figura 8.6, se ha exagerado
para facilitar la comprensión; pero en la mayoría de los casos que se presentan en la
práctica es mucho más pequeña.
Para una banda que contiene un número relativamente pequeño de electrones,
la corriente obtenida cuando se aplica un voltaje pequeño está dada por (85-3)
sumada sobre todos los electrones de la banda. Sin embargo, si la banda está casi
llena y se tienen sólo unos cuantos estados vacíos (que en el estado de equilibrio se
concentran cerca de la parte superior de la banda), 5 la ecuación de la corriente
(8.5-3) se expresa mejor escribiéndola en la forma
(8.5-4)
En este caso, la suma sobre i representa la adición sobre todos los estados de
velocidad ocupados por los electrones, la suma sobre ¡ representa la adición sobre
todos los estados de velocidad dentro de la banda y la suma sobre k representa la
adición sobre todos los estados de velocidad desocupados. Como se vio antes en
relación con (8.5-3), la suma sobre j, tomada sobre todos los estados de la banda, debe
desaparecer. La suma restante sobre los estados desocupados corresponde a una corriente que podría producirse por un número correspondiente de portadores de carga posztivos. Se puede (y es conveniente, como se verá más tarde) expresar la corriente de una
banda casi llena, como derivada del movimiento de un número comparativamente pequeño de estados electrónicos vacíos o huecos, que se comportan corno partículas positivas,
más que mediante un gran número de electrones. La velocidad asociada con un
hueco es la que tendría un electrón si ocupara un estado de energía vacío que
normalmente se encuentra en la parte superior de la banda de energía. Sin embargo,
puesto que la relación de e en función de k es cóncava hacia abajo, d 2 ejdk 2 es
negativa y da una masa electrónica efectiva negativa a partir de (8.4-8). Una partícula con masa efectiva negativa experimenta una aceleración en una dirección
opuesta a la de la fuerza aplicada. Una partícula negativa con una masa efectiva
negativa entonces se acelerará en la misma dirección que el campo aplicado y presentará el mismo comportamiento dinámico que una partícula positiva de masa positiva.
Por tanto, la situación de una banda casi llena se puede considerar como un caso en
que se abarca un número relativamente pequeño de partículas positivas de masa
positiva, que se designará como huecos, cuyas velocidades y cantidades de movimiento corresponden a los estados electrónicos desocupados dentro de la banda. En
un capítulo posterior se verá que en ciertos materiales, la naturaleza física y el
comportamiento dinámico de los huecos se comprenden con más facilidad relacionándolos con los defectos en los enlaces electrónicos de valencia que unen a los átomos
más cercanos y proporcionan las fuerzas de cohesión que mantienen unido al cristal.
S En una banda parcialmente vacía, los electrones ocupan los estados de energía más bajos
disponibles en ausencia de una excitación térmica. Esto es aplicable también a la banda casi
llena, en donde el resultado es que los estado vados se localizan en la parte superior de la
banda. Por tanto, en una banda casi completamente llena, los estado~ vacíos '·gravitan" ascendentemente en un diagrama como el de la figura 8.5, en el que la ordenada representa la ener~ía de
un electrón.
248
Teoría cuántica de los electrones en redes periódicas
No se analizará detalladamente el comportamiento de los electrones y los huecos
bajo la influencia de la fuerza magnética; pero se puede demostrar6 que se mueven
como lo harían partículas negativas o positivas de masa efectiva m*, según lo que
establece (8.4-8), bajo la influencia de la fuerza magnética normal q(v x B)/c.
8.6
LA APROXIMACION DEL ELECTRON LIBRE
En las secciones anteriores se vio cómo un modelo particular de potencial
periódico (que se ilustra en la figura 8.2) condujo a la formación de bandas de
energía permisibles y a una relar;ión de e en función de k de la forma que aparece
en la figura 8.4. La forma de esta relación fue tal que la cantidad hk se podí::.
considerar ventajosamente como una "cantidad de movimiento del cristal" en cuyos
términos se podía explicar de un modo sencillo la dinámica de los electrones en los
campos de fuerza aplicados. La representación resultante del comportamiento electrónico fue muy similar al del electrón libre del capítulo 7, excepto que la masa del
electrón libre se substituía por una masa efectiva y que los portadores de carga en
una banda casi llena tenían que considerarse como huecos positivos. Se dio énfasis al
hecho de que estas conclusiones cualitativas son independientes de la forma precisa
de la función de potencial, siempre y cuando sea periódico; se adoptó la función de potencial de la figura 8.2 sólo con fines ilustrativos, ya que permitía una solución exacta
de la ecuación de Schrodinger.
En cristales reales, la función de potencial que se utiliza debe estar relacionada
de .algún modo con el potencial real experimentado por un electrón, debido a los
núcleos iónicos y a todos los demás electrones del cristal. Una solución exacta de
este problema, incluso en la aproximación de un sólo electrón, sería imposible de
lograr, por tanto, se acostumbra a plantear el problema desde el punto de vista de la
aproximación del electrón libre o la aproximación de enlace firme, cualquiera que
sea el más apropiado para la situación particular de que se trate.
En la aproximación del electrón libre, se supone que la energía total del
electrón es siempre grande en comparación con la energía potencial periódica. En
estas condiciones, las bandas permisibles serán anchas y las regiones de energía prohibida muy angostas. Estas circunstancias nunca se realizan a la perfección en cristales
reales, dado que el potencial va siempre a - oo en los núcleos iónicos; pero para los
electrones más externos de muchos metales simples, incluyendo los alcalinos, los
requisitos se satisfacen aceptablemente en casi todo el volumen del cristal.
Si se adopta un modelo de potencial cristalino unidimensional para una mayor
facilidad, y el potencial periódico V(x) se escribe en la forma
(8.6-1)
en donde f(x) tiene la periodicidad de la red, la ecuación de Schrodinger (8.3-1) se
puede escribir como sigue
d 2 ~ +(k~+ yf(x))rf¡(x) =O.
(8.6-2)
dx
6 R. A. Smith, Wave Mechanics o[ Crystalline Solids, John Wiley and Sons, Nueva York
(1961, página 458)
La aproximación del electrón libre
249
en donde k 0 está relacionada con la energía total e por medio de
(8.6-3)
Puesto que f(x) es periódica, se puede expresar como una serie de Fourier de
la forma
00
¿ c.e-2"i•xta
f<x>=
(8.6-4)
n=- oo
siendo
c.= ~fa f(x)e2"inx/a dx,
a o
(8.6-5)
en donde a es la constante de red del cristal. De acuerdo con (8.6-1), es evidente
que los coeficientes Cn se relacionan con los coeficientes de expansión de Fourier
del potencial periódico propiamente dicho a través de
(8.6-6)
en donde Vn se relaciona con los coeficientes de expansión de Fourier de V(x).
Puesto que las funciones de onda deben tener la forma de Bloch eikxuk(x), y,
dado que uk(x) debe ser una función periódica con un periodo a, expresable como
una serie de Fourier, se puede escribir
uk<x> =
00
¿ b.e-2"i•x/a
(8.6-7)
n=- oo
tf¡(x) = eikxuk(x) = eikx ¿ b.e-2ninx/a.
•
(8.6-8)
Para electrones perfectamente libres, -y= O y las soluciones se convierten en
funciones ondulatorias de partícula libre de la forma
(8.6-9)
En este límite uk(x) ~ b 0 y k~ k 0 , de tal modo que en el caso general, se
debe esperar que todos los valores de bn, excepto b 0 , se acerquen a cero conforme
-y tiende a cero. En consecuencia, se puede escribir una expresión aproximada para
la función de onda de la forma
(8.6-10)
que puede esperarse sea válida para valores pequeños de -y (es decir, para las condiciones delineadas antes y de acuerdo con las cuales la aproximación del electrón
libre es válida). Es fácil ver que esta función de onda tiene la forma de Bloch, en
donde uk está dada por
uk<x> = bo +Y¿ b.e-2"i•xla.
... o
(8.6-11)
250
Teoría cuántica de los electrones en redes periódicas
Al substituir (8.6-10) en la ecuación de Schrodinger (8.6-2), se obtiene
L
bo(k~ - k 2 )eik:J: + y
[(k~ - k~)b,. + b0 c,.]eik"x
.... o
(8.6-12)
en donde
k =k_ 2nn
n
(8.6-13)
a
Puesto que el interés reside en la solución dentro del límite en donde 'Y-+ O,
como primera aproximación se puede hacer caso omiso del término -y 2 de ( 8.6-12);
entonces, multiplicando la ecuación completa por e-ikmx, integrando sobre la célula
unitaria desde x = O hasta x = a, se tiene que
b 0 (k~ - k 2 ) fa e2"imx/a dx + y L {[(k~ - k~)b,. + boc,.]
o
.... o
X fa é"i(m-n)x/a
Jo
dx} =O.
(8.6-14)
Si m = O, la segunda integral desaparece para todos los valores de n en la
suma, por lo cual
or
(8.6-15)
mientras que si m =1= O, la primera integral se desvanece y la segunda da cero, excepto cuando n = m, en cuyo caso se obtiene
o bien,
(8.6-16)
Entonces, a este orden de aproximación, de acuerdo con (8.6-15) y (8.6-3), la
relación entre e y k es la misma que la de una partícula libre. La función de onda
se obtiene substituyendo los valores (8.6-16) en lugar de bn en (8.6-10), de donde.
(8.6-17)
De acuerdo con (8.6-15) la corrección de primer orden para la energía de
partícula libre que se origina desde el potencial periódico es cero. La corrección de
energía de segundo orden se puede obtener reteniendo el término 'Y2 en (8.6-12). Al
multiplicar (8.6-12) por e-ikx e integrando desde x =O a x =a, se obtiene
(8.6-18)
La aproximación del electrón libre
251
La primera integral anterior es cero para todos los valores permisibles de n, en
tanto que la segunda integral es cero a menos que n =- n'. Por tanto, la ecuación
se reduce a
(8.6-19)
Si f(x) está dada como una serie de Fourier por medio de (8.6-4), entonces, al
substituir n por - n,
f(x) =
00
:¿ c_"e2ttinxta,
(8.6-20)
n=- oo
en tanto que, tomando el conjugado complejo de ambos lados de (8.6-4) y observando que puesto que f(x) es una función real, .f'(x) = f(x) se puede escribir también
00
f<x> =
:¿ c:e2ninxta.
(8.6-21)
n=-oo
Puesto que los coeficientes de Fourier asociados con la representación de una
función dada son únicos, se debe tener
(8.6-22)
Usando la expresión de la primera aproximación (8.6-16) para los coeficientes
bn y la relación (8.6-22), la expresión (8.6-19) se puede escribir en la forma
(8.6-23)
Si se usa (8.6-3) y (8.6-6) para expresar este resultado en función de e y Vn,
se puede demostrar fácilmente que
(8.6-24)
Estas soluciones son satisfactorias sólo a condición de que k 2 no se acerque
a uno de los valores k~. Si k 2 ~k~ para algún valor de n, una de las cantidades
k 2 - k~ de los denominadores de los términos de suma de (8.6-17) tenderán a cero
y dicho término seguirá siendo muy grande a pesar de que r sea muy pequeño. En
este caso, la expresión supuesta (8.6-1 O) no es una buena aproximación para la
función de onda y se debe emplear otra forma. Entonces, si k 2 ~k~,
2nn
k = ± kn = ±k :¡: - .
a
(8.6-25)
252
Teoría cuántica de los electrones en redes periódicas
Para el signo superior, esta ecuación da n =O, que se excluye de (8.6-17) en
cualquier caso y, por ende, no tiene ningún interés particular. Para el signo inferior
se obtiene
k= mt
(8.6-26)
a
que, puesto que n puede tomar valores positivos y negativos, se refiere a todos los
puntos de borde de la banda. Será necesario utilizar un planteamiento por separado
para valores de k en las cercanías de estos puntos.
Supóngase ahora que k~ mrfa, de donde kn =k- (2rrnfa) ~- nrrfa. Por tanto,
k~~ k 2 y bn será muy grande de tal modo que en (8.6-17) la cantidad rbn ya no
será pequeña aunque r sea pequeña. En este caso se puede escribir la función de
onda aproximadamente como
(8.6-27)
considerando que los otros términos de la suma de (8.6-17) son despreciables en
comparación con el nésimo. Puesto que kn = - k en el borde de la banda, esta función
de onda (8.6-27) es una superposición de una onda que se propaga a lo largo del eje positivo x y otra que se propaga en dirección opuesta; por tanto, tiene el carácter de
una onda estacionaria. Esta situación física concuerda con el punto de vista de que la
función de onda del electrón sufre una reflexión de Bragg en k = ± mrfa. Si la función de onda (8.6-27) se substituye en la ecuación de Schrodinger (8.6-2), utilizando
(8.64), se obtiene
Al multiplicar (8.6-28) por e-ikx y al integrar desde x =O hasta x =a, se
puede ver fácilmente que los términos segundo y tercero no contribuyen con nada y
que se obtiene una contribución del cuarto término sólo cuando n' = - n; el resultado final de esta operación es, entonces,
·
De igual manera, al multiplicar (8.6-28) por e-•k"x = e
do como antes, se puede demostrar que
"")x
-i(k- 2
a
e integran·
Las dos ecuaciones anteriores se p01eden considerar como un conjunto de ecuaciones homogéneas que determinan a b 0 y bn. Como tales, las soluciones diferentes
a bo = bn =O existen sólo si desaparece el determinante del sistema, es decir, sólo si
1
1
k o2 - k2
c.
y 2 c.*
1-
2
2
2
2
2
*
k2 _ k2 - (ko - k )(k 0 -k.)- y c. c.= O.
O
n
(8.6-31)
La aproximación del electrón libre
253
Esta ecuación es cuadrática en k~ y se puede resolver en la forma acostumbrada para dar
(8.6-32)
que, utilizando {8.6-3), (8.6-16) y {8.6-13), se puede expresar como sigue
2
2nn) ±
s(k) = 4ñm [ k 2 + ( k - --¡;-
2
J( ( --¡;-2nn)
k2 -
k-
2 2
)
+ (4miY.I)
-¡;r ] .
2
(8.6-33)
En el borde de la banda k = k 71 = mrfa, y, en estos puntos, (8.6-33) se reduce a
(8.6-34)
en donde
Bn
=~
(~) 2
2m a
(8.6-35)
representa la energía de partícula libre asociada con los puntos de borde de la
banda.
De acuerdo con los resultados de la sección 8.3, se sabe que en los puntos de
borde de la banda k=± mrfa, se produce una reflexión interna de Bragg que va
acompañada de una discontinuidad o "vacío de energía" en la curva de e en función
de k. 7 De acuerdo con esto, debe interpretarse que la ecuación (8.6-34) implica un
vacío de energía o banda prohibida con una anchura 21Vn l, en donde Vn es el
nésimo coeficiente de Fourier en la expansión de serie de Fourier del potencial reticular
periódico. Para valores de k de una magnitud mayor que mr/a se debe esperar que e(k)
sea mayor que el valor dado por (8.6-34) y que se acerque al valor del electrón libre predicho por (8.6-15), en donde k 2 difiere de k~ en una cantidad que puede hacer que 'Yhn
sea lo suficientemente pequeña de tal modo que el método que conduce a las ecuaciones
(8.6-1'6) y (8.6-24) sea legítimo. De igual manera, para valores de k con una magnitud
menor que mrfa, se puede esperar que e(k) sea menor que el valor dado por (8.6-34) y
que nuevamente se acerque a soluciones antes obtenidas, cuando k 2 difería de k~ por
una cantidad suficiente. Estas condiciones quedarán satisfechas si en (8.6-33) se
escoge el signo más para k> mr/a y el signo menos para k< mrfa. La solución
(8.6-15) o la segunda aproximación (8.6-24), que es mejor, en las regiones entre los
bordes de banda, junto con la solución (8.6-33) para las regiones cercanas a los
bordes de banda (los signos se seleccionan como se describió antes) conducen a una
relación entre e y k como la que se ilustra en la figura 8.7.
De acuerdo con esta figura, parece ser que las curvas de e en función de k son
aproximadamente parabólicas cerca de los puntos de borde de la banda. La masa
efectiva se puede establecer a partir de (8.4-8) mediante la derivación directa de
(8.6-33). Estos cálculos son muy elaborados y es más fácil proceder haciendo que
nn
k=-+k',
a
(8.6-36)
7 El hecho de que la velocidad de grupo del electrón, en efecto es cero en estos puntos
como es de esperarse para las ondas estacionarias que se asocian siempre con la reflexión de
Bragg, se puede demostrar a partir de (8.6-33); los detalles de esta corroboración se les asignan
como ejercicio al lector.
254
Teoría cuántica de los electrones en redes periódicas
c(k)
.,.
-.,.
o
Figura 8.7.
o
Representación esquemática de la relación € en función de k para la aproximación
del electrón libre, tal y como se obtiene a partir de (8.6-24) y (8.6-33)
en donde k' es pequeña en comparación con rr/a, en (8.6-33). Thspués de efectuar
algunas operaciones algebraicas, (8.6-36) se puede escribir en la forma
1i 2
e( k) = 2m
[(mt) 2+ k'2 + hl
mAe ~(n1t)2( 1i 2 )2]
\) + 4k'\-;; mAe
-;;
1
(8.6-37)
en donde
Ae = 21V.I
(8.6-38)
representa la anchura de la región de energía prohibida en k= nrr/a. Para puntos
cercanos al fondo de la banda superior, k' es muy pequeña y el radical de (8.6-37)
se puede expandir mediante el teorema del binomio que da, aproximadamente,
1
4e)
li 2 k' 2 (
e(k) = e. +- Ae + - - 1 + A n '
2
2m
Lle,
(8.6-39)
en donde En está dada por (8.6-35). Después de derivar dos veces y usar (8.4-8), es
evidente que
li 2
li 2
m
m* = d 2efdk 2 = d 2efdk' 2 = 1 + 4e. ·
(8.6-40)
Ae
Se puede demostrar de una manera similar que la masa efectiva para huecos
crrcanos a la parte superior de la banda inferior, es la misma que el valor de los
ele e trone~ dado por ( R.6-40).
La aproxifTIIlción del enlace firme
8.7
255
LA APROXIMACION DEL ENLACE FIRME
En la aproximación del electrón libre, la energía potencial del electrón se
supuso pequeña en comparacwn con su energía total. Esto condujo a un planteamiento aproximado en el que se encontraron bandas de energía prohibidas y permitidas, y en donde la anchura de las bandas prohibidas era pequeña en comparación
con la de las bandas permitidas en el límite en el que se satisfacía la suposición
inicial. La aproximación del enlace firme parte de un punto de vista contrario, esto
es, que la energía potencial del electrón representa casi toda la energía; en este caso,
las bandas de energía permitidas son angostas en comparación con las bandas prohibidas. En el modelo del electrón libre se supone que los átomos del cristal están tan
cerca unos de otros que las funciones de onda de los electrones de átomos circunvecinos se superponen en gran parte. Por tanto, existe una fuerte interacción entre
los átomos cercanos, y los estados de energía permisibles del cristal resultante tienen
muy poco parecido con las funciones de onda atómicas de los átomos individuales
de los que se compone el cristal. Sin embargo, la aproximación de enlace firme se
basa en la suposición de que los átomos del cristal están tan separados que la
función de onda de los electrones asociados con átomos vecinos se superponen sólo
en menor grado. La interacción entre átomos cercanos será relativamente débil en
este caso, y las funciones de onda y los niveles de energía permisibles de todo el
cristal estarán íntimamente relacionados con las funciones de onda y los niveles de
energía de los átomos aislados. Por supuesto, la pregunta de cuál de las dos aproximaciones es correcta para una situación dada, depende del material particular de que
se trate. En algunas substancias, la aproximación del electrón libre es muy apropiada,
en tanto que en otras, la aproximación del enlace firme es mucho más correcta.
Existen también cristales para los que ninguna de ellas es adecuada ya que se trata
de una situación intermedia entre estos dos casos extremos.
Las funciones de onda del cristal en la aproximación del enlace firme se basan
en las funciones de onda de átomos aislados. Si la función de potencial relacionada
con un átomo aislado es V0 (r), entonces la solución de la ecuación de Schródinger
(8.7-1)
representa las funciones de onda electrónicas del átomo. Supóngase que la función
de onda de estado basal 1/1 0 no está degenerada y corresponde a una energía de
estado basal e0 • Si un gran número de átomos de este tipo se combinan en una red
periódica, de tal manera que el valor del potencial en las regiones que rodean a cada
átomo individual en donde la función de onda de estado basal es grande, no se ve
muy afectada por la presencia de los átomos vecinos, la función de onda del cristal
(por lo menos para estos estados de enlace más firme) se puede escribir como una
superposición lineal de funciones de onda atómicas de la forma
t/J(r) = L: ant/JoCr - r"),
(8.7-2)
n
en donde los vectores r y r n se relacionan tal y como se indica en la figura 8.8. La
suma se toma sobre todos los átomos del cristal que, para mayor facilidad, se
supondrá que tienen una extensión infinita. Puesto que todos los átomos del cristal
son equivalentes, todos los coeficientes an deben tener el mismo valor absoluto; por
tanto, deben poder expresarse en la forma aél>n, en donde a y cf>n son cantidades
reales. Por la misma razón, la diferencia de fase cp entre cada par de átomos cerca-
256
Teoría cuántica de los electrones en redes periódicas
•
• p •
o
Figura 8.8.
•
•
•
•
•
•
•
•
•
•
•
Geometría vectorial usada en el cálculo de la sección 8.7.
nos a lo largo de cualquier eje cristalino dado, debe ser la misma (aunque no
necesariamente es idéntica a lo largo de los tres ejes). Esto conduce a la selección
del factor de fase tPn = k • rn en donde k es un vector constante. Por último, si las
funciones 1/1 0 están normalizadas de tal modo que su integral tomada sobre todo el
espacio es la unidad y, si se desea conservar esta normalización, se debe tomar
a= l. En consecuencia, (8.7-2) se debe escribir en la forma 8
t/lk(r) = L eik-r"t/1 0(r - rn)·
(8.7-3)
n
Estas funciones de onda satisfacen la ecuación de Schrodinger para todo el
cristal, con la función de potencial periódica de la figura 8.9, esto es,
(8.7-4)
El operador hamiltoniano total
partes,
:Yf
se puede escribir como la suma de dos
(8.7-5)
Potencial
1
r = rn
Figura 8.9.
Funciones de potencial utilizadas en los cálculos de la sección 8.7.
8 Se puede demostrar que la ecuac10n (8.7-3) tiene la forma de una función de Bloch
semejante a (8.2-14). Los detalles de esta comparación se asignan como ejercicio.
257
La aproximación del enlace firme
siendo
(8.7-6)
y
(8.7-7)
De acuerdo con (8.7·1), es evidente que Jff ot/Jo = e0 ¡J; 0 , por lo cual, utilizando (8.7-3),
J'f ot/lk =
L eik '•Jff ot/lo(r- rn) =BoL eik '"t/lo(r- rn) = Bot/Jk·
n
(8.7-8)
n
Ahora, de acuerdo con (4.14-5), la energía e se puede encontrar determinando
el valor esperado del operador hamiltoniano, de donde, usando (8. 7-5) y (8.7-8),
f
ft/lt L
t/I:(Jffo + Jff')t/lk dv
•~. ffN,ao
~•,+. .
eikr"[V(r) -- V0 (J- rn)Jt/10(r- rn) dv
f.•N.d•
(8.7-9)
A condición de que se haga caso omiso de la pequeña superposición de las
funciones de ondas atómicas centradas en diferentes puntos de la red, las propiedades de normalización de las funciones t/Jo y la defmición (8.7-3) requieren que
i
t/Jkt/Jk dv sea igual a .V, es decir, el número de átomos dE'l cristal. Si se usa este
hecho y se substituye el valor dado por (8.7-3) en lugar de t/Jk en el numerador de
(8.7-9), se obtiene
e= 60 + _!_ L \(L eik (r.-r,.)
N
n
J
t/JÓ(r- rm)[V(r)- V0(r- rn)]t/1 0(r- rn) dv}. (8.7-10)
v
m
Se verá que, debido a la periodicidad del cristal y a causa de la suma sobre todos
los valores de m, cada término de la suma sobre n da el mismo valor. El valor de la
suma sobre 11, por tanto es el valor de cualquier término de la suma (por ejemplo,
para mayor claridad, aquel para el que n = O) multiplicado por el número de términos de la suma, que es N En consecuencia, (8.7-10) se puede escribir como sigue
e( k)=
I
e + Le- ik '"' vt/ló(r- r"')[V(r)- V0(r)]t/1 0(r) dv,
0
m
(8.7-11)
en donde la suma se toma sobre todos los átomos del cristal. Sin embargo, puesto
que la función de onda t/1 0 desciende casi siempre de un modo muy rápido con
respecto a la distancia y, puesto que las magnitudes de las integrales de (8.7-ll)
están gobernadas esencialmente por la cantidad de superposición entre dos funciones
de onda centradas en átomos separados por distancias r m, las contribuciom.s de los
términos de la suma se reducen con gran rapidez conforme aumenta rm. Por tanto,
generalmente se tiene como buena aproximación al considerar sólo los ténninos del
vecino más cercano. De acuerdo con esto, se hará caso omiso de todos los térn;inos
258
Teoría cuántica de los electrones en redes periódicas
que se relacionan con las contribuciones que van más allá de la del vecino más
cercano en (8.7-11). También se supondrá que las funciones de onda 1/Jo son es[é·
ricamente simétricas; en estas condiciones, todas las aportaciones del vecino más
cercano serán idénticas. En consecuencia, este método se reduce al caso en el que la
configuración electrónica de estado basal en el átomo aislado es la de un estado s
como es, por ejemplo, para los metales alcalinos, aunque la extensión a los estados p
es lo suficient~::mente directa y puede lograrse sin grandes problemas. 9
Para el caso m= O, la integral de (8.7-11) se convierte en
J.l/ló(r)[V(r)- V0 (r)]if¡ 0 (r) dv = -oc,
(8.7-12)
mientras que, para los átomos más cercanos,
(8.7-13)
en donde rm es un vector que relaciona al átomo en el origen con el átomo vecino
más cercano. Puesto que el cálculo real de las integrales de superposición es mu}
complicado sólo se indicarán aquí los resultados en término de las cantidades que se
definieron antes como -a: y - {3. En estas circunstancias, la ecuación (8.7-11) se
puede escribir como sigue
e(k) = Bo -oc- f3 L e-ik •m,
(8.7-14)
m
en donde la suma sólo considera los átomos más cercanos. En ei caso de un cristal
cúbico simple, las componentes del vector rm se pueden expresar como
rm = (±a,O,O), (O,±a,O), (O,O,±a),
(8.7-15)
en donde a es la constante de red. La ecuación (8.7-14) da, entonces,
e(k) = e0 -oc- 2{3(cos kxa + cos kya + cos kza).
(8.7-16)
De acuerdo con esta ecuación, es evidente que existe un rango de valores de
energía permisibles correspondientes a varios valores que pueden tener kx, k y y kz.
Los estados permisibles forman una banda de energía más o menos en la misma
fom1a en que sucede con las que se vieron en relación con la aproximación del
electrón libre.
De acuerdo con (8.7-16), el valor mínimo de la energía está en kx =kv=
kz =O en ese punto, es decir, en el origen de una gráfica con coordenadas ortogo·
nales (kx, k y, kz) en el espacio k. Los valores máximos se producen en los vértices
de un cubo dentro del espacio k cuyas coordenadas son ( ± ~. ± ~. ± ~). en don·
a
a
a
de todas las permutaciones de los signos 1- y -- entre las tres coordenadas se toman
llon~.
9 Véa~e, por ejemplo, N 1· Mnlt y 11. Jones, Theory o[ Metals and Alloys, Dover PublicaNuev.1 York (1958), página 70.
La aproximación del enlace firme
259
para generar ocho puntos de los vértices. En estos sitios cada término de coseno
toma el valor - l. La diferencia de energía entre los puntos de energía máxima y
mínima es, de acuerdo con (8.7-16), 12 (3. Esta es la anchura de la banda de energía
correspondiente al estado s del átomo aislado. Si los átomos vecinos más cercanos están
muy separados, la superposición de las funciones de onda 1/; 0 (r) y 1/; 0 (r- rm), como
lo expresa el producto 1/; 0 (r)V; 0 (r- rm) en la integral (8.7-13), se hace muy pequeño
como sucede con el valor de {j según lo establece dicha ecuación. En el límite donde las distancias atómicas se hacen grandes (y es en este límite en donde son realmente adecuadas las aproximaciones en las que se basan los cálculos de enlace
firme), las bandas de energía permisible se hacen angostas acercándose a un solo
valor de energía discreta, correspondiendo al nivel energético del estado atómico s
conforme la separación se hace infinita. Esta variación de la anchura de banda con
el espaciamiento atómico se ilustra esquemáticamente en la figura 8.1 O
Niveles
atómicos
Bandas
permitidas
Distancia
ES::>---------+- interatómica o
" • Espaciamiento
de equilibrio
Figura 8.10.
o: 00
Representación esquemática de la divhión de los niveles discretos de energía atómica en bandas, conforme los átomos aislados se combinan en una red cristalina.
Para un electrón que se mueve en la dirección x, ky = kz =O. Si la cantidad
de movimiento es lo suficientemente pequeña de tal manera que kx ~ rrfa, el electrón estará cerca de la base de la banda de energía. En estas condiciones, al aproximar el cos kxa en (8.7-16) mediante los dos primeros términos de su expansión de
serie, (8.7-16) se convierte en
(8.7-17)
Esto muestra que la relación E en función de kx es parabólica y que, por
tanto, el electrón se comporta básicamente como si fuera libre. Como siempre, la
cantidad llkx se puede interpretar como la componente x de un vector de cantidad
de movimiento del cristal p = llk. La masa efectiva está dada por
(8.7-18)
260
Teoría cUIÍntica de los electrones en redes periódica
De acuerdo con la simetría de la ecuación (8.7-16), es obvio que la masa
efectiva asociada con el movimiento en las direcciones y y para todas las cantidades pequeñas de movimiento, será la misma que la que se dio en (8.7-18) y, por
tanto, la masa efectiva es isotrópica o independiente de la dirección. No obstante,
no siempre sucede así, sobre todo en cristales no cúbicos; la masa efectiva en este
caso es anisotrópica con frecuencia, y debe considerarse como un tensor. Este punto
se verá más detalladamente en la siguiente sección. De acuerdo con (8.7-18), parece
que conforme aumenta la distancia reticular a, disminuye la masa efectiva; sin embargo, lo que sucede es exactamente lo contrario, ya que conforme aumenta a, la
integral de superposición {3 disminuye con mucha mayor rapidez, de tal manera que
el producto {3a 2 disminuye rápidamente al incrementarse las distancias reticulares. Por
tanto, de acuerdo con (8.7-18), en el límite extremo del enlace firme, un electrón se
hace muy "pesado", lo c~al constituye una expresión del hecho de que, en estas
circunstancias, no se transfiere fácilmente de un átomo a otro.
8.8
DINAMICA DEL ELECTRON EN ESTRUCTURAS
BIDIMENSIONALES Y TRIDIMENSIONALES;
SUPERFICIES DE ENERGIA CONSTANTE
Y ZONAS DE BRILLOUIN
En esta sección se verá minuciosamente el comportamiento de los electrones en
redes periódicas bidimensionales y tridimensionales, utilizando siempre que se p_ue_da
el ejemplo del cálculo de la aproximación de enlace firme para la estructura cubica
simple, como ilustración de los principios generales en cuestión. Es evidente. que las
ecuaciones dinámicas de la sección 8.4 se pueden ex tender de un modo duecto a
una situación bidimensional, en cuyo caso se obtiene
(8.8-1)
para la velocidad del electrón, en donde Vk se refiere al operador gradiente en el
espacio ortogonal k cuyas coordenadas son (kx, ky, kz). Por tanto, se puede escribir
(8.8-2)
Si A es un vector cuyas componentes son las funciones de kx, ky y kz, cada
componente A~ (o:= x, y, z) debe satisfacer la relación
dA~= oA. dkx + iJAa '!_~ + iJA, dkz =(V kA). dk.
dt
okx dt
oky dt
okz dt
~
dt
(8.8-3)
El vector dA/dt, entonces puede expresarse, como el producto escalar del tensor10 Vk A y el vector dk/dt, de donde,
dA
dk
- - = (VkA) • -dt
dt '
(8.8-4)
lO t·:n l'l ¡1péndice B ~r incluye una hreve de~cripción del análisis ten~orial que se requiere
p.1ra l'ntrnder lo~ conccptm expucstm en este hhro.
Dinámica del electrón, superficies de P-nergía y zonas de Brillouin
261
cada componente del producto tensorial anterior conduce a una ecuación de la
forma (8.8-3). Al aplicar esta fórmula a (8.8-3), si se hace que k= p/h, se obtiene
(8.8-5)
Esta ecuación es básicamente la ecuación de fuerza de Newton dvg/dt = F/m*.
Sin embargo, es obvio que la recíproca de la masa efectiva es un tensor de la forma
(8.8-6)
Los elementos de este tensor son, claramente,
oe
2
li 2 okaokp'
(8.8-7)
lo cual demuestra que el tensor de masa efectiva recíproca es simétrico, es decir,
que
(1/m*)pa = (1/m*)afJ•
(8.8-8)
En general, se debe considerar que la masa efectiva es un tensor debido a que
la curvatura de la relación e(k) no es necesariamente la misma a lo largo de todas
las direcciones posibles dentro del espacio k; en consecuencia, es posible que se
tenga una masa efectiva diferente para cada dirección posible.
Para el cristal cúbico s1mple de la sección 8. 7, para valon:s ka ~ 1, la ecuación (8.7-16) se puede escribir en la forma
(8.8-9)
Esto permite ver que todos los elementos que están fuera de la diagonal del
tensor de masa efectiva (8.8-7) son cero, y que cada uno de los elementos sobre la
diagonal es igual a h2 /2{3t:z2, por lo cual el tensor se reduce a h2 /2{3a 2 por el tensor
unitario [Da¡¡]. La masa efectiva es claramente isotrópica en estas circunstancias y
puede representarse como la cantidad escalar h2 /2{32, lo cual concuerda con las
conclusiones de la sección anterior.
A continuación se investigará la forma de las superficies de energía constante
en el espacio k, para la estructura cúbica simple que se vio en la aproximación de
enlace firme en la sección anterior. La e~uación de estas superficies sencillamente es
(8.7-16) en donde e(k) se considera como una constante paramétrica. En relación
con (8.7-16) se mencionó que el valor mínimo de e se obtenía en el punto kx =
ky = kz = O, en donde todos los términos de coseno alcanzan el valor de la unidad.
Para valores de e ligeramente mayores que este mínimo, los cosenos deben estar
cerca de la unidad y, por tanto, los argumentos kxa, kya y kza deben ser todos muy
pequeños. En este caso, (8.7-16) se reduce a la forma antes indicada como (8.8-9),
que se puede reacomodar ligeramente para dar
e(k) e0 - oc - 6/3
2
2
2
kx + k, +k. = f3a 2 {3a 2
= consl.
(8J~-10)
262
Teoría cutintica de los electrones en redes periódicas
Evidentemente, esta es la ecuación de una esfera dentro del espacio k. La
forma esférica de todas las superficies de energía constante revela que los electrones
de esta región del espacio k se comportan como electrones libres; se observará en
(5.2-18) que, para partículas libres, es esférica la superficie de energía constante en
el espacio de la cantidad de movimiento. Conforme aumenta el valor de e, el radio
de la superficie esférica de energía constante también aumenta hasta que los valores
de k asociados con los puntos sobre la superficie se hacen tan grandes que la
aproximación ka < 1 ya no sigue siendo válida. En este caso, se debe usar la ecuación más general (8.7-16) para graficar las superficies de energía constante y, conforme aumenta e, las superficies que se obtienen son como se ilustra en la figura 8.11(a-f). Al incrementarse e, la esfera se expande, se distorsiona un poco, como
sucede en (b) y en e= e 1 + 413 (en donde e 1 es el valor de e en el punto mínimo o
e0 -a- 613) adquiere una furma casi octohédrica como la que se presenta en (e).
En este punto, la superficie de energía toca el cubo limitante, cuyo lado es 2rr/a,
sobre el cual se hablará más tarde. Conforme e aumenta más todavía, la superficie
adquiere la forma que se ilustra en (d), y cuando e= e 1 + 813 adquiere la forma que
aparece en (e). En este punto la superficie se divide en ocho hojas. cada una de las
cuales se acerca al vértice del cubo conforme e tiende a su valor máximo para la
banda e1 + 12/3. Estas ocho ramas tienen una forma aproximada de octantes de una
esfera en el límite en que e se acerca a su valor máximo. La superficie de energía
constante tiene siempre una simetría cúbica en este ejemplo. Las intersecciones de la
superficie de energía constante con el plano kxky se ilustran en la figura 8.12. Se
puede considerar también que estas curvas son las de energía constante correspondientes a un cristal bidimensional con una red cuadrada cuyo espaciamiento interatómico es a. De acuerdo con (8.7-16), es evidente que todos los estados dentro de la
banda deben tener una energía entre e 1 y e 1 + 12/3, y que todos los estados posibles
dentro de este rango de energía están representados por los valores de (kx, ky, kz)
1t)
1t
1t
que quedan dentro de los límites ( ± -,
± -,
±- .
a
a
a
Si se tiene un número dado de electrones que pertenecen a esta banda de
energía y si la temperatura está en el cero absoluto, los estados electrónicos de
energía estarán todos ocupados hasta una energía de Fermi dada, de acuerdo con el
principio de exclusión de Pauli. Por tanto, la distribución de electrones quedará
dentro de un volumen en el espacio k que está limitado por una superficie de
energía constante y en donde el valor de la energía sobre la superficie es la energía
de Fermi e1. Con frecuencia, esta superficie se denomina superficie de Fermi. De
acuerdo con la exposición de la sección 5.5, se vio que la superficie de Fermi para
electrones libres es una esfera. Para electrones que están dentro de un potencial
periódico de un cristal, la superficie de Fermi puede ser también aproximadamente
esférica si la banda está casi vacía o casi llena; este hecho se ilustra claramente en la
figura 8.11(a) y (f) para el ejemplo que acaba de verse en detalle. A temperaturas
que sobrepasan al cero absoluto, algunos de los electrones se excitarán a estados de
energía superiores a e1 , quedando fuera de la superficie de Fermi, y se tendrán
algunos estados desocupados dentro de esta superficie. En consecuencia, la transición
entre los estados llenos y vacíos ya no será muy marcada. No obstante, si la
temperatura es pequeña en comparación con la de Fermi, la región de transición será
muy delgada y la validez esencial del cuadro de la superficie de Fermi no se verá
afectada.
A continuación se examinará lo que sucede en les puntos de la superficie del
cubo limitante que encierra al volumen del espacio k, que pueden ocupar los estados
electrónicos pertenecientes a esta banda. Para mayor simplicidad, primero se limitará
la atención solamente al plano kxky; las soluciones de este plano se relacionan con
Dinámica del electrón, superficies de energía y zona de Brillouin
(o)
(ko«l)
263
(b) (•«1+4/3)
(e) (• =• 1+4/3)
(e) (• =•1+8/3)
Figura 8.11.
(f) (•1+8/3« «1+12t:l)
Configuraciones sucesiva; de la superficie de Fermi para un cristal cúbico simple
con funciones de onda e'féricamente simétrica' en la aproximación en donde sólo
se toman en cuenta las interacciones del vcl in o má~ cercano. Al aumentar la
población electrónica en la banda, elevando con ello, el nivel de Fermi desde la
base de la banda ha~ta la parte superior de la misma, la superficie de Fermi pasa
de la forma casi esférica que aparece en (a), atravesando las formas intermedias
compleja~ (b)-(e), hasta llegar a la configuración cubo menos esfera en la zona de
Brillouin ca'i llena ilustrada en (f).
una red cristalina cuadrada bidimensional. Sea un punto en el borde superior (o
inferior) de la región cuadrada que se ilustra en la figura 8.12; la coordenada ky de
este punto es rrfa, en tanto que la coordenada kx puede tener cualquier valor
arbitrario, por ejemplo, kxo· Entonces, la longitud de onda A. del electrón estará
dada por
(8.8-11)
264
Teoría cuántica de los electrones en redes periódicas
en tanto que el seno del ángulo incidente e relacionado con un conjunto de planos
cristalinos paralelos al eje x, es
sen
e=
ky
Jk~ +k;
=
nfa
.
Jk2
n2
.xO
(8.8-12)
+ a2
De acuerdo con esto, es obvio que la condición de Bragg (2.1-1) con n = 1, se
satisface mediante la función de onda electrónica en todos los puntos en esta parte
de la frontera. Del mismo modo, es fácil verificar que la condición de Bragg (relacionada ahora con un ángulo incidente que se indica como un conjunto equivalente de
planos paralelos al eje y), se satisface en todos los puntos del borde derecho (o
izquierdo) del cuadrado limit.mte. El electrón, considerado como una onda, se difracta internamente mediante la red, siempre que su vector de cantidad de movimiento
toque esta frontera cuadrada. Los puntos del espacio k que quedan más allá de los
límites de estas fronteras corresponden a los puntos que están fuera de la banda de
energía más baja, perteneciendo a otras bandas que se originan en estados atómicos
de energía más alta que el estado basal. Los límites de las regiones del espacio k
ocupadas por las bandas más altas, se determinan mediante la orientación de las
fronteras a lo largo de las cuales se pueden producir reflexiones de Bragg (n > 1) de
orden más alto. Siempre existe un vacío de energía entre las bandas, como se ilustra
en la figura 8.10; por ejemplo, siempre que se cruza el borde de la región cuadrada
encerrada por las líneas kx = ± rr/a, ky = ± rr/a, debe ocurrir una discontinuidad de
energía acompañada de una reflexión interna de Bragg. El interior de la región
contiene la totalidad de estados pertenecientes a la banda de energía más baja.
Se observará que el vector k tiene las mismas dimensiones que la red recíproca. En la sección 2.6 se demostró que la condición de reflexión de Bragg puede
escribirse como
(8.8-13)
en donde k es el vector de propagación y en donde G/2rr es un vector que va desde
el origen hasta cualquier punto de la red recíproca. Para una red cuadrada bidimensional de puntos cuyo espaciamiento reticular es a, la red recíproca es una red
cuadrada con un espaciamiento reticular 1/a. Si para mayor facilidad se considera
que el origen está en un punto de red, los vectores G tienen la forma
2n •
G,.. = -(¡,u"
+ viy. )
a
(8.8-14)
en donde ¡.¡. y v son enteros y en donde ix e iy son vectores unitarios en las
direcciones kx y k y, respectivamente. Si se usa esta forma para el vector G, (8.8-13)
se convierte en
1t
¡.¡.k" + vk, = -- (¡.¡.
a
2
+ v2 ).
(8.8-15)
Esta ecuación representa una familia de líneas rectas en el plano kxky. Sus
intersecciones kx y ky son
..
np.z+v2
k" mtcrseccwnes: - -- - - a
fJ.
(8.8-16)
ky intersecciones:
a
v
Diruímica del electrón, superficies de energía y zona de Brillouin
265
Cada una de estas líneas representa una frontera a lo largo de la cual se
produce una reflexión de Bragg y que puede formar la frontera entre estados pertenecientes a diferentes bandas de energía. Si se toma 11 = O, v = ± 1, y 11 = ± 1, v = O
en (8.8-15), se obtienen las cuatro líneas kx = ± rr/a y ky = ± rr/a que encierran la
región ilustrada en la figura 8.12, cuyo interior contiene todos los estados de la
Figura 8.12.
Contornos de energía constante dentro de la zona de Brillouin, para una red
cuadrada bidimensional, usando sólo funciones de onda esféricamente simétricas y
las interacciones del vecino más cercano. Se forma el mismo patrón mediante los
trazos de la superficies de Fermi de la figura 8.11 para la red tridimensional sobre
el plano kxky.
banda de energía más baja del cristal. Esta reg10n del espacio k se denomina la
primera zona de Brillouin (esta terminología ya se introdujo en relación con los
cálculos unidimensionales que se vieron en la sección 3.3). Si ahora se considera
J1 = ± 1, v = ± 1, se obtienen las cuatro líneas kx ±ky = 2rr/a y kx ± ky = - 2rrfa.
Estas cuatro líneas aparecen grafícadas en la figura 8.13(a). En estas fronteras, la
condición de Bragg (2.1-1) se satisface con el orden de reflexión n, que es igual a 2.
Esto se puede demostrar a través de los mismos métodos que se emplearon antes en
conexión con las fronteras de la primera zona de Brillouin. La región encerrada
entre la primera zona de Brillouin y estas cuatro líneas intersectoras contiene todos
los estados correspondientes a la segunda banda de energía (que se relacionaría con
el segundo nivel atómico de energía más baja si la aproximación del enlace firme
fuera válida). Esta se conoce como la segunda zona de Brillouin, que tiene la misma
área que la primera y, en efecto, las cuatro secciones independientes de esta zona se
pueden trasladar al interior de la primera moviendo las secciones paralelas a los ejes
en distancias que sean enteros múltiples de 2rr/a. Por tanto, las cuatro secciones
encajan como piezas de un rompecabezas para formar una región cuadrada que es
una réplica exacta de la primera zona, como lo ilustran las líneas punteadas de la
figura 8.13{a). La última representación de la segunda zona es, sencillamente, la
266
Teoria cuántica de los electrones en redes periódicas
Ir,
c:_--:_1 Pnmera zona
[~'
Segunda zona
r::-l Tercera zona
_j
~] Cuarta zona
Quinta zona
•
o
(e)
Figura 8.13.
Construcción de las zonas de Brillouin para una red cuadrada bidimensional (a)
Primera y segunda zona~, (b) construcción de la tercera zona, (e) las primeras
cinco zonas.
representación de zona reducida de la secc1on 8.5. La justificación de una transformación de este tipo con referencia al modelo de Kronig-Penney ya se vio en esa
misma sección.
Expresado con más precisión, si
(8.8-17)
es una función de onda del sistema que satisface las ecuaciones de Schrodinger y
todas las condiciones de frontera pertinentes, y si se define
. ('2n_,;rr)
k , -_k_ lx
- a
. (2nyn) - lz. (211zí'
C)
-- '
ly - -
a
a
(8.8-18)
Dinámica del electrón, superficies de energía y zona de Brillouin
267
en donde ix, iy e iz son vectores unitarios a lo largo de las direcciones kx, k y, kz y
en donde nx, ny, nz son enteros, la misma función de onda se puede expresar como
= eik' •v(r),
(8.8-19)
en donde v(r) es nuevamente una función periódica que tiene la periodicidad de la
red. De donde la función de onda se puede escribir en la forma de Bloch en
términos de k o el vector de onda transformado k'. Se debe observar que (8.8-18)
se puede escribir también como
k'= k- G
(8.8-20)
en donde G/2n es un vector que conecta dos puntos reticulares de la red recíproca.11 La transformación (8.8-18) o (8.8-20) puede usarse siempre para llegar a una
representación de zona reducida en la que la zona transformada ocupa la misma
región del espacio k que la primera zona. La situación es muy similar a la que se
encontró en la sección 3.3 en el caso de las vibraciones mecánicas de una cadena
lineal de masas discretas puntuales y que se vio en relación con la figura 3.8.
Las zonas más altas se pueden construir mediante una ampliación del procedimiento usado para llegar a la forma de la primera y segunda zonas. En (8.8-15), si
se toma 11 = O, v = ± 2 ó 11 = ± 2, v = O, se obtienen las cuatro líneas kx = ± 2n/a,
ky = ± 2n/a, como se indica en la figura 8.13(b). También en este caso es evidente
que la reflexión de Bragg se desarrolla a lo largo de estas líneas y la primera
reacción es asignar todos los espacios que quedan fuera de la segunda zona y dentro
del área encerrada por estas cuatro líneas, a la tercera zona de Brillouin. Sin embargo, esto no es correcto, ya que esta área es mucho mayor que la de la primera y
segunda zonas, y cada zona de Brillouin debe encerrar la misma superficie dentro del
espacio k. En realidad, existen líneas de reflexión adicionales de Bragg que pasan
por esta superficie y forman fronteras que dividen este espacio en las zonas tercera,
cuarta, quinta y sexta. El criterio que se sigue para saber de qué zona se trata es el
siguiente: al desplazarse a lo largo de una línea radial general que no atraviesa
ninguna intersección de las líneas de reflexión de Bragg, principiando desde el origen, se debe pasar por la primera, la segunda, la tercera, la cuarta, • • • etc., zonas
sucesivamente, y cada línea de reflexión de Bragg que se cruce forma la frontera a
lo largo de la trayectoria radial entre una zona y la siguiente zona vecina más alta.
En consecuencia, al seguir adelante desde el origen por la línea OA, se penetra en la
tercera zona en C y se sale de ella en D, con la siguiente línea de reflexión de
Bragg que intersecta a OA, más allá de D, se penetra en la cuarta zona. No obstante, si se desplaza a lo largo de la línea OB, se entra a la tercera zona en E y se
sale de ella en F, que se queda· sobre la línea kx = n/a que es ahora la tercera línea
de reflexión de Bragg desde el origen, a lo largo de la trayectoria OB. Más allá de
F, por la línea OB queda una parte de la cuarta zona. De donde, la tercera zona se
compone de los ocho triángulos que se ilustran en la figura 8.13(b). Nuevamente es
obvio que estos ocho triángulos se pueden ensamblar de tal modo que formen un
cuadrado dentro de la primera zona, si se someten a una traslación apropiada de
acuerdo con (8.8-18). Las fronteras de la cuarta zona se forman, en parte, por las
11 En efecto, la expresión (8.8-20) es en realidad la definición fundamental de esta transformación, mientras que (8.8-18) se refiere específicamente a una transformación de esta naturaleza en el caso particular de la red cúbica simple.
268
Teoría cuántica de los electrones en redes periódicas
líneas para las que J.1 = ± 1, v = ± 2, y J.1 = ± 2, v = ± 1 (en donde se toman todas las
permutaciones posibles de los signos más y menos). Se obtiene una familia de ocho
líneas (tales como kx ± 2kx =- Srr/a), que conduce a las fronteras de las zonas
cuarta y quinta, como se indica en la figura 8.13(c), por los procedimientos antes
descritos. Evidentemente, este método de cálculo se puede extender ad infinitum
para encontrar tantas zonas como se desee. Al construir las fronteras de las zonas de
Brillouin, de este modo, generalmente conviene principiar con vectores G cuyas
magnitudes (según se obtienen a partir de [8.8-14] o su equivalente en otra estructura cristalina) son tan pequeñas como sea posible, y luego procediendo al siguiente
(a)
(d)
(e)
Figura 8.14.
Configuración de la primera zona de Brillouin para (a) una red cúbica simple, (b)
una red cúbica centrada en el cuerpo, (e) una red cúbica centrada en la cara y
(d) una red hexagonal.
conjunto de vectores G más cortos, Juego a los siguientes más reducidos y así
sucesivamente. Puesto que la condición de reflexión de Bragg implica la formación
de ondas estacionarias a una incidencia normal, la velocidad de grupo y, por ende, el
gradiente de e normal a la frontera de cualquier zona de Brillouin, debe desaparecer,
es decir,
(-aro)
ak
1
= n · Vkw =- n · Vke =O
.l a la frontera
li
(8.8-21)
en la zona de frontera, si n es un vector unitario normal a la frontera. Se puede
verificar esta conclusión general a partir de los resultados del modelo de potencial de
Aisladores, semiconductores y metales
269
Kronig-Penney, la aproximación del electrón libre y la aproximación del enlace firme.
Estos detalles quedan como ejercicio para el lector.
La extensión de estos resultados para incluir redes tridimensionales es totalmente directa. Por supuesto, en este caso las zonas de Brillouin son regiones tridimensionales del espacio k encerradas por planos a lo largo de los cuales se satisface
la condición de Bragg. Las ecuaciones de estas fronteras de plano se obtienen de la
ecuación (8.8-13) al igual que sucedió en el caso bidimensional. Nuevamente cada
zona tiene un volumen equivalente y las partes separadas de las zonas más altas se
pueden juntar para formar una réplica de la primera zona, aplicando la transformación apropiada de (8.8-20). Es evidente que la primera zona de Brillouin para una
red cúbica simple es un cubo cuyo lado es 2Tr/a. La forma de la primera zona de
Brillouin para las redes cúbicas centrada en la cara y centrada en el cuerpo, así
como para la estructura hexagonal, se ilustran en la figura 8.14. La zona para la red
cúbica centrada en el cuerpo es un dodecaedro rómbico en el que todas las caras
son planos { 11 O} dentro del espacio k. La zona para la red cúbica centrada en la
cara es un tetradecaedro, un poliedro de 14 caras, que tienen una orientación {110}
y { 111}. La superficie de Fermi debe tener, en todos los casos, las propiedades de
simetría de la zona de Brillouin correspondiente que, a su vez, se relacionan con las
propiedades de simetría de la red cristalina.
8.9
AISLADORES, SEMICONDUCTORES Y METALES
En la seccwn 8.5 se demostró que no se puede obtener una corriente eléctrica
en bandas vacías o bandas totalmente llenas. Por tanto, cualquier conductividad
eléctrica que presente un cristal debido al movimiento de electrones libres, se debe
al movimiento de electrones dentro de las bandas de energía que están sólo parcialmente llenas. Esta observación constituye la base de la diferencia entre los aisladores,
los conductores metálicos y los semiconductores.
En un aislador, el número de electrones dentro del cristal es apenas el suficiente para llenar completamente cierto número de bandas de energía. Sobre estas
bandas de energía existe una serie de bandas totalmente llenas; pero entre las bandas
llenas y vacías se encuentra una región de energía prohibida tan ancha que es
prácticamente imposible, a temperaturas físicamente posibles, excitar térmicamente
un número importante de electrones para que atraviesen esta región desde la parte
superior de la banda llena más alta a la base de la banda vacía más baja. Entonces,
todas las bandas están ya sea llenas o vacías y no puede fluir una corriente de
electrones libres. Esta situación se ilustra en la figura 8.15(a).
Si es muy pequeño el vacío de energía .1€ entre las bandas llenas y vacías en este
tipo de cristal, y, por tanto, se tiene una probabilidad estadística apreciable de que
los electrones puedan excitarse térmicamente de estados cercanos a la parte superior
de la banda llena, para atravesar el vacío, hasta los estados cercanos a la base de la
banda vacía. Se dispondrá de un número limitado de electrones libres para conducción de corrientes eléctricas en la banda superior casi vacía y, además, los estados
electrónicos vacíos que quedan cerca de la parte superior de la banda más baja
permiten que esta banda contribuya al flujo de corriente eléctrica a través del mecanismo de conducción por huecos. Un material de esta naturaleza se conoce como
semiconductor; su conductividad eléctrica es casi siempre mucho menor que la de un
metal debido a la concentración limitada de electrones libres y huecos y, además,
depende enormemente de la temperatura, que aumenta con gran rapidez al incrementarse ésta, ya que la probabilidad de la excitación térmica se incrementa con la
270
Teoría cuántica de los electrones en redes periódicas
temperatura. Por supuesto, la conductividad eléctrica de un semiconductor es también una función del vacío de energía ..::le- La diferencia entre los aisladores y los
semiconductores es sólo de grado; todos los semiconductores pueden hacerse aisladores ideales conforme la temperatura se acerca al cero absoluto, debido a que
entonces la probabilidad asociada con la excitación térmica se hace tan pequeña que
tiende a desaparecer. Del mismo modo, a temperaturas lo suficientemente elevadas
(que con frecuencia son imposibles de alcanzar en la práctica debido a que el cristal
se funde o se evapora), todos los aisladores presentan propiedades semiconductoras.
La estructura de las bandas de un semiconductor aparece ilustrada en la figura 8.15(b).
Si el número de electrones de un cristal no base.! para llenar por completo la
banda de energía más elevada, sino que la deja sólo llena en parte, muchos de ellos
pueden comportarse como electrones libres y servir como carga o portadores de
carga. En la figura 8.15(e) se ilustra esta situación. Un cristal de esta índole presentará todas las propiedades características de un conductor metálico, por ejemplo,
alta conductividad eléctrica y térmica y una gran reflectividad óptica.
Distribución
de Fermi-Dirac
Banda "vacía"
6•
Banda "casi vacía"
---~-Banda superior
superpuesta
Electrones térmicamente
excitados
l-
\-~------ ;_;= l Ban:~;~ ~:~~~:l=:_:nte llena
~~T ~~ ~j~&~~~
E d 1 •
~~ :wd~sta os e ectronico~
vacíos ~~y~~9~L );;:;:
Banda inferior;;
casi llena
/;
W(///~%
W'ff~
w~lena/;/~
2LL/.'///h
?/íllenaW
0gUenaW
o
(o) Aislador
Figura 8.15.
(bl Semiconductor
(el Metal
(Banda parcialmente llena)
(d) Metal
(Banda
superpuesta)
Diagrama de las bandas de energía de (a) un aislador, (b) un semiconductor, (e)
un conductor metálico (banda parcialmente llena) y (d) un conductor metálico
(bandas superpuestas).
La determinación del número de estados electrónicos disponibles en una banda
de energía dada de una substancia particular, no es un procedimiento del todo
directo y, en general, implica el uso de técnicas de cálculo de la mecánica cuán tic a
que están fuera del alcance de esta obra. Si se supusiera que siempre es válida la
aproximación del enlace firme, las bandas de energía siempre se originarían de los
niveles de energía de los átomos aislados, las funciones de onda de una banda dada
se compondrían siempre de una combinación lineal de las funciones de onda del
estado electrónico de energía correspondiente de los átomos aislados y el factor de
degeneración, asociado con un nivel de energía dado en la banda de energía, sería el
mismo que el del nivel correspondiente del átomo libre. De acuerdo con esto, se
Aisladores, semiconductores y metales
271
tendría una banda ls ccrrespondiente al nivel ls, una banda 2s, una banda 2p, una
banda 3s, una banda 3p, una banda 3d y así sucesivamente. De acuerdo con la
ecuación (8.2-20), el número de niveles de cada banda sería N y, puesto que la
degeneración de cada nivel es el mismo que el del nivel atómico correspondiente, el
aúmero de estados cuánticos electrónicos (incluyendo la degeneración de espín) de
cada banda sería el que se indica en la tabla 8.1.
TABLA 8.1.
Banda
No. de estados
Is
3p
2N
2N
6N
2N
6N
3d
ION
2s
2p
3s
Por ejemplo, ahora se verá un metal alcalino como el sodio. El sodio tiene dos
electrones Is, dos electrones 2s, seis electrones 2p y un solo electrón 3s. En un
cristal de N átomos se tienen, entonces, 2N electrones ls, 2N electrones 2s, 6N
electrones 2p y N electrones 3s. Si se comparan estas cifras con las que se dan en la
tabla 8.1, se llega a la conclusión de que las bandas ls, 2s y 2p, están totalmente
llenas; pero que la banda 3s, que contiene 2N estados, sólo está llena a la mitad.
Por tanto, se puede esperar que el sodio -junto con todos los demás metales alcalinos- sea un conductor metálico, como en efecto lo es. Por otro lado, si se
acepta estríctamente este método, debe esperarse que el magnesio, cuya estructura
atómica es Is 2 )2s 2 2p 6 )3s 2 , sea un aislador o semiconductor, ya que ahora la banda
3s está llena. El hecho de que el magnesio (y otros elementos alcalinotérreos)
sean metales, se debe al hecho de que la energía de las bandas 3s y 3p se superpone y algunos de los electrones "se derraman" de la banda 3s a la 3p, dejando
a la primera no del todo llena y haciendo que está última esté parcialmente ocupada, como se ilustra en la figura 8 lS(d). En realidad, las funciones de onda 3s
y 3p de estas bandas se entremezclan intensamente, de modo que ni siquiera es del
todo correcto referirse a las bandas en esta forma. A decir verdad, el método
sencillo del enlace firme ya no es una buena aproximación que permita describir el
comportamiento de los electrones s y p en la capa exterior de valencia de la
mayoría de las substancias metálicas; esta mezcla de las bandas s y p para los
electrones de valencia es más bien la regla que la excepción. Por ejemplo, en el caso
del silicio, los estados 3s y 3p se combinan en dos bandas que no se superponen, en
donde cada una de ellas contiene 4N estados, de tal manera que los electrones de
valencia 4N ocupan por completo la banda inferior para fonnar la configuración de
banda de un semiconductor como la de la figura 8.15(b).
La superposición de bandas se produce a pesar de que existe un vacío de
energía en todos los puntos en la frontera de la zona de Brillouin que separa las dos
bandas. Usando la zona cuadrada de la figura 8.12 como ejemplo, se puede ver
claramente cómo se presenta esta situación. La superficie de Fermi en esta figura
toca primero la frontera de zona a lo largo de los ejes kx y ky a una energía
E= e 1 + 4(3; pero la zona de Brillouin y la banda de energía correspondiente no
~stán completamente llenas hasta que e -- <: 1 + 8(3. Puede suceder que el vacío de
energía entre esta banda y la siguiente, en la dirección de los ejes kx y k y, sea
272
Teoría cuántica de los electrones en redes periódicas
menor que 4(3, que es la energía adicional requerida para llenar por completo la
banda inferior. Si esto sucede, los electrones se derramarán hacia la banda superior
en las direcciones kx y ky antes de que se llenen por completo los vértices de la
zona original, dando como resultado la situación de superposición de bandas que se
mencionó anteriormente. Esta situación se ilustra en la figura 8.16. Debe recalcarse
~(k)
Esquinas no llenas
Electrones que
de la banda inferior
llenan parcialmente (conducción por huecos)
la sigUI en te
zona superior
Los electrones
"se derraman"
sobre la
siguiente banda
(conducción
por electrones)
Esquinas de la
zona no llena
(a)
.,.
a
- - ~(k) Relación a lo largo de la trayectoria OA
- - - <(k) Relación a lo largo de la trayectoria OB
(b)
Figura 8.16.
(a) Un caso en el que los estados de energía más bajos dentro de la banda más
alta (en los centros de los lados de la zona cuadrada, sobre los ejes kx y kY.)
tienen una energía más baja que los estados de energía más alta de la banda más
baja (en las esquinas de la zona). En estas circunstancias, los electrones comienzan
a ocupar la banda más alta antes que la más baja esté completamente llena. (b)
Representación esquemática de la relación de f en función de k en la dirección
OA (las curvas continuas) y OB (curvas punteadas) que ilu~tra de un modo ligera·
mente distinto la situación descrita en (a)
que cuando se presenta esta circunstancia, la supostcton simple del enlace firme de
las funciones atómicas de onda asociadas con un solo nivel ya no es válida y que las
bandas de energía se deben volver a calcular, suponiendo una mezcla de funciones
de onda relacionadas con ambas bandas. También debe hacerse notar que en esta
situación, tanto la conducción electrónica efectuada por los electrones que se derraman hacia la banda superior, como la conducción de huecos realizada por los estados vacíos en la parte superior de la banda más baja, se producen de un modo
simultáneo. La superficie de Fermi entonces tiene dos ramas separadas, una para
electrones en la zona externa y otra para huecos en la zona original. Si la masa
efectiva del hueco es menor que la del electrón, esta situación conduce a un coeficiente positivo de Hali.l 2 Así se puede comprender una de las discrepancias más
inquietantes de la teoría original del electrón libre de los metales.
12 En un capítulo posterior se verá la forma en que esto sucede.
Densidad de la función de estados y Cllmbios de fase
273
Se observa que la teoría cuántica permite entender en términos generales, por
qué las propiedades eléctricas de los conductores metálicos y los aisladores son tan
marcadamente distintos, aun a pesar de que con frecuencia se requiere un cálculo de
mecánica ondulatoria muy elaborado para establecer con exactitud las superficies de
énergía y las funciones de onda relacionadas con las bandas electrónicas de valencia
en una substancia en particular.
8.10
DENSIDAD DE LA FUNCION DE ESTADOS
Y CAMBIOS DE FASE EN ALEACIONES BINARIAS
En el capítulo 5 se derivó la función de densidad de estados para partículas
libres en la forma de la ecuación (5.2-22). Intuitivamente, parece obvio que la función de densidad de estados para los electrones dentro de los cristales debe ser la
misma que la que se obtuvo antes, excepto quizá que se debe incluir la masa
efectiva en lugar de la masa inercial. En breve se verá que esto es cierto, a condición de que las superficies de energía constante sean esféricas. Sin embargo, si las
superficies de energía constante se desvían de la forma esférica, la función de densidad de estados se hace mucho más compleja.
Para principiar, es importante indicar que los valores permisibles para la cantidad de movimiento del cristal hk, cuando se imponen condiciones periódicas de
frontera, de acuerdo con (8.2-20), son los mismos que los valores permisibles de la
cantidad de movimiento inercial de una partícula libre, como lo establece (5.2-15).
El volumen de espacio de la cantidad de movimiento por estado cuántico, entonces
es el mismo que antes y la tarea de determinar la densidad de estados puede
lograrse, como antes, encontrando el número de estados cuánticos dv entre las superficies de energía constante correspondientes a las energías e y e +de, calculando el
volumen del espacio de la cantidad de movimiento entre las dos superficies y dividiendo entre t/h 3 , el volumen por estado cuántico. El elemento de volumen del
espacio de cantidad de movimiento se puede escribir como sigue
h3
dvP = p 2 sen(} dp d(} d</J = 8n: 3 k 2 sen 8 dk d(} d</J,
(8.10-1)
por lo cual, el número de estados dentro del volumen es
dvP
1
1 dk
lh 3 = -4 3 k 2 sen(} dk d(} d</J = - 3 - • k 2 sen(} de d(} d<jJ.
z
n:
4n: de
(8.10-2)
El número de estados dv = g( e) de en el rango dt: energía de alrededor de e se
obtiene integrando sobre los ángulos polares O y cf> en el espacio k. De donde,
f
1 ffk 2 sen(} d8 dcp
1
dSk
g(e) = 4n: 3
(defdk)
= 4n: 3 Js (defdk)'
(8.10-3)
en donde dSk representa el elemento de superficie de área k 2 sen OdO dcf> sobre la
superficie de energía constante dentro de la zona de Brillouin. Es evidente que si se
conoce la función e(k), la densidad de estados se puede calcular, en principio, a
partir de (8.10-3). Sin embargo, desafortunadamente la forma matemática de e(k) es
274
Teoría cuántica de los electrones en redes periódicas
tan compleja en casi todos los casos de interés práctico, que la integración se puede
efectuar sólo por métodos númericos. Para la red cúbica simple en la aproximación
del enlace firme, la función e(k) para una banda s está dada por (8.7-16) y la
densidad correspondiente de la función de estados, según lo establece (8.10-3), es
como se ilustra en la figura 8.1 7.
Figura 8.17.
Curva de densidad de estados para una red cúbica simple de acuerdo con la
aproximación del enlace firme, como se calculó a partir de (8.10-3) y (8.7-16).
Cerca de la base de la banda de energía de este ejemplo en particular, la
forma de e(k) está rlada por (8.8-9); entonces, se tiene, para esta región.
de
y
2
dk = 2{Ja k.
(8.10-4)
Puesto que e es independiente de 8 y cp en estas circunstancias, (8.10-3) se
puede integrar sobre estos ángulos para que dé
i i" e
2
dk "
g(e) = -4 13 k 2 -d
sen
n
eoo
2
dk ,
dO de/> = k2 -d
ne
(8.10-5)
o bien, usando (8.10-4),
(8.10-6)
Si se usa (8.7-18) para expresar {Xl 2 en términos de la masa efectiva, esto se
puede escribir como
8~
g(e) = _v_
"'-~' m*312
h3
Je--e
1
(e - e1 ~ 12{1),
(8.10-7)
que, a condición de que el origen de la energía se tome en la base de la banda, es
la expresión parabólica acostumbrada de la densidad de estados de' electrón libre, en
donde la masa inercial se ha substituido por la masa efectiva m*. De un modo algo
similar, se puede demostrar que para energías cercanas a la parte superior de la
Densidad de la función de estados y cambios de fase
275
banda, en donde las superficies de energía constante vuelven a tener una forma
esférica, se puede escribir
sJ2n
g(e) = -¡:;r m* 312
J---c-·
+ 12/3 &1
&
(e1 + 12p - e ~ 12/3).
(8.10-8)
Esta función de densidad de estados se desvanece en la parte superior de la
banda, en donde e= e 1 + 12{3, y aumenta parabólicamente para energías decrecientes. En consecuencia, se puede considerar como una función de densidad de
estados de partículas libres para conducción por huecos en una banda casi llena. Las
funciones de densidad de estados de electrón libre (8.1 0- 7) y (8.1 0-8), se obtuvieron
en relación a un ejemplo específico; pero se puede demostrar que se obtienen las
mismas expresiones para cualquier estructura cúbica, ya sea que la aproximación de
enlace firme se aplique o no. En los metales del grupo de transición, una banda más
bien angosta que se origina en los estados atómicos 3d, que alojan a 1ON electrones,
se superpone a la banda electrónica de valencia 4s, dando origen a una curva de
densidad de estados para los electrones de valencia como la que se ilustra esquemáticamente en la figura 8.18. A esta curva peculiar de densidad de estados se deben
muchas de las propiedades características de estos metales.
g(•)
d-Banda
Figura 8.18.
Característica de superposición de las bandas s- y d- de los metales de transición.
La forma de la curva de densidad de estados y el concepto de la superficie de
Fermi para los electrones de valencia dentro de la zona de Brillouin, se ha utilizado
para explicar ciertos cambios de fase que se relacionan con las aleaciones binarias de
cobre, plata y oro con metales divalentes y trivalentes. El cobre, la plata y el oro
puros son todos elementos nomovalentes que tienen una estructura cúbica centrada en la cara. Por ejemplo, si se principia con plata pura y se agregan cantidades
crecientes de cadmio, la estructura cúbica centrada en la cara que se denomina de
fase a se conserva hasta una concentración determinada de cadmio (llamada límite
a), que es un punto en el que se produce un cambio de fase y la estructura del
cristal cambia de cúbica centrada en la cara a cúbica centrada en el cuerpo, siendo
esta última denominada fase (3. Si la concentración de cadmio se incrementa más
todavía, la estructura cúbica centrada en el cuerpo de fase (j es estable sobre cierto
rango de concentración después del cual se llega a otro punto de transición (denominado límite (j) y la fase (j se transforma en una fase 'Y cuya estructura es un
arreglo cúbico muy complejo en el que se tienen aproximadamente 52 átomos por
célula unitaria. A concentraciones de cadmio todavía mayores, se llega al límite 'Y y
27 6
Teoría cuántica de los electrones en redes periódicas
se forma una fase hexa~onal 'TI de empaquetamiento compacto. Las aleaciones de
otros metales nobles y las que se logran con otros aditivos multivalentes, siguen el
mismo patrón general de cambios de fase aunque los límites a:-, {j- y r- son diferentes en cada sistema individual.
Hume-Rothery 13 sefialó que los límites a:-, {j- y r- de estos sistemas de aleaciones se producen siempre en ciertas razones bien definidas de electrones de valencia
por átomo. En consecuencia, parece ser que el límite {j se alcanza siempre en el
punto en el que se tiene justamente alrededor de 3/2 de electrones de valencia por
cada átomo del cristal, y el límite 'Y se obtiene a una relación de electrón de
valencia por átomo de 21/13. Jones 14 explicó estas observaciones empíricas de
acuerdo con las bases fundamentales. En primer lugar, se debe observar que para el
metal puro monovalente cúbico centrado en la cara que está en la fase a:, la zona de
Brillouin (reducida) para los electrones de valencia es como se indica en la figura 8.14(e). Puesto que los electrone~ de valencia de los metales nobles son de tipo s,
se puede esperar que esta zona de Brillouin contenga 2N estados electrónicos. En el
caso del metal puro, la zona está llena sólo a la mitad debido a que el número total
de electrones de valencia es N, en este caso. Para mayor facilidad se supondrá, como
lo supuso Jones, que la superficie de Fermi dentro de la zona es esférica en todo
momento. 15 Basándose en esta simple suposición, se puede calcular la curva de
densidad de estados para la zona de Brillouin de un modo muy sencillo; el resultado
aparece ilustrado de una manera esquemática en la figura 8.19. La función de densidad de estados es, sencillamente, una parábola del electrón libre hasta que la esfera
de Fermi toca la frontera de la zona. Sin embargo, a partir de este punto, las
fronteras de la zona cortan partes de la esfera de Fermi y un incremento dado del
radio (correspondiente a un incremento específico de energía) abarca sólo un número relativamente pequefio de estados en las esquinas de la zona de Brillouin. La
curva de densidad de estados decrece con gran rapidez, acercándose a cero cuando el
radio de la esfera de Ferrni es igual al radio de la esfera circunscrita. Se puede
La esfera de Fermi
¡-toca la zona de la frontera
Figura 8.19.
Representación de la curva de densidad de estados de la red cúbica simple basada
en la idea de la superficie esférica de Fermi que se expande dentro de la zona de
Brillouin, tal y como la empleó Jones.
13 W. Hume-Rothery, The Metallic State, Clarendon Press, Oxford (1931), página 328.
14 H. Jones, Proc. Roy. Soc. 144, 225 (1934); 147, 396 (1934). Véase también N. Mott y
H. Jones, op. cit. página 170.
15 Esta suposición es más apropiada en este caso que en el del cubo simple, cuyas superficies de Fermi se ilustran en la figura 8.11, debido a que la zona de Brillouin circundante tiene
una forma más esférica. En cualquier caso, la forma exacta de la superficie de Fermi no es
particularmente importante para energías TTIIlyores que la que se requiere para que la superficie
de Fermi roce apenas la frontera de la zona.
Densidad de lo función de estados y cambios de fose
277
observar la misma conducta general en la curva de densidad de estados de la figura 8.17, que se relaciona con una red cúbica simple.
Cuando los átomos de un metal multivalente forman una aleación con la fase
a: monovalente, aumenta el número de electrones libres por átomo, se eleva el nivel
de Fermi y también aumenta el radio de la esfera de Fermi dentro de la zona de
Brillouin asociada con los electrones de valencia. Más allá del punto en el que la
esfera de Fermi toca la frontera de zona, se produce un gran incremento de energía
electrónica con cada pequeño incremento de concentración de electrones libres y,
por tanto, con cada pequeño aumento en la concentración del aditivo multivalente.
En este punto, se obtendrá una energía electrónica total más baja si el cristal sufre
un cambio de fase a una red cuya zona de Brillouin dé acomodo a una esfera
inscrita de mayor tamaño y, en efecto, esto es lo que sucede. La fase a: cúbica
centrada en la cara cambia a una fase (j cúbica centrada en el cuerpo, cuya zona de
Brillouin [figura 8.14(b)] tiene, en efecto, una esfera inscrita de mayor tamaño,
aunque se trate del mismo volumen. Si se hace una adición posterior del elemento
multivalente de la aleación, el radio de la esfera de Fermi aumenta más todavía y
por último toca la superficie de la zona de Brillouin de fase (j. Nuevamente se
produce un cambio de fase, la zona de Brillouin de la fase 'Y resultante viene a ser
un poliedro complejo de 36 caras que tiene una forma más bien esférica 16 que el
dodecaedro rómbico asociado con la fase (j y cuya esfera inscrita es, por ende,
mayor todavía.
De acuerdo con estos argumentos, se pueden hacer cálculos cuantitativos de los
límites a:-, (j- y -y-. En la fase a:, la esfera de Fermi llega primero a la frontera de
zona en las direcciones {lll} dentro del espacio k. El plano (111) que forma parte
del poliedro de la zona de Brillouin tiene [de acuerdo con (8.8-13)], la ecuación
kx +k,+ k,.= 3nfa.
(8.10-9)
En el punto de contacto, en el centro de la cara (111), kx = ky = kz = rra, por
lo cual, el radio de la esfera de Fermi es el punto de contacto, kc, debe ·estar dado
por
(8.10-10)
En estas condiciones, el volumen de la esfera de Fermi es 4rrkU3, ó
4 ./frr(rr/a )3, en tanto que se puede demostrar fácilmente que el volumen total de la
zona es la mitad del volumen de un cubo de lado 4rrfa, ó 32(rr/a) 3 . La razón del
volumen de la esfera inscrita a la zona es, por tanto, la relación de estos dos
números, o sea, rr y3/8. El número promedio de electrones de valencia por átomo es
el número por átomo cuando la zona está llena (es decir, 2) por la fracción del
número de estados dentro de la zona que están ocupados. El número de electrones
de valencia por átomo para el límite a: es, entonces, rr y3/4 ó 1.362. Los valores de
los límites (j- y -y- se pueden obtener usando los mismos procedimientos generales.
En la tabla 8.2 se ilustran los valores obtenidos en comparación con los valores
derivados empíricamente por Humes-Rothery.
Naturalmente, puesto que las superficies de Fermi no pueden ser perfectamente
esféricas, las estimaciones de Jones deben considerarse sólo aproximaciones; sin embargo, se ha encontrado que concuerdan muy bien con los límites de fase determinados de un modo experimental. Los diagramas de fase de sistemas de aleaciones
más complejos se entienden a menudo de acuerdo con las superficies de energía
16 Véase F. Seitz, Modern Theory o[ Solids, McGraw-Hill Book Company, Inc., Nueva
York (1940), figura 13, página 433.
278
Teoría cuántica de los electrones en redes periódictJS
TABLA 8.2.
Relación electrón-átomo
Límite de fase
Hume-Rothery·
Jones
1.5
1.615
1.362
1.480
1.538
a
p
y
electrónica y la función de densidad de estados dentro de la zona de Brillouin; pero
los detalles de los cálculos y las respuestas resultantes son muy complejas.
EJERCICIOS
l. Demuestre que si en el modelo del potencial de la figura 8.2, usado en relación con el
cálculo de Kronig-Penney, se permite que V0 se haga infinitamente grande y b tienda a cero en
tal forma que el producto P =- {j2ab/2 se mantenga fijo, entonces la ecuación (8.3-12) se
convierte en
sen aa
P - - + cos aa =cuska.
aa
Si se hace una gráfica de la función del lado izquierdo, se observará que se comporta de un
modo similar a (8.3-15) y (8.3-16) como se ilustra en la figura 8.3. La cantidad P se puede
considerar como la "potencia de dispersión de un solo pico de potencial".
2. Demuestre que en el caso que se vio en el ejercico 1 anterior, la cantidad de/dk
desaparece en los bordes de la banda (k = nTr/a ).
3. Demuestre que para la- aproximación unidimensional del electrón libre que se vio en la
sección 8.6, de/dk desaparece en los bordes de la banda.
4. Demuestre que para la aproximación de enlace firme en la red cúbica simple que se vio
en la sección 8. 7, n • V.e desaparece en todos los puntos sobre las fronteras cúbicas de la
primera zona de Brillouin.
5. Demuestre explícitamente que los poliedros que aparecen en la figura 8.14(b) y (e) son
las formas correctas correspondientes a la primera zona de Brillouin para las redes cúbica centrada en el cuerpo y cúbica centrada en la cara, respectivamente.
6. Encuentre la relación e(k) para una banda s (funciones de onda esféricamente simétricas) en la aproximación de enlace firme para un cristal cúbico centrado en el cuerpo. Tom,!l·ep
cuenta sólo las integrares de superposición del vecino más cercano. Grafique las formas de las
superficies de energía constante para varias energías dentro de la zona. Demuestre que estas
superficies son esféricas, como sucede en el caso de los electrones libres, para energías cercanas a
la base de la banda. Demuestre también que n • v'.e se desaparece;: en las fronteras de la zona.
7. Obtenga todos los resultados que se requieren en el eJercicio 6 anterior, para una banda
s en un cristal cúbico centrado en la cara de acuerdo con la aproximación del enlace firme,
teniendo .m cuenta sólo la superposición de las funciones de onda del vecino más cercano.
8. Haga un diagrama rsimilar al de la figura 8.13(c)] dentro del plano k, de las primeras
cinco zonas de Brillouin de una red bidimensional definida por los vectores de base a aix, b =
3aiy Nota: no se pueden usar las fórmulas (2.5-5) para definrr una red recíproca bidimensional,
debido a que el producto transversal no se puede definir en un espacio bidimensional. Proceda a
partir de las defmiciones fundamentales (2.5-1) y (2.5-2).
9. Demuestre explícitamente, a partir de los resultados de la sección 8.7, que la densidad
de estados cerca de la parte superior de la banda de energía, para el cristal cúbico simple, que
se vio en detalle en esa sección, está dada por la ecuación (8.10-8).
LO. Demuestre que la relación limitante de electrón de valencia por átomo para la tase (3
(cúbica centrada en el cuerpo) de una aleación binaria del tipo que se vio en la sección 8.10, es
1.489. Puede tomar en cuenta la suposición del cálculo de Iones.
11. Demuestre que la función de onda (8.7-3) que se usó en el cálculo de la aproximación
de enlace firme, se puede expresar como una función de Bloch de la forma (8.2-14).
=
Lecturas recomendadas
279
LECTURAS RECOMENDADAS
W. Hume-Rothery, The Metallic State, Clarendon Press, Oxford (1931).
H. Jones, The Theory of Brillouin Zones and Electronic States in Crystals, North Holland Publishing Co., Amsterdarn (1960).
N. F. Mott y H. Jones, Theory of Metals and Alloys, Dover Publications, Inc., Nueva York
(1958).
S. Raimes, The Wave Mechanics of Electrons in Metals, Interscience Publishers, Nueva York
(1961).
F. Seitz, Modern Theory of Solids, McGraw-Hill Book Co., lnc., Nueva York (1940).
R. A. Smith, Wave Mechanics of Crystalline Solids, John Wiley & Sons, Inc., Nueva York (1961).
E. Spenke, Electronic Semiconductors, McGraw-Hill Book Co., Inc., Nueva York (1958).
A. H. Wilson, Theory of Metals, 2.a Edición, Cambridge University Press, Nueva York (1953).
CAPITULO
9
Semieonductores electrónicos
unifortnes en equilibrio
9 .l
SEMICONDUCTORES
En los capítulos anteriores la preocupacwn principal consistía en entender las
propiedades eléctricas y térmicas de los conductores y los aisladores metálicos, así
.:omo comprender por qué unas substancias son muy buenos conductores eléctricos y
otras, muy deficientes. Estos objetivos se han logrado en general y, a partir de ahora
la atención se centrará en un análisis detallado de las propiedades de los semiconductores. Hay tres razones por las que esto es algo muy conveniente. En primer lugar
casi siempre se puede usar la estadística de Maxwell-Boltzmann para estudiar la
mecánica estadística de los portadores de carga en semiconductores. Esto significa
que se pueden obtener soluciones analíticas exactas para muchos problemas de semi.:onductores que se pueden resolver sólo mediante métodos numéricos o aproximados
en el caso de los metales, en donde se debe utilizar la estadística de Fermi-Dirac.
Comprender los efectos de esta índole en los semiconductores puede proporcionar
.:onocimientos físicos valiosos respecto a sus equivalentes en substancias metálicas.
En resumen, los procesos electrónicos se pueden comprender con mayor facilidad y
profundidad en los semiconductores que en otras clases de cristales. En segundo
lugar, la tecnología del crecimiento de cristales ha hecho posible producir cristales de
ciertas substancias semiconductoras (principalmente germanio y silicio) de una pureza
y perfección cristalina fantásticas, en un grado mucho mayor de lo que se puede
vbtener en la actualidad con metales y aisladores. La existencia de estos cristales casi
perfectos permite al experimentador observar las propiedades de transporte electrónico, los efectos termoeléctricos y galvanométricos con facilidad y precisión, teniendo
la certeza de que lo que está tratando de observar no lo oscurecerán los efectos
provocados por impurezas o imperfecciones estructurales en la red cristalina. Por
tanto en los semiconductores se pueden observar e interpretar con facilidad los
fenómenos que, en las substancias metálicas, serían difícil o imposible medir con
precisión o explicar de un modo cuantitativo. Por último, los semiconductores han
adquirido una enorme importancia tecnológica durante las dos últimas décadas. Se
han llegado a utilizar para fabricar todo tipo de dispositivos electrónicos incluyendo
rectificadores, transistores, fotoceldas, reguladores de voltaje, amplificadores paramétricos y dispositivos de conmutación. La apreciación de las propiedades fundamentales del transporte electrónico en estas substancias tiene una aplicación directa
en la comprensión y el análisis del funcionamiento de todas las estructuras de dispositivos que actualmente tienen importancia técnica.
281
282
Semiconductores electrónicos uniformes en equilibrio
El semiconductor es una substancia cristalina que tiene una estructura de bandas de energía en la que una banda de estados electrónicos, completamente llena a
la temperatura cero, se separa de otra que está totalmente vacía al cero absoluto.
por medio de una región angosta de energías prohibidas. Esta estructura de banda se
ilustra esquemáticamente en la figura 9.l(a). En el cero absoluto, el semiconductor
es un aislador perfecto, ya que no cuenta con bandas parcialmente llenas. Sin embargo, a temperaturas más altas, algunos electrones de la banda de valencia pueden
adquirir la suficiente energía térmica aleatoria para excitarse a través de la banda
prohibida con el fin de convertirse en electrones de conducción en la banda de
conducción que hasta entonces estaba vacía. Los estados vacíos que quedan en la
banda inferior o de valencia pueden contribuir también a la conductividad comportándose como huecos positivamente cargados. Fs evidente que el número de electro-
Electrones de conducción
/ _ térmicamente excitados
Banda "de conducción"
vacía
-
~e~~~-----------
Región prohibida
t:u (Banda de energía prohibida)
(o) 0°K
Figura 9.1.
Estados vacíos de la banda
de valencia (huecos)
( b) Temperatura ambiente (300° K)
Bandas de conducción y valencia de un semiconductor (a) al cero absoluto, (b) a la
temperatura ambiente, mostrando electrones y huecos térmicamente excitados.
nes de conducción y el número de huecos debe elevarse al incrementarse la temperatura y, por tanto, la conductividad eléctrica también aumenta al subir la temperatura.
El mecanismo físico de la conducción por electrones y huecos en semiconductores covalentes, tales como el carbono (diamante), germanio y silicio, que forman
cristales con la estructura del diamante de la figura 1.9, se puede entender con
mayor claridad en la figura 9.2. En esta figura se muestra la estructura calculada de
bandas de energía del diamante graficada en función del espaciamiento interatómico,
como se hizo en la figura 8.1 O. Los diagramas correspondientes al silicio y al germanio son muy similares. Cuando N átomos aislados se combinan en un cristal, los
niveles atómicos 2s y 2p se amplían a bandas de energía; conforme el espaciamiento
interatómico disminuye, estas bandas se hacen cada vez más anchas y terminan por
superponerse. Cuando la distancia interatómica se hace más pequeña todavía, el
continuo de lo que originalmente eran los estados 2s y 2p se divide una vez más en
dos bandas, cada una de las cuales cuenta ahora precisamente con 4 N estados. A la
distancia interatómica de equilibrio a, estas bandas están separadas por un "vacío de
energía" o región prohibida cuya anchura es ll.e. Puesto que la estructura electrónica del carbono es ls 2 )2s 2 2p 2 , se tienen 4 N electrones de valencia disponibl.- que
bastan exactamente para llenar la más baja de las dos bandas y formar la banda de
valencia del cristal. La banda superior se convierte en la de conducción. La región
de energía prohibida en condiciones normales tiene una anchura aproximada de 7 e V
en el diamante, 1.2 eV en el silicio y 0.7 eV en el germanio. Debido a la expansión
Semiconductores
283
tu=7eV (Diamante)
1
z'ev '(Silicio!
(Germanio)
~~~--~6~N~es~t-ad~o-s-+ 2 P
>Niveles átómicos
ffiin:s:o-2~N~e-,st-ad-¡-o-s---¡. 2 •
\~nD~=-------------~2~N~e~s~ta~d~o~s---t'•
-----+--:---::-:----:---::-::-:---------;;;;t- _
a(= Valor de equilibrio
del diamante)
Figura 9.2.
00
Espaciamiento
interatómico
Las bandas que se originan de los estados atómicos ls, 2s y 2p del carbono
(diamante) como función de la distancia interatómica. [De acuerdo con W. Shockley, Electrons and Holes in Semiconductors, D. van Nostrand Co., lnc., Nueva York
(1950).]
ténnica de la red, este "vacío de energía" tiene una dependencia débil en función
de la temperatura; de acuerdo con la figura 9.2, es evidente que el vacío en la
energía disminuye confonne se expande el cristal. También es obvio, de acuerdo con
este diagrama, que A. e. será una función de la presión, haciéndose mayor confonne
se reduce el espaciamiento interató!llico mediante la aplicación Je presión por medios hidrostáticos o de otra naturaleza. Más a la izquierda del punto A de la
figura 8.10, en donde se superponen las bandas ls y 2s, se pierde el carácter s y p
de los estados electrónicos; por tanto, en la banda de valencia del semiconductor, las
funciones de onda del electrón son una mezcla de funciones de onda atómicas s y p.
Los electrones de la banda de valencia son los que fonnan los enlaces covalentes de parejas de electrones tetraédricamente dispuestos entre los átomos, en la
figura 1.9. La excitación ténnica de un electrón de la banda de valencia a la de
conducción corresponde físicamente a la supresión de un electrón de la pareja del
enlace covalente por medio de la agitación ténnica de la red. Por tanto, el electrón
se convierte en un electrón libre fuera del enlace covalente de la red y queda
disponible para funcionar como portador de carga a fin de conducir una corriente a
través del cristal. Este proceso se describe esquemáticamente en la figura 9.3(a),
aunque se debe recordar que el patrón de enlaces usado es una versión bidimensional
de lo que en realidad es una red tridimensional de enlaces tetraédricos. la excitación
de un electrón deja un defecto localizado en la estructura del enlace covalente del
cristal, que se puede identificar como un estado de banda de valencia que podría ser
ocupado por un electrón; pero que en realidad está vacío. Este defecto constituye el
"hueco" de la sección 8.5. Tanto el electrón libre como el hueco son migratorios; el
electrón libre puede ''vagar" dentro del cristal en una fonna aleatoria, impelido por
la energía ténnica que pueda adquirir de la propia red. Del mismo modo, el hueco
puede desplazarse porque un electrón de un enlace covalente adya~ente al hueco
puede moverse con suma facilidad hacia el hueco, completando así la pareja de
enlace en el sitio original del hueco; pero transfiriendo la ubicación del hueco al
284
Semiconductores electrónicos uniformes en equilibrio
sitio de donde provino el electrón. Esta migración del hueco también puede producirse por una agitación térmica de la red. Los electrones libres y los huecos se
moverán también en respuesta a un campo eléctrico y pueden dar origen a una
corriente macroscópica que fluye por el cristal. En la figura 9.3(b) se ilustra esta
situación. En este caso, todos los electrones del-cristal, tanto en la banda de conducción como en la de valencia están sometidos a la fuerza - eE que actúa a la derecha
del diagrama. Los electrones libres se mueven hacia la derecha produciendo un flujo
de corriente convencional a la izquierda, debido a su carga negativa. Además un
electrón de un enlace covalente adyacente a un hueco se puede desplazar a la
derecha hacia el sitio vacío del electrón asociado con él, y el hueco se desplaza
hacia la izquierda al sitio de donde provino este electrón; este proceso se puede
repetir y el resultado neto es una transferencia neta de un electrón hacia la derecha
que va acompañada del movimiento del hueco hacia la izquierda, es decir, en la
11
11
11
11
11
=@=@=@=@=@=
11
11
11
11
11
=@=@=@=@=@=
11
11
e11
11
11
=@=@-@=@=@=
11
11
11
11
11
=@=@=@=@=@=
11
11
11
11
11
=@=@=@=@=@=
11
11
11
11
_.11
11
11
11
"
=@j~'~@=@=@=
11
11
11
11
11
=@=@=@=@=@=
11
11
11
11
11
@=@=@=@=@=
11
Electrones de _.....-.
enlace covalente
(o)
Figura 9.3.
11
=@=@=@=@=@=
11
11
11
11
11
=@=@=@=@=@=
11
ll ()¡¡---iT-e 11
11
11
11
11
-E
(b)
(a) Un electrón libre y un hueco producidos por la ionización térmica de un
electrón que originalmente se encontraba en un enlace covalente. (b) Movimiento
del electrón libre (a la derecha) y el hueco (a la izquierda) cuando se aplica un
campo eléctrico tal y como se indica.
dirección en que la partícula de carga positiva se movería bajo la influencia de un
campo aplicado. La corriente neta de electrones hacia la derecha da origen nuevamente a un flujo convencional de corriente hacia la izquierda que puede representarse como una corriente de huecos positivos en tal dirección. Así pues, el flujo de
la corriente puede deberse tanto al movimiento de electrones libres como a la migración de electrones de valencia dentro y fuera de estados vacíos de la banda de
valencia, que se puede considerar mejor como la migración de huecos positivos.
9.2 SEMICONDUCTORES INTRINSECOS
Y SEMICONDUCTORES CON IMPUREZAS
Un semiconductor en el que los huecos y los electrones se crean exclusivamente mediante una excitación térmica a través de la banda prohibida de energía, se
conoce como semiconductor intrínseco. Los huecos y los electrones creados de esta
Semiconductores intrínsecos y semiconductores con impurezas
28S
manera a menudo se denominan portadores intrínsecos de carga y la conductividad
originada por estos portadores se llama conductividad intrínseca. En un semiconductor
intrínseco, las concentraciones de electrones y huecos siempre deben ser las mismas, ya
que la excitación térmica de un electrón origina inevitablemente sólo un hueco.
La población de huecos y electrones en un semiconductor intrínseco se describe estadísticamente de acuerdo con la función de distribución Fermi-Dirac y las
funciones de densidad de estados para las bandas de valencia y conducción. Puesto
que la parte baja de la banda de conducción y la parte superior de la de valencia
muestran una dependencia esencialmente parabólica de su relación e y k, el comportamiento de los electrones y los huecos en estas regiones es fundamentalmente el de
una partícula libre, con los factores apropiados de masa efectiva. Los electrones y
los huecos se ven raramente excitados hacia las regiones de las bandas de conducción
y valencia en donde sus propiedades pueden diferir del comportamiento de una
partícula libre a temperaturas físicamente posibles de manera que los efectos de
estas excitaciones se pueden desechar para fines prácticos. Entonces, las funciones de
densidad de estados que se van a usar son en esencia las de las partículas libres y
la densidad de estados de la banda de conducción está dada por
ge(e) de=
sJh32n m*
n
312 Je -e de
e
(9.2-1)
y la densidad de estados de la banda de valencia es
~de
312
g v( e) de= Sj2n
h3 m*P V t>v- t
'
(9.2-2)
m;
en donde m~ es la masa efectiva de los electrones de la banda de conducción y
es la masa efectiva de los huecos de la banda de valencia. 1 Por supuesto, la densidad
de estados en la región prohibida ev <e < ec es cero. En la figura 9.4 aparece una
gráfica de la curva de densidad de estados correspondiente a un semiconductor
intrínseco. Si
y m~ son precisamente iguales, la energía de Fermi debe quedar
m;
Figura 9.4.
Función de densidad de estados de un semiconductor intrínseco.
1 Los subíndices n y p se refieren a los portadores de carga negativos y positivos. Esta
regla se aplicará de un modo invariable.
286
Semiconductores electrónicos uniformes en equilibrio
exactamente en el centro de la región prohibida. Esto es lo correcto debido a que.
de otra manera, la población de electrones en la banda de conducción y los huecos de la banda de valencia, obtenidos integrando el producto de la función de densidad
de estados y el factor de probabilidad f 0 (e) para los electrones en la banda de
conducción, ó 1 - f 0 (e) para los huecos en la banda de valencia, no sería idéntica.
La situación se representa diagramáticamente en la figura 9.5(a). Si
y m~ no son
iguales (y este es el caso general), la energía de Fermi debe sufrir un pequeño ajuste
ascendente o descendente, alejándose del centro exacto de la banda prohibida de
energía, para igualar las integrales de población y, por tanto, debe quedar cerca,
pero no en el centro de la región prohibida. En la figura 9.5(b) se muestra esta
circunstancia. En una sección posterior se investigará más detalladamente la estadística de huecos y electrones.
m;
·t
-fo(•l
g(•l
1
1
1---uc<•l
1
1
1
Probabilidad f 0
de ocupación
de electrones
1
_Producto
f0 (. l9c(• l
.,
.,
.... Producto
[1-f0 (•l]uv<•l
....
Probabilidad
1- t0 para huecos
''
''
9v<•l
f 0 =0
(o) m~ =m~
Figura 9.5.
'/' ,
1
1
2
(b) m*p =m*,
Función de distribución, nivel de Fermi, función de densidad de estados y poblaciones de electrones y huecos de un semiconductor intrínseco (a) en donde
=m~ y (b) en donde
>m~. Ui "ampliación" de la distribución de Fermi se
ha exagerado aquí para ilustrar con mayor claridad; en realidad, a 300°K, la distribución de Fermi sería más bien como la función "escalón" que se encuentra para
T=O.
mp
mp
Es muy fácil introducir cantidades muy pequeñas de substancias tales como
arsénico, antimonio u otros elementos pertenecientes al grupo V de la tabla periódica, en cristales puros de silicio o germanio, como impurezas de substitución, es
decir, como átomos de impurezas que ocupan sitios de la red que normalmente
estarían ocupados por átomos del semiconductor covalente. Los átomos del grupo V
tienen cinco electrones de valencia. Cuatro de ellos se usan para formar enlaces
covalentes con átomos circunvecinos del semiconductor y el quinto se enlaza al
átomo de impureza sólo mediante fuerzas electrostáticas que son muy débiles y, por
ende, se pueden ionizar con facilidad mediante la agitación térmica de la red a
Semiconductores intrínsecos y semiconductores con impurezas
287
temperaturas ordinarias para proporcionar una conducción electrónica adicional. Entonces, el átomo de impureza que queda se convierte en un ion positivo, que, sin
embargo, es inmóvil, en vista de que está fuertemente unido a cuatro átomos vecinos
por medio de los enlaces covalentes normales. Esta situación se ilustra en la figura 9.6(a). En cristales que contienen este tipo de impureza existen más electrones
que huecos (aunque algunos huecos siguen estando presentes debido a los pares
hueco-electrón que se siguen creando térmicamente de vez en cuando). Estos cristales
se denominan semiconductores tipo n, designados así porque la mayoría de los
portadores de carga son electrones negativos. La componente de la conductividad
eléctrica que se produce por los átomos impureza se llama conductividad de impureza. Una substancia cuya mayoría de portadores se origina debido a átomos de
impureza, se conoce como semiconductor con impurezas. Los átomos del grupo V
de substitución se llaman con frecuencia átomos donadores, ya que cada uno de
ellos dona un electrón libre adicional al cristal. Se requiere tan poca energía (como
se verá en breve) para ionizar un átomo de impureza donadora típico del grupo V
en Si y Ge, que prácticamente todas las impurezas del grupo V en estos materiales
se ionizan a temperaturas superiores a aproximadamente 20°K.
11
hbre
11
11
11
11
11
11
11
=@=@=@=®=
Hueco---¡¡"'
=@=@~@=@=
=@~@=@=@=
' ,t
11
11
11
=®=@~CGt=@=
11
11
11
11
11
11
11
' ~.
11
=@=®=(e/=@=
11
11
=@=@=@=@=
(a)
Figura 9.6.
11
11
=@ =@ =@ =
O..,l.l
~lectrón =~
11
(tipo·n)
11
1
11
11
11
'~u
11
11
=®=®=@=@=
11
11
(b)
11
11
(tipo-p)
(a) Electrón libre originado por la ionización de un átomo de impureza de arsénico
de substitución, (b) hueco libre producido por la ionización de un átomo de indio
de impureza de substitución.
Si en lugar de los átomos del grupo V se introducen en la red átomos de
impurezas del grupo lli (Al, Ga, In, etc.), se observará un efecto muy distinto. Estos
átomos tienen sólo tres electrones de valencia que se usan para formar enlaces
covalentes con tres átomos cercanos; pero el cuarto enlace siempre carece de un
electrón. En efecto, existe un hueco adicional que se crea en la estructura del enlace
covalente en el átomo de la impureza. Este hueco puede emigrar fácilmente alejándose del sitio de la impureza debido a que un electrón adicional del enlace covalente
cercano puede emigrar al sitio de la impureza y llenar el cuarto enlace de par de
electrones (que, por supuesto, representa una carga negativa en el átomo de impureza); a continuación, el hueco se asocia con el átomo cercano que no se puede
distinguir de un hueco térmicamente formado. En la figura 9.6(b) se ilustra esta
situación. La energía necesaria para la migración del hueco lejos del sitio de la
impureza es del orden de la energía que se requiere para eliminar el electrón adicional de un átomo donador. En consecuencia, excepto a temperaturas muy bajas,
todos los huecos serán migratorios y todos lo átomos de impurezas del grupo IIl
tendrán la naturaleza de iones negativos inmóviles. En cristales que contienen predominantemente este tipo de impureza se tienen más huecos que electrones, aunque
288
Semiconductores electrónicos uniformes en equilibrio
.t
·t
lectrones
Electrones
.,_-+-_
Nivel de Fermi
intrínseco-
Nivel de F
-"----
.,
Huecos
fo= o
(a) tipo-n
Figun 9.7.
fo= O
( b) tipo-p
Función de distribución nivel de Fermi y poblaciones de electrones y huecos para
(a) un semiconductor con impurezas tipo n y (b) un semiconductor con impurezas
tipo p. Una vez más, como en la figura 9.5, la "ampliación" de la distribución de
Fermi se exagera con fines ilustrativos.
siempre habrá algunos electrones que se originan debido a la excitación térmica. Los
cristales de esta índole se conocen con el nombre de semiconductores tipo p, dado
que los portadores de carga mayoritarios son positivos. Los átomos de substitución
del grupo III se clasifican casi siempre como átomos receptores, debido a que pueden recibir un electrón de la -estructura del enlace covalente liberando un hueco
móvil. Cuando en un cristal semiconductor existen impurezas de ambos tipos, la
conductividad es invariablemente mayor que la referente a un semiconductor puro o
intrínseco a la misma temperatura, debido a los portadores .1e carga lldicionales
originados por los átomos de impurezas y, en general, mientras más grande es 1~
concentración de impurezas, tanto mayor es la conductividad.
La representación estadística de los semiconductores tipo n y p se caracterizan
por la presencia del nivel de Fermi superior (para el tipo n) o inferior (para el tipo
p) a la posición asociada con el cristal puro o intrínseco. Por ejemplo, en un cristal
tipo n, no puede haber más electrones que huecos, a menos que el nivel de Fermi
se ajuste de un modo ascendente en relación con la posición intrínseca, y viceversa
para el tipo p, como se ilustra en la figura 9.7. Conforme varían la temperatura y la
concentración de impurezas, la posición del nivel de .Fermi cambia de un modo muy
complejo. Este tema se ampliará más adelante.
9.3
ESTADISTICA DE HUECOS Y ELECTRONES;
EL CASO DEL SEMICONDUCTOR INTRINSECO
En condiciones de equilibrio térmico, el número de electrones dn 0 por unidad
de volumen que tienen una energía dentro del rango de alrededor de e en la banda
Estadística de huecos y electrones; el caso del semiconductor intrínseco
289
de conducción de cualquier semiconductor, intrínseco o con impurezas, de acuerdo
con los resultados del capítulo 5, es
f ( )
de
d n0 -- 10
e 9c( e) d S-- ----¡;:r- mn*3/2 J~
!.....!!
sJ2.n
(9.3-1)
1 +e kT
en donde f 0 (e) representa la función de distribución de Femli en equilibrio (5.5-20)
y gc(e) es el factor de densidad de estados (9.2-1). Ahora, ~€, la anchura de la
región de energía prohibida, es casi siempre del orden de 1 eV y kT a la temperatura ambiente (300°K) es aproximadamente 1/40 eV. Si la energía de Fermi está
dentro de la región prohibida, a varias unidades kT lejos del borde de la banda de
conducción (es decir, si €e- e¡'> kl), entonces para todas las energías pertenecientes
a la banda de conducción, el factor exponencial del denominador de la función de distribución de Fermi es mucho mayor que la unidad. Por tanto, la función de distribución
de Fermi se puede representar en relación con la banda de conducción como
fo(s) ~ e-(e-e¡)/kT
(9.3-2)
que es una función de distribución con una forma esencialmente maxwelliana. La
situación en este caso es prácticamente la que se vio en el capítulo 5 en conexión
.:on la ecuación (5.5-27). Puesto que ya se indicó en la figura 9.5 que la energía de
Fermi para un semiconductor intrínseco debe quedar dentro de la región prohibida
de energía, y dado que kT ~ ~€ a todas las temperaturas accesibles, como se señaló
mtes, la condición €e- e¡'> kT se satisface siempre en la práctica y siempre se
puede utilizar la expresión (9.3-2) para semiconductores intrínsecos mejor que la que
es más complicada, (5.5-20). En realidad, en la mayoría de los casos relacionados
.:on semiconductores con impurezas, se descubrirá que esta condición se satisface, lo
.:ual también permite utilizar (9.3-2) para estos semiconductores. Por ejemplo, es
evidente que esta simplificación sería válida para los semiconductores con impurezas
de la figura 9. 7. En las figuras 9.5 y 9. 7 se puede ver que la "cola" exponencial de
la función de distribución de Fermi es la única parte de dicha función que tiene una
superposición con las bandas de c0nducción y valencia. La parte de la función de
Fermi en las cercanías de la energía de Fermi, que es invariablemente la parte que
origina dificultades matemáticas, coincide en todos los casos con una región en
dor.de la densidad de los estados electrónicos disponibles es cero. La aproximación
de simplificación (9.3-2) se conoce con el nombre de aproximación de Boltzmann.
Si se utiliza esta aproximación en (9.3-1) y se integra para obtener el número
total de electrones por unidad de volumen en la banda de conducción, se encuentra
.:¡ue
nO =
I
00
~
J
dn = - 8 2n.
O
h3
I
00
m*3f2 e•¡lkT
n
--
Je-e e e-•tkT de ·
(9.3-3)
~
En realidad, los límites de integración deben ser desde Ee hasta la parte supenor de la banda de conducción, sea donde fuere; sin embargo, puesto que !o(€)
desciende muy rápidamente al incrementarse e (-por lo menos para valores razonables
de temperatura), la mayoría de los electrones se concentran en los estados cercanos
J. la base de la banda de conducción. En tanto que la parte superior de la banda
tenga una energía muchas unidades kT mayor que Ee, no hay mucha diferencia en el
290 Semiconductores electrónicos uniformes en equilibrio
hecho de si se integra a la parte superior de la banda o a infmito. Cuando se hace
la substitución
¡;-Be
X=-e
kT
(9.3-4)
la integral (9.3-3) se puede expresar en la forma
(9.3-5)
De acuerdo con (5.4-4), el valor de la integral antenor es r(3/2) = y1r/2. Si se
substituye e.ste valor para la integral, el resultado sería
(9.3-6)
en donde
(9.3-7)
El valor numérico de la cantidad Uc se puede escribir (usando las unidades
cgs) como
(9.3-8)
en donde m 0 es la masa inercial del electrón. Para m:; = rn 0 y T = 300°K, esto da
Uc = 2.51 X 10 19 cm- 3 .
El número de huecos Po por unidad de volumen en la banda de valencia de
un semiconductor, se puede encontrar de un modo similar. En este caso se puede
expresar como dp 0 , el número de huecos en la banda de valencia dentro del rango
de energía de alrededor de e,
(9.3-9)
La cantidad [po(e) es la probabilidad de que un hueco esté asociado con un
estado cuántico de energía e, en otras palabras, que dicho estado estará desocupado.
Esta probabilidad es justamente, uno menos la probabilidad de ocupación f 0 (e).
Puesto que [ 0 (e) está dada por (5.5-20), se puede ver fácilmente que
1
/po(e) = 1-/o(e) = 1 - 1 + e<• .,J!kT - 1 + e<•' •JikT.
(9.3-10)
Nuevamente, si la energia de Fermi tiene varias unidades kT por encima del
borde de la banda de valencia, es decir, si e¡- Ev ~ kT, el factor exponencial del
denominador de la expresión (9.3-10) ¡;s mucho mayor que la unidad, para todos los
valores de e en la banda de valencia, se puede hacer que
(9.3-11)
Esta es la aproximación de Boltzmann para los huecos en la banda de valencia.
Si se usa (9.3-11) y la función de densidad de estados (9.2-2) en (9.3-9) y se i,r.tegra
Estadística de huecos y electrones; el caso del semiconductor intrínseco
291
sobre la banda de valencia, se obtiene
(9.3-12)
También en este caso el límite inferior de la integral es - oo y no la base de
la banda de valencia; esta simplificación se justifica más o menos con el mismo
argumento que se usó en relación (9.3-3) para la banda de conducción. Cuando se
hace la substitución
8v- e
X=-v
kT
(9.3-13)
la integral se puede expresar en la forma
(9.3-14)
que se puede evaluar como una función r-, como antes, para dar
(9.3-15)
con
(9.3-16)
El valor numérico de Uv puede obtenerse a partir de (9.3-8), substituyendo en
la fórmula mp por m~.'
Se puede demostrar con facilidad que el producto m 0 p 0 es una función exclusiva
de la banda prohibida de energía t:.e, las masas efectivas y la temperatura, e independiente del nivel de Fermi o del contenido de impurezas. Por tanto, al multiplicar las
expresiones (9.3-6) y (9.3-15) para n 0 y p 0 , ~e puede obtener
(9.3-17)
Si se usa (9.3-7) y (9.3-16), esto se puede escribir en la forma
(9.3-18)
Para una substancia semiconductora dada, las masas efectivas y la banda prohibida de energía ~e son fijas; de donde, el producto n 0 p 0 de un material dado debe
ser una función exclusiva de la temperatura. Esta es esencialmente una ley de acción
de las masas que rige las concentraciones relativas de huecos y electrones en un
material en particular. Si el semiconductor se encuentra en un estado intrínseco o
puro, las concentraciones de huecos y electrones deben ser iguales, como se vio
antes, debido a que sólo los huecos y los electrones que pueden estar presentes son
los que se generan en pares mediante la excitación térmica de los electrones de la
banda de valencia. En consecuencia, en este tipo de materiales,
Po = n0 = n¡(T)
(9.3.19)
292 Semiconductores electrónicos uniformes en equilibrio
en donde n¡(T) representa el número de huecos o electrones por unidad de volumen
dentro de una muestra intrínseca del semiconductor en cuestión a la temperatura T.
En una muestra de la misma substancia que no es intrínseca, sino más bien un
semiconductor con impurezas, el número de huecos y electrones ya no es el mismo:
sin embargo, de acuerdo con (9.3-17), el producto n 0 p 0 debe ser el mismo para este
material que para la substancia intrínseca. Por tanto, se puede escribir, de acuerdo
con (9.3-19),
(9.3-20)
siendo
(9.3-21)
como lo establece (9.3-18). De acuerdo con estos resultados, la concentración de
portadores en un semiconductor intrínseco tiene una gran dependencia de la temperatura, aumentando rápidamente conforme se incrementa esta última y, de igual
manera, depende enormemente de la banda prohibida de energía Lle, decreciendo
con gran rapidez al aumentar Lle.
La relación de la acción de las masas (9.3-17) ó (9.3-20) recuerda claramente
las leyes que gobiernan las concentraciones relativas de iones en substancias que
están débilmente ionizadas, por ejemplo, los iones H+ y OH- en sistemas acuosos.
En realidad los semiconductores se pueden comprender como un ejemplo de la
teoría clásica de Arrenhius sobre los electrolitos débilmente ionizados en relación
con un sistema en el que un enlace covalente se disocia en un electrón y un hueco
con la energía de disociación Lle.
En una muestra puramente intrínseca, en donde las concentraciones de huecos y
electrones son iguales, se pueden igualar las expresiones (9.3-6) y (9.3-15), tomar el
logaritmo de ambos lados de la ecuación resultante y resolver para la energía de
Fermi, lo cual da
(intrínseca).
(9.3-22)
Puesto que Uv y Uc están dadas por (9.3-16) y (9.3-7), se puede expresar este
resultado en la forma
(intrínseca),
(9.3-23)
usando el símbolo e¡¡ para denotar la energía de Fermi de un semiconductor intrínseco. De acuerdo con esto, es evidente que en un semiconductor intrínseco la energía de Fermi queda desplazada del centro del vacío de energía sólo por una cantidad relativamente pequeña de energía, según lo indica el segundo término del lado
derecho de (9.3-23). Si m;= m~, el nivel de Fermi se encuentra exactamente en el
punto medio de la región prohibida, como sr señaló con anterioridad.
9.4
ENERGIA DE IONIZACION DE CENTROS DE IMPUREZAS
Un centro donador de un semiconductor se compone de un icn fijo de carga
+e con el que está enluado débilmente un electrón. Si la energía de enlace es lo
Energía de ionización de centros de impurezas
293
suficientemente pequeña, la "órbita" del electrón será tan grande en comparación
con el espaciamiento interatómico, que la trayectoria del electrón alrededor del ion
donador 2 abarcará muchos átomos. En estas circunstancias, es correcto pensar que el
electrón está sumergido en un medio uniforme polarizable cuya constante dieléctrica K,
es la constante dieléctrica macroscópica del cristal semiconductor, ya que la fuerza electrostática entre el ion donador y el electrón entonces se modificará en promedio, por la
polarización de los muchos átomos que intervienen. La representación es similar a la
de un átomo de hidrógeno dentro de un medio uniforme continuo, cuya constante
dieléctrica es " si se puede imaginar esta situación. Esta representación será válida
siempre y cuando K tenga tal magnitud que las órbitas de Bohr sean grandes en
comparación con el espaciamiento interatómico.
Ahora se puede calcular el tamaño de las órbitas y los niveles de energía
asociados de acuerdo con la teoría de Bohr que se vio en la sección 4.5. Sería más
exacto usar la mecánica ondulatoria del átomo de hidrógeno para estos cálculos;
pero puesto que se sabe que la teoría de Bohr y el promedio de la mecánica
ondulatoria de las distancias nucleares electrónicas son casi las mismas, se puede
confiar en que la teoría simple de Bohr dará respuestas adecuadas para esta situación que es muy similar. La condición de cuantización para la cantidad de movimiento angular orbital se aplica en ambos casos, de modo que la ecuación (4.5-2)
sigue siendo correcta, a condición de que la masa electrónica se substituya por m~.
Por otra parte, debido a la polarización del cristal, la fuerza electrostática entre el
ion donador y el electrón enlazado se reduce en un factor ", haciéndose e2 /Kr~, de
tal manera que la ecuación (4.5-3) ahora se debe escribir como sigue
(9.4-1)
A continuación, las ecuaciones (9.4-1) y (4.5-2) se pueden resolver como ecuaciones simultáneas para rn y wn, dando [(en analogía con (4.5-4) y (4.5-5)],
(9.4-2)
y
m:e
4
Wn=~li3
2
n
K
(9.4-3)
Las energías cinética y potencial ahora se pueden evaluar como se hizo en
(4.5-6) y (4.5-7), recordando, sin embargo, que la energía potencial ahora está dada
por - e2/K.rn, por lo cual la energía total es
(9.4-4)
La teoría de Bohr para el átomo de hidrógeno se expresa mediante las ecuaciones anteriores con m~= m 0 y K = l. De acuerdo con (9.4-2), es ev.idente que las
2 Aunque describe la situación, esto no constituye un buen lenguaje de mecánica cuántica;
sería más exacto decir que la función de onda del electrón se extiende sohre muchas distancias
interatómicas, de tal manera que se incluyen muchos átomos dentro de la región en donde la
densidad de probabilidad es grande.
294
Semiconductores electrónicos uniformes en equilibrio
órbitas de Bohr para el centro donador son más grandes que las órbitas del hidm.
geno por un factor K y también por un factor m 0 /m~. Para el germanio tipo 11.
K= 16 y m~~ m 0 /4, de tal manera que el radio de la primera órbita de Bohr es 64
veces el radio de la primera órbita de Bohr del hidrógeno. El valor del hidrógeno ea
0.528A, de tal suerte que el valor para el átomo donador en el germanio es alredodor de 34 A. En efecto, esto es considerablemente mayor que la distancia interátomica (que es más o menos 2.44A para el germanio), de donde, esta representaciÓII
del centro donador está justificado en este caso desde el punto de vista físico.
La energía de ionización del centro donador, de acuerdo con (9.4-4), es menor
que la del átomo de hidrógeno por un factor 1/K 2 y también por un factor
m~/m 0 • Para el caso del germanio, esto representa (1/256) • (1/4) = 1/1024. Entonces, podría esperarse que la energía de ionización para el estado basal de un átomo donador sea aproximadamente 1000 veces menor que la del estado basal del átomo
de hidrógeno (13.6 eV). En consecuencia, se llega a la cantidad 0.013 eV para la
energía de ionización de un átomo donador en el germanio. Este valor concuerda
aceptablemente con los valores determinados en la práctica y que se obtuvieron
por la medición de concentraciones de portadores en función de la temperatura
y por la absorción óptica en el infrarrojo, según lo indica la tabla 9.1. Los valores más elevados de energía de ionización observados para el silicio, se explican
en parte por la constante dieléctrica menor (K = 12) de este material, y en parte por
las masas efectivas más grandes de los electrones del silicio. Las características de los
centros receptores se pueden comprender siguiendo el mismo razonamiento, utilizando una representación que comprenda un ion receptor negativamente cargado y un
hueco de carga positiva dentro de un medio dieléctrico uniforme.
TABLA 9.1.
Energías de ionización de centros donadores
y receptores en Ge y Si
Impureza
Ge
Si
p
As
Sb
0.012 eV
0.0127
0.010
0.045 eV
0.05
0.039
B
Al
Ga
In
0.0104
0.0102
0.0108
0.0112
0.045
0.06
0.07
0.16
Por tanto, se puede considerar que los electrones cedidos por átomos donadores se originan en estados donadores localizados dentro del vacío de energía prohibida, a unas cuantas centésimas de electrón volt por d•bajo de la banda de conducción. De igual manera se puede considerar que los huecos cedidos por los átomos
receptores se crean cuando los electrones, que normalmente deberían ocupar los
estados cercanos a la parte superior de la banda de valencia, se desplazan a niveles
receptores que estaban vacíos en un principio, y cuya energía se localiza a unas
cuantas centésimas de electrón volt por encima de la banda de valencia. Este patrón
de niveles donadores y receptores se ilustra en la figura 9.8(a). La representación
correspondiente de la densidad de estados aparece en la figura 9.8(b).
Estadística de los semiconductores con impurezas
E
t
295
Banda de conducción
Electrones
_ /
de conducción
•e ""'""'~-=--=-~:.__-=---
Ee
----~Niveles donado::s
...
Electrones de la banda de valencia
que ocupan los niveles receptores
f /Niveles
_ _ _ _¿ _ r~eptores •.,
••
••
L
Banda de valencia
(a)
Figura 9.8.
9.5
(b)
(a) Diagrama de bandas de energía de un semiconductor con impurezas indicando
los niveles donador y receptor, (b) curva correspondiente a la densidad de estados.
ESTADISTICA DE WS SEMICONDUCTORES CON IMPUREZAS
Antes de estudiar la mecánica estadística verdadera de los semiconductores con
impurezas, es necesario examinar una característica sutil de la estadística de ocupación de los niveles donadores y receptores. Si se confinara el estudio a los niveles
donadores uno se sentiría tentado a llegar a la conclusión de que la probabilidad de
ocupación asociada con dichos niveles estaría dada por la función de equilibrio de
Fermi (5.5-20), siendo e= ea. Sin embargo, esto no es del todo correcto, debido a
la degeneración del espín de los niveles donadores. Existen en realidad dos estados
cuánticos asociados con cada nivel de impurezas donadoras correspondientes a las
dos orientaciones del espín permisibles del electrón sobre el átomo donador. No
obstante, tan pronto como se ocupa uno de estos estados, se excluye la ocupación
del otro, ya que los requisitos de valencia del ion donador se satisfacen con un solo
electrón. Esta situación altera el problema estadístico que conduce a la función de
distribución.
Sea un sistema que tiene niveles de energía de este tipo, como se ilustra en la
figura 9.9. Se supondrá que los electrones que ocupan los niveles son partículas
Figura 9.9.
No. nivel de energía
2
3
4
1------1 1----------11
n
Energía
.,
•z
.3
.4
.,
Degeneración
g,
9z
g3
g4
9¡
glt
No. de electrones
N,
Nz
N3
N4
N¡
N"
."
Niveles de energía y notación usada en los cál..,ulos de la sección 9.5.
296
Semiconductores electrónicos uniformes en equilibrio
indistinguibles y que existen N¡ electrones en el iésimo nivel cuya degeneración es g¡.
El número de formas de insertar el primer electrón en los estados cuánticos pertene-cientes al iésimo nivel, es g¡; el número de maneras de colocar el segundo es g¡- ~
dado que la ocupación del primer estado por el primer electrón excluye la ocupación del estado de espín opuesto; el número de maneras de insertar el tercero es
g¡- 4 y así sucesivamente. Para el iésimo, el número será g¡- 2N¡ + 2. El número
total de modos de arreglar N¡ electrones no distinguibles en g¡ estados, en estas
circunstancias, es
g¡(g¡- 2)(g¡- 4) ··· (g¡- 2N¡ + 2)
N¡!
(9.5-1)
El factor N¡! del denominador se incluye porque las distribuciones que son
idénticas a excepción de la permutación de los electrones entre ellas mismas no
deben contarse como distribuciones diferentes, ya que los electrones no son distinguibles unos de otros. El número total de formas de lograr una distribución en la
que se tengan N 1 , N 2 • • • N n electrones en los niveles 1, 2, • • • n, es el producto
de los factores de la forma (9.5-1) sobre los niveles del sistema. Esta es precisamente
la cantidad Q(N1 N 2 • • • Nn) del capítulo 5 [véase, por ejemplo, (5.5-3)]. Por tanto.
para este sistema se tiene
(9.5-21
La función de distribución resultante se determina maximizando In Qa como
antes, utilizando el método de los multiplicadores lagrangeanos que se desarrolló en
el capítulo 5, siendo el resultado
en donde Et es la energía de Fermi definida del modo acostumbrado. Para los
niveles donadores, el número de átomos donadores es la mitad de la cantidad de
estados de espín o sea, 1/2g¡, de tal manera que para este sistema se puede escribir
n d -
N-
d
1 + te(~d
E¡)/kT
(9.5-4)
en donde Na es la concentración de átomos donadores de impurezas, Ea es la
energía de los niveles donadores y na es el número de electrones por unidad de
volumen que ocupan los niveles donadores (es decir, la concentración de donadores
no ionizados). Evidentemente, la función de Fermi está modificada por la presencia
del factor 1/2 que va en el denominador antes del término exponencial.
De manera similar, se puede demostrar que si Na es la concentración de átomos de impureza receptores y Ea la energía de los niveles receptores, la concentración de huecos asociada con Jos átomos receptores (o sea, la densidad de los sitios
receptores no ionizados) Pa, será
Pa = } + te<•! Ea)/kT •
(9.5-5)
Estadística de los semiconductores con impurezas
297
La densidad de estados asociada con los niveles donadores y receptores se
puede representar en términos de las funciones 8- de Dirac por medio de
(9.5-6)
y
(9.5-7)
Estas ecuaciones significan que no existen niveles donadores o receptores a
energías que no sean ea y ea, y que la cantidad total de estados cuántico donadores
y receptores por unidad de volumen es 2Na y 2Na, respectivamente.
Si la aproximación de Boltzmann es válida, tanto para la banda de conducción
como para los niveles donadores (es decir, si el nivel de Fermi está a varias unidades
kT por debajo de ea), el factor exponencial del denominador de la expresión en
(9.5-4) es mucho mayor que la unidad, y por ende, puede hacerse caso omiso de
este último; en donde, la ecuación (9.5-4) se puede escribir como
(9.5-8)
Puesto que la concentración de electrones en la banda de conducción está dada
por (9.3-6), se puede escribir la relación de na, el número de electrones asociado
con los donadores no ionizados, y n 0 + na, que es el número total de electrones
libres y débilmente enlazados como sigue
(9.5-9)
Ahora, ec - ea es la energía de ionización de los donadores que por lo general
es del orden de kT o un poco más pequeña; de donde, el factor exponencial
anterior es del orden de la unidad. Si Nv ~-!-Uc, la relación entre el número de
electrones en donadores no ionizados y el número total será muy pequeña. Puesto
que a 300°K Ue es del orden de 10 19 cm- 3 , esta condición se satisface a esa
temperatura para todas las concentraciones de impurezas donadoras que son reducidas en comparación con esta cifra. En estos casos, es evidente que los donadores
están casi totalmente ionizados y por lo general es más conveniente y exacto proceder sobre la suposición de que su ionización es completa, haciendo que na sea igual
a cero. A temperaturas muy bajas, el factor exponencial de (9.5-9) puede ser apreciablemente más pequeño que la unidad y el criterio para la ionización completa de
los donadores se debe escribir en la forma más general
(9.5-10)
De modo similar, a condición de que la aproximación de Boltzmann para los
huecos sea válida tanto para la banda de valencia como para los niveles receptores,
se puede demostrar que estos últimos quedan prácticamente ionizados por completo
siempre que
(9.5-11)
A menos que la temperatura sea muy baja, esto equivale al requisito Na ~tUv.
En casi todas las circunstancias el nivel de Fermi quedará dentro de la banda prohibida, a muchas unidades kT lejos tanto de los niveles receptores, como de los
298
Semiconductores electrónicos uniformes en equilibrio
donadores, y las impurezas receptoras y donadoras que puedan estar presentes estarán ionizadas casi por completo.
En un semiconductor en equilibrio debe haber un hueco térmico o un ion
donador positivamente cargado por cada electrón libre, y un electrón térmico o un
ion receptor negativamente cargado por cada hueco libre. Por tanto, todo el cristal
debe ser eléctricamente neutro. Esta condición de neutralidad eléctrica se puede
expresar igualando a cero la suma algebraica de todas las cargas negativas y positivas.
por lo cual (recordando que la concentración de los donadores ionizados es Na- na
y la de los receptores ionizados es Na - Pa),
(9.5-12)
Para todas las temperaturas, excepto las más bajas, y también para los valores
más elevados de concentración de impurezas, la aproximación de Boltzmann será
valida para las bandas de conducción y valencia, y también para los niveles donadores y receptores, de donde, las concentraciones de donadores y receptores no
ionizados, Pa y na, se pueden omitir en (9.5-12), lo cual da
(9.5-13)
o bien, si se emplea (9.3-6) y (9.3-15),
(9.5-14)
Si se hace que
IX = e•¡/kT,
Pe = e -•clkT
y
(9.5-15)
entonces, (9.5-14) se puede escribir en la forma
(9.5-16)
Al resolver esta ecuación cuadrática para o: y tomar el logaritmo del resultado,
se obtiene
(9.5-17)
Se debe escoger el signo positivo del radical de (9.5-17), ya que cuando Na=
Na =O, ee¡fkT debe ser una cantidad positiva. Esto se puede expresar de un modo
más satisfactorio haciendo notar que
(9.5-18)
Al utilizar esta relación y substiuir los valores dados por (9.5-15) para f3v y f3c.
(9.5-17) se puede expresar como sigue
(9.5-19)
Estadística de los semiconductores con impurezas
299
Como se puede ver de (9.3-23), los dos primeros términos del lado derecho de
esta ecuación representan el nivel de Fermi E¡¡ para un semiconductor intrínseco y,
ya que de acuerdo con (9.3-17) y (9.3-20), n¡=..JUcUve-i::.ef 2 kT, (9.5-19) se puede
escribir fmalmente como
e1 = e1 ¡ + kT se nh
-l(Nd-2n¡Na) .
(9.5-20)
~.----------------
~---------------
~-----------------
~"----------------
., ----------
.. ---------
t'f - - - - - - - - - -
~-------------
(a) (tipo·nl
Figura 9.10.
(b)
(tipo-p)
Posiciones relativas de los bordes de banda, nivel intrínseco de Fermi y nivel real
de Fermi en (a) semiconductores tipo n y (b) tipo p.
Esta expresión da el nivel de Fermi para un semiconductor con impurezas
dentro del rango en el que se satisface la aproximación de Boltzmann y los donadores y receptores se pueden considerar como totalmente ionizados. Las cantidades
n 0 ,p 0 ,nd y Pa se pueden obtener fácilmente a partir de (9.3-6), (9.3-15), (9.5-4) y
(9.5-5) una vez que se ha determinado el nivel de Fermi.
Puesto que senh-lx es positivo para x >O y negativo para x <O, se ve claramente que E¡> E¡¡ para semiconductores tipo n (Nd - Na > O) y E¡< E¡¡ para semiconductores tipo p (Nd -Na< 0), como se ilustra en la figura 9.10. Si la cantidad
de donadores y receptores es idéntica, la función senoidal hiperbólica inversa desaparece y el material se comporta exactamente como un semiconductor intrínseco en lo
que respecta a las poblaciones de electrones y huecos. En estas condiciones, se dice
que las impurezas tipo n y p están plenamente compensadas. Si la densidad neta
de impurezas INd- Nai es mucho mayor que n¡, el número de portadores térmicamente excitados será pequeño en comparación con la cantidad total; en este caso,
el argumento de la función senoidal hiperbólica inversa de (9.5-20) es muy grande.
Puesto que senh- 1x ~±In 12xl para valores grandes de x, es obvio que en estas
circunstancias (9.5-20) se convierte en
(9.5-21)
en donde el signo más se usa para el material tipo n (Nd >Na), y el signo menos
para el tipo p (Na> Nd). Se dice que un material semiconductor de esta naturaleza
es un semiconductor fuertemente extrínseco y el rango de aplicabilidad de (9.5-21)
se cita a menudo como el rango extrínseco.
Por supuesto, la densidad de portadores en las bandas de conducción y valencia se puede encontrar substituyendo la expresión (9.5-17) en lugar del nivel de
Fermi en (9.3-6) y (9.3-15). Se pueden determinar estas cantidades también en la
condición de neutralidad eléctrica (9.5-13), con la ayuda de (9.3-20). Por ejemplo,
cuando se substituye Po= nl/n 0 en (9.5-13), se obtiene
(9.5-22)
300
Semiconductores electrónicos uniformes en equilibrio
que se puede resolver para n 0 , dando
(9.5-23)
Para resolver la ecuación' cuadrática, es necesario seleccionar el signo positivo
para el radical, ya que el resultado debe reducirse a + n¡ para Nd =Na =O. Del
mismo modo, cuando se substituye n0 = n[ jp 0 en la ecuación de neutralidad de
carga, se puede demostrar que
(9.5-24)
De acuerdo con estas fórmulas, es evidente que cuando Nd- Na= O, no=Po =n¡. Este es el caso de la compensación total (o, si Nd =Na= O, de un semi·
conductor intrínseco). Si N d - Na >O, n 0 >Po como es de esperarse en un se·
miconductor de impurezas tipo n; si Nd -Na< O, Po > n 0 como se requiere en el
caso de un semiconductor tipo p. Para materiales fuertemente extrínsecos, estas
fórmulas se simplifican mucho. Por ejemplo, si Nd -Na;;» n¡, como sucede para una
muestra de un fuerte tipo n, entonces,
(9.5-25)
y
en tanto que para un material fuertemente p, en donde Nd -Na es grande y negativo,
y
n~
no~ N ~N.
a
(9.5-26)
d
Con el fin de conservar una generalidad total, se ha supuesto desde el principio
que están presentes tanto impurezas donadoras como receptoras. No obstante, en
muchos casos, sobre todo los relacionados con cristales en los que se han incorporado intencionalmente impurezas de un tipo, la concentración del otro tipo de impurezas puede desecharse por completo y, en efecto, igualarse a cero, en todas las
fórmulas de esta sección.
9.6
EL CASO DE LA IONIZACION INCOMPLETA DE NIVELES
DE IMPUREZA (TEMPERATURA MUY BAJA)
Es posible que a temperaturas muy bajas no exista la suficiente energía térmica
disponible para conservar la ionización completa de los niveles de impurezas donadoras y receptores como lo determinan los criterios (9.5-10) y (9.5-11). Por ejemplo,
a la temperatura del cero absoluto, en un semiconductor tipo n, los niveles donadores deben estar totalmente ocupados y la banda de conducción vacía por completo
de electrones. Estas dos condiciones no se pueden alcanzar a menos que el nivel de
Fermi quede entre los niveles donadores y la banda de conducción, como se rl~scribe
en la figura 9.11. En este .caso, la aproximación de Boltzmann ya no se puede usar
para describir la probabilidad de aplicación asociada con los niveles donadores, ya
que el nivel de Fermi se encuentra ahora más bien arriba que debajo de los niveles
de energía donadores. Sin embargo, la aproximación de Boltzmann se puede seguir
aplicando a los electrones de la banda de conducción debido a que el nivel de Fermi
El caso de la ionización incompleta de niveles de impureza
301
.t
•• -r-----==.t
.,
••
f 0 =O
Figura 9.11.
1/2
Función de distribución en un semiconductor tipo n a temperatura muy baja.
pennanece a muchas unidades kT debajo de la base de la banda de conducción; en
relación a esto se debe recordar que kT es sólo aproximadamente 0.001 eV a 10°K.
Se analizará en detalle el caso de un semiconductor de tipo puramente n en
donde Na= O, y se supondrá que T es tan baja que puede eliminarse la concentración de huecos creados térmicamente. Por supuesto, ya que Na =O, Pa debe desvanecerse también. Si se hace que Na = Pa =Po = O en (9.5-12), se puede escribir
(9.6-1)
Si se usa (9.3-6) y (9.5-4) para expresar n 0 y nd en esta ecuación, se obtiene
(9.6-2)
Sin embargo, puesto que
1-
1
1
1 + te.<•• .,¡¡kT- -:-1-+---=2-e--;:<•:-·-.:-,"Jtk..,.T'
(9.6-3)
(9.6-2) se puede convertir en
(9.6-4)
Si se hace que
y
(9.6-5)
(9.6-4) se convierte en
(9.6-6)
302
Semiconductores electrónicos uniformes en equilibrio
Esta ecuación se puede resolver para a de tal modo que dé
(9.6-7)
Se debe escoger el signo más para que a= e"tfkT sea positiva y, por ende, e1
sea real. Ahora, por definición,
(9.6-8)
--
Al tomar el logaritmo de ambos lados de (9.6-7), usando (9.6-8) y volviendo a
la notación original con (9.6-5), se puede obtener finalmente
e = -1 (e + e ) + -kT In _Nd - kT senh _ 1
f
2 e
d
2
2Ue
(J
Ue e _li•<flkT )
_
8Nd
'
(9.6-9)
en donde !::.e¡ = Ec - ed es la energía de ionización de los donadores. La densidad de
los electrones libres en la banda de conducción se puede calcular a partir de (9.3-6).
En el cero absoluto, (9.6-9) da e1 = t(ec + ed), lo que significa que el nivel de
Fermi está a la mitad entre los niveles donadores y la banda de conducción. Al
aumentar la temperatura, el nivel de Fermi aumenta ligeramente (no obstante, permaneciendo por debajo de Ec) y luego decrece desplazándose hacia abajo por los
niveles donadores hacia el centro de la banda prohibida. Para temperaturas en que el
nivel de Fermi esté a varias unidades kT por debajo de la energía de los donadores
ed, punto en el que los donadores están casi completamente ionizados, la ecuación (9.6-9) se reduce aproximadamente a (9.5-21). La prueba de este enunciado se
asigna como ejercicio al lector. Se puede demostrar de manera similar, que para
un semiconductor tipo p en estas mismas circunstancias, el nivel de Fermi a la
temperatura cero queda hacia la mitad entre los niveles receptores y la banda de
valencia y que, al aumentar la temperatura, se mueve primero un poco hacia abajo y
luego ascendentemente acercándose al valor dado por (9.5-21) conforme los niveles
receptores se ionizan por completo. En semiconductores tipo n y tipo p, el nivel de
Fermi tiende al valor intrínseco e¡¡ como lo establece (9.3-23) a temperaturas lo
suficientemente altas, ya que a una temperatura elevada, el número n¡ de portadores térmicamente excitados tendrán un exceso notable en relación con el número
INd- Nal con el que contribuyen las impurezas donadoras y receptoras. Al exceder
este punto, el comportamiento del material será muy aproximado en todos los aspectos al de un semiconductor intrínseco. No obstante, en algunos casos esta temperatura de transición puede exceder el punto de fusión del semiconductor. El nivel de
Fermi, como lo determinan (9.6-9) en el rango de temperaturas bajas y (9.5-20) a
temperaturas elevadas, se ilustra como una función de temperatura para materiales
tipo n y tipo p en la figura 9 .12.
9.7
CONDUCTIVIDAD
La densidad de corriente debida a huecos y electrones es igual al producto de
su densidad de carga y velocidades respectivas. Por tanto, la densidad de corriente o
Conductividad
i.,
i.,
(T)
303
(T)
-r
~r-------------------------
-r
•• o
(o) tipo-n
Figura 9.12.
(b)
tipo-p
Variación de la energía de Fermi en función de la temperatura para semiconductores (a) tipo n y (b) tipo p, de varias densidades de impurezas. Las curvas
marcadas con "1" corresponde!• a densidades de impurezas relativamente bajas, las
marcadas con "2" a densidades intermedias, y las marcadas con "3" a densidades
de impurezas relativamente altas.
la densidad de carga por unidad de tiempo transportada por huecos y electrones es
(9.7-1)
y
(9.7-2)
en donde Pn y Pp se refieren a las densidades de carga asociadas con las densidades
de electrones y huecos n y p, y Vn y vP son las velocidades vectoriales promedio de
los electrones y los huecos, respectivamente. Puesto que la velocidad electrónica
promedio es - J.LnE y la velocidad promedio de los huecos es J.LpE, en donde J.Ln y
J.Lp son las movilidades del electrón y el hueco y E es el campo, {9.7-1) y {9.7-2) se
puede escribir como sigue
(9.7-3)
(9.7-4)
por lo cual, la densidad total de corriente eléctrica 1 se puede expresar como
1 = e{nJ.Ln + PJ.Lp)E = aE.
(9.7-5)
La conductividad eléctrica a está dada entonces por
(9.7-6)
304
Semiconductores electrónicos uniformes en equilibrio
Las movilidades P.n y P.p de las fórmulas anteriores se definen como
y
(9.7-7)
en donde 1'n y Tp son los promedios ponderados de los tiempos de relajación 7 n
para electrones y 7 P para huecos sobre la distribución Maxwell-Boltzmann calculadas
como lo establece la ecuación (7 .3-12).
También se debe observar que n y p son los valores instantáneos reales de la
concentración de huecos y electrones que no necesariamente son idénticos a las
densidades de equilibrio de huecos y electrones n 0 y Po. Sin embargo, hasta ahora
se ha supuesto que no existen gradientes de densidad de portadores (que originarían
corrientes de difusión). Por supuesto, si las densidades de portadores son las relacionadas con el estado de equilibrio, se descubrirá que
(9.7-8)
es el valor correspondiente de conductividad. Es necesario establecer esta distinción.
porque es posible crear densidades de portadores en exceso de los valores de equilibrio
en los semiconductores, como se verá más tarde.
Para un semiconductor intrínseco con densidades de portadores iguales a los
valores de equilibrio, n 0 = p 0 = n¡ y (9.7-8) se convierte en
(9.7-9)
en donde b se define como la relación entre la movilidad de los electrones y los
huecos, es decir,
b = /ln/ /lp·
(9.7-10)
Si se usa (9.3-21), (9.7-9) se puede escribir en la siguiente forma
(9.7-11)
Puesto que la movilidad P.p tiene casi siempre una dependencia de la tempera·
tura que anula en su mayor parte la variación de temperatura '['3/ 2 del término que
precede al factor exponencial y, puesto que b no depende mayormente de la temperatura, la variación anterior de a0 como una función de 1/T es esencialmente
exponencial. De donde, una gráfica semilogarítmica de a 0 en función de 1/T da una
línea recta con una pendiente fle/2k, y el valor de la banda prohibida !le puede
determinarse con mucha precisión valorando la pendiente de una gráfica experimentalmente medida de ln a 0 en función de 1/T en el rango intrínseco.
Para un semiconductor que no es necesariamente intrínseco, sino que tiene
densidades de huecos y electrones que corresponden a los valores de tquilibrio
n 0 ,p 0 , la conductividad está dada por (9.7-8). Usando (9.7-10) para ebninar P.n, y
luego substituyendo las expresiones (9.5-23) y (9.5-24) para n 0 y p 0 , la conductividad se puede escribir como
CTo = e¡lp (bno +Po)= e/lp
[~ (b- l)(N
4 -
Na)+ (b +
l)J~(N4 - N + n/ J.
0)
2
(9.7-12)
Conducdwdad 305
Temperatura en °K
Temperatura en °K
33 3
1000300 78
20 4
10
14.3
10
333
18300 78
204
14 3
10
6
4
2
o
u
:e
•:::1
u
o
~
E
-...
u
'
.§
.e
eQ)
E
~
u
.
,
e
o
a.
11
'C
"'E'
"'u
·;:::
Q)
"'::J
'C
"C
u
"C
"'
E
e
o
o
~
~
0001~----~----~----~----~----~
o
00<!
0.04
006
0.08
1 1 Temperatura en °K
(a)
002
0.10
(b)
0.04
0.06
008
t 1 Temperatura en °K
....
u
1
>
;:;...
E
u
eQ)
"C
"' 10 4 ~---------------------------+~~~~~~
~
·:;
o
:¡¡;;
61
58
Nd ~ 10 11 cm-z
I0 3 ~~~~~~A---~~~~~------~--__J
10
20
30 40 50 60 80 100
200
300
(e)
Figura 9.13.
Temperatura en °K
(a) Conductividad eléctrica, (b) concentración de portadores y (e) movilidad de
electrones para una serie de muestras de germanio tipo n que cubren una amplia
variación de contenido de impurezas donadoras. [De acuerdo con E. M. Conwell,
Proc. I.R.E., 40: 1327 (1952).]
01
306
Semiconductores electrónicos uniformes en equilibrio
Véase ahora un semiconductor tipo n para el que Nd- Na es positivo. A temperaturas bajas, n¡ ~Nd- Na, por lo que, de acuerdo con (9.7,12), a 0 ~ (NdNa)beJlp = (Nd- Na)eJln, que es independiente de la temperatura, excepto en lo
que Jln pueda depender de T. Por tanto, el semiconductor es un material fuertemente
extrínseco y la mayoría de sus portadores se originan en los átomos de impurezas. Al aumentar la temperatura, n¡ aumenta con gran rapidez, de acuerdo con
(9.3-21), después llegará un momento en que será igual y luego sobrepasará a NdNa. Para temperaturas tales que n¡';PNd -Na, (9.7-12) da a 0 ~eJlpn¡(b + 1), que
es el mislno valor dado por (9.7-9) para un semiconductor intrínseco. Entonces
la conductividad aumenta con gran rapidez al incrementarse la temperatura debido al rápido aumento de n¡. La muestra es ahora básicamente un semiconductor intrínseco. La
transición entre estos dos extremos de comportamiento se produce a la temperatura en
que n¡ = Nd- Na. Al aumentar la densidad de impureza Nd- Na, esta temperatura de
transición aumenta y para diferentes substancias semiconductoras con la misma densidad
de impurezas, la temperatura de transición aumenta al incrementarse la banda prohibida
/),¡¿ ya que la temperatura necesaria para generar una densidad dada de portadores intrínsecos aumenta con /),¡¿_ Se puede demostrar que se sigue el mismo comportamiento cualitativo de (9.7-12) en los materiales tipo p, en cuyo caso Nd- Na es negativo. En la
figura 9.13 se ilustra una gráfica semilogarítmica de la conductividad en función de 1/T
como lo predice (9.7-12) para·varias muestras con diferentes contenidos de impurezas.
A temperaturas extremadamente bajas (menos de aproximadamente 30°K), no
existe la suficiente energía térmica disponible para mantener la ionización de los
niveles donadores y receptores. En este rango de temperatura, la conductividad desciende de nuevo con rapidez al reducirse la temperatura, conforme los electrones
libres y los huecos se "congelan" de las bandas de conducción y valencia hacia los
niveles donadores y receptores. En cristales con una densidad de impureza muy
elevada, las funciones de onda de los electrones de átomos donadores cercanos o
huecos de átomos receptores cercanos pueden superponerse apreciablemente. El resultado de esto es la ampliación del nivel donador o receptor a una banda angosta
de energía, al igual que los niveles atómicos de energía se ensanchan para formar
una banda en la aproximación de enlace filme, conforme las funciones de onda
electrónicas de átomos vecinos comienzan a superponerse. Puesto que existe el doble
de estados en estas bandas que electrones (o huecos), se puede observar una pequeña
conductividad residual de la banda de impllrezas en la banda de impurezas parcialmente llena en la región de temperaturas extremadamente bajas, en donde los electrones y los huecos se "congelan" de las bandas de conducción y valencia hacia los
niveles donadores y receptores.
9.8
EL EFECTO DE HALL Y LA MAGNETORRESISTENCIA
En la seccwn 7.6 se estudió el efecto de Hall en los gases de electrones libres
para el caso en que los electrones y los huecos tienen la misma componente de
velocidad x. Este análisis conduce a la expresión
(9.8-1)
para el campo transversal de Hall, en donde ! 0 es la densidad de corriente, B 0 la
inducción magnética y R la constante de proporcionalidad denominada coeficiente de
Hall. En la figura 7.3 se ilustra la orientación de la muestra, la corriente y los
El efecto de Hall y la magnetorresistencia
307
campos. En el caso sencillo que se vio en la sección 7 .6, en donde se supuso que
los portadores de carga eran electrones, se obtuvo la expresión
1
R=-n0ec
(electrones)
(9.8-2)
para el coeficiente de Hall. De acuerdo con el análisis de la secc10n 7.6, se ve
claramente que si los portadores de carga son huecos positivos, cuya concentración
es p 0 , la expresión para el coeficiente de Hall sería
1
R=Poec
(huecos).
(9.8-3)
Y a se señaló que el efecto de la distribución de velocidades se despreció al
obtener estos resultados. Ahora se incluirá el efecto de la distribución de velocidad
para volver a determinar el coeficiente de Hall de un semiconductor. Además, hay
que tener en cuenta que en un semiconductor pueden estar presentes simultáneamente portadores de carga positivos y negativos.
Además de estos efectos que tienen un interés inmediato para este estudio,
existen otras dos complicaciones que se deberán resolver eventualmente. Hasta ahora,
en todos los cálculos de población de portadores y transporte que se han llevado a
.:abo, siempre se ha supuesto que las superficies de energía constante dentro del
espacio de la cantidad de movimiento o espacio k, eran esféricas. Esta suposición se
0rigina naturalmente cuando el valor mínimo de energía en la zona reducida de
Brillouin ocurre en el punto central k = O. Sin embargo, existen substancias, incluyendo al germanio y al silicio (sólo en las bandas de conducción), en las que el
mínimo de energía se produce, no en el origen, sino en un grupo de puntos cristalográficamente equivalentes en otras partes de la zona de Brillouin. En tales casos, las
superficies de energía constante en las cercanías de los mínimos de energía pueden
ser elipsoidales más bien que esféricas. Esto introduce una anisotropía en la masa
~fectiva asociada con cada elipsoide; aunque los portadores se comportan como partículas libres en el sentido de que la variación de e con k es parabólica en cualquier
dirección de movimiento, tienen una masa efectiva diferente a lo largo de cada una
de estas direcciones. A pesar de que la anisotropía en las propiedades de transporte
se pierde cuando se suman los elipsoides de energía asociados con todos los puntos
mínimos de energía, el procedimiento para computar los factores de densidad de
~stados y promediar las propiedades de transporte sobre las velocidades, se debe
modificar para tener en consideración esa configuración diferente de las superficies
de energía constante.
Además de esto, las bandas de valencia del germanio y el silicio se componen
realmente de dos bandas distintas superpuestas en donde cada una de éstas se asocia
.:on una masa efectiva distinta. Aunque las superficies de energía constante para
estas dos bandas son aproximadamente esféricas cerca del punto máximo en k = O,
existen en realidad dos especies de huecos presentes (huecos "ligeros" y huecos
··pesados" correspondientes a las dos masas efectivas) en forma simultánea.
Cualquier teoría de procesos de transporte que intente explicar a fondo los
abundantes datos experimentales que existen en este campo en relación con el germanio y el silicio, debe necesariamente tener en cuenta estas dos complicaciones
adicionales. Sin embargo, para principiar será suficiente ampliar el cuadro del efecto
de Hall y los fenómenos relacionados con el mismo, para cubrir de un modo simultáneo a huecos y electrones e incluir el efecto de la distribución de velocidades. Por
tanto, se seguirá suponiendo que se maneja un semiconductor simple con superficies
-ie energía esféricas tanto en la banda de conducción como en la de valencia y que
308 Semiconductores electrónicos uniformes en equilibrio
sólo se tiene una variedad de electrones y huecos. Más tarde se indicará cómo estos
resultados se puede ampliar para admitir las dos dificultades adicionales que se acaban de mencionar.
En primer lugar se considerará un solo tipo de portador (se escogió a los
huecos) y se incorporará el efecto de la distribución de velocidad. La forma más
evidente para proceder es a partir de la ecuación de Boltzmann con el término de la
fuerza de Lorentz (7.6-2). No obstante, es más sencillo y provechoso utilizar otro
método 3 que principia con la ecuación de movimiento para un hueco en presencia
de un campo eléctrico uniforme E y una inducción magnética uniforme 8 0 . Esta
ecuación se puede escribir como sigue
* dv
e
t
e
F = mP -d = eE + - v X B0 •
(9.8-4)
Si se supone que la muestra, la corriente y el campo magnético están orientados como se indica en la figura 7.3, es obvio que B0 tiene sólo una componente z
y (9.8-4) se reduce a dos ecuaciones para las componentes x y y de la velocidad,
que tienen la forma
(9.8-5)
(9.8-6)
en donde
roll = eB 0 /m;c.
(9.8-7)
Este conjunto de ecuaciones se puede resolver más fácilmente multiplicando
(9.8-6) por el número imaginario i y sumando el resultado a (9.8-5). Mediante este
procedimiento se obtiene una sola ecuación
dV
e8
-+
iro 0V = dt
m*p
(9.8-8)
en donde las cantidades complejas V y 8 se defmen mediante
V= v,. + iv7
8 =E,.+ iE,.
y
(9.8-9)
La ecuacton (9.8-8) se resuelve fácilmente multiplicando los dos lados por
&wot. El lado izquierdo se puede expresar como la derivada en el tiempo de
Veiwot, y la ecuación resultante se integra con respecto al tiempo para dar
1
1
e8
.
V t> too = - - e•toor + C
. 0mP*
1ro
(9.8-10)
3 Véase, por ejemplo, H. Brooks, Advances in Electronics and Electron Physics, Nueva
York: Academic Press, Inc. (1955), Vol. VII, página 127 ff.
El efecto de Hall y la magnetorresistencia
309
en donde e es una constante de integración. Si se hace que V0 = Vxo + ivyo sea el
valor de V en t = O,
se puede evaluat en términos de V0 a partir de esta
ecuación, lo cual permite escribir {9.8-10) como
e
V=
V.oe-imot + ~* {l _ e-iwot)
o
1w0
m,
(9.8-11)
o
Esta expres10n se debe promediar primero sobre la distribución exponencial de
tiempos de relajación, lo cual da, en analogía con (7.2-13).
f'x' V(t)e- 11'' dt
(V) Prom. _Jo
sobre t
-
oo
fo e-1/•, dt
_
-
1
•
1 + IC.Oot,
[V.o+ e~t,]
* ,
m,
(9.8-12)
en donde 7 P representa el tiempo de relajación para huecos. A continuación se
deberá promediar esta expresión sobre la distribución Maxwell-Boltzmann de velocidades. Como siempre, se supondrá que 7 P es una función de la magnitud v; pero es
independiente de la dirección, es decir, isotrópica, de donde los promedios asociados
con el primer término de (9.8-12) siempre darán un promedio de una función sólo
de la magnitud de v por una componente Vxo ( = v0 sen cos cf>) o Vyo ( =
v0 sen e sen cf>). Un promedio de esta naturaleza será siempre cero ya que la integral de
la expresión resultante sobre la coordenada azimutal cf> siempre se desvanece. Por
tanto, en este estudio se puede omitir por completo de este término. Si se separa el
segundo término anterior en sus partes real e imaginaria, la parte real se puede
identificar como Vx y la imaginaria como vy, de acuerdo con (9.8-9). De donde, se
obtiene
e
(9.8-13)
y ésta es la expresión que se debe promediar sobre la distribución de Boltzmann para
obtener los valores promedios de Vx y Vy. En la sección 7.3 se vio, utilizando la
ecuación de Boltzmann, que si .a:(v) es la cantidad que se va a promediar, el promedio correcto que se debe sacar es
(9.8-14)
Si no se tiene un campo magnético, entonces, en la expresión (9.8-13), w 0 =O
y la ecuación da simplemente las velocidades vx y vy en función de los campos
eléctricos Ex y Ey. En este límite, la ecuación debe concordar con (7.3-11) y, en
efecto, lo hace, a condición de que 7 P se promedie de acuerdo con lo establecido
en {9.8-14). En realidad, como caso general, todos los promedios se deben calcular
de esta manera, lo cual conduce a
(9.8-15)
310
Semiconductores electrónicos uniformes en equilibrio
en donde
(9.8-16)
y
-
-
e
v, = lm(V) = ---;¡; [ ( 1
mP
-r:P
2 2 ) E-, -
+ w 0 -r:P
Wo ( 1
-r:P
2
+ w 02 -r:P2
)
Ex ] .
(9.8-17)
Las componentes x y y de la densidad de corriente, en la forma acostumbrada
pueden expresarse como
y
(9.8-18)
Como se ilustra en la figura 7.3, en t>l arreglo experimental acostumbrado, la
componente y de la corriente es cero, de donde, de acuerdo con (9.8-17),
(9.8-19)
Al substituir esto en (9.8-16), se obtiene finalmente
(9.8-20)
Si rp es independiente de v, entonces f(rp) =f(rp) y las ecuaciones anteriores
se reducen a los resultados simples e intuitivos
(9.8-21)
(9.8-22)
que concuerdan con (7.3-14) al igual que con (9.8-1) y (9.8-3). Es obvio que la
simple expresión del coeficiente de Hall obtenida anteriormente, es correcta aun
cuando exista una distribución de velocidades de Boltzmann, a condición de que T
sea independiente de la velocidad. También es evidente en (9.8-21), que en este caso
la conductividad eléctrica es independiente del campo magnético, es decir, no existe
una magnetorresistencia.
Sin embargo, generalmente T P depende de la velocidad y, entonces estos resultados ya no son correctos. En tales circunstancias, es más conveniente establecer la
suposición de simplificación que consiste en que w 0 T P ~ l. Esta condición se satisTará mejor para valores pequeños de inducción magnética y valores también pequeños
de T P que casi siempre se asocian con temperaturas más altas. La condición se
satisface normalmente en la mayoría de las substancias en las condiciones experimentales comunes hasta el rango de la temperatura del nitrógeno líquido, aunque
también es muy posible violarla, si esto es lo que se desea. Por ejemplo, si B 0 =
10,000 oersteds, T ,, =- JO- 12 seg. (correspondiente a una movilidad del orden de
El efecto de Hall y la magnetorresistencia
311
2000) y m;= m 0 , entonces, WoTp::::: 0.2. En este caso, el requisito quedaría marginalmente satisfecho; pero campos más altos y tiempos de relajación mayores darían
como resultado su violación. Si se supone que la condición es aplicable, se puede
hacer caso omiso de la cantidad w~T~ en (9.8-20) en comparación con la unidad.
De donde [expresando w 0 media..tlte (9.8-'i')j, ~::sta expresión se puede escribir como
sigue
(9.8-23)
en donde a 0 = p 0 e 2 rp/m;. Ahora parece que la conductividad eléctrica depende
del campo magnético; a este efecto se le conoce como magneto"esistencia. Se puede
demostrar que el segundo término entre paréntesis angulares de la expresión anterior
es siempre positivo, de tal modo que la conductividad se reduce invariablemente por
acción del campo magnético. La ecuación (9.8-23) se escribe con mayor frecuencia
de un modo diferente; resolviendo para Ex en función de lx y observando que
tl - w~r~)- 1 ::::: 1 + w~r~ para w 0 r P ~ 1, se puede obtener
(9.8-24)
en donde Po = 1/a0 es la resistividad de campo cero. El coeficiente de magneto"esistencia se define entonces como
(9.8-25)
De acuerdo con (9.8-24), es evidente que la magnetorresistencia longitudinal de
campo pequeño predicha por estas ecuaciones, es proporcional al cuadrado de la
inducción magnética B 0 • Desde el punto de vista físico, el efecto de la magnetorresistencia se debe al hecho de que el campo magnético desvía las partículas de un
modo ascendente o descendente a lo largo del eje y, en una dirección normal a la
dirección del vector de corriente. Las trayectorias resultantes son más bien curvas
que rectas y la distancia promedio de arrastre a lo largo de la dirección del flujo de
la corriente entre colisiones, por ende, se reduce.
Si se emplea la misma aproximación en (9.8-19), el campo de Hall Ey se
convierte en
(9.8-26)
En esta ecuacwn, el campo Ex se puede expresar con exactitud aceptable
como lx/a0 , y el término magnetorresistente de (9.8-24) es pequeño en comparación
con el término de campo cero para w 0 r P ~ l. Al substituir este valor junto con las
expresiones para a 0 y w 0 en (9.8-26), se obtiene
E,= RB0 lx
(9.8-27)
312 Semiconductores electrónicos uniformes en equilibrio
en donde [recordando (9.8-14)] el coeficiente de Hall R está dado por
1 t2
1 (v 2 )(v2 t 2 )
R=----P-=-P
2
Poec (ip)
p 0 ec (v 2 tp) 2 •
(9.8-28)
El coeficiente de Hall lo modifica el factor (~)/(7p) 2 en relación con el valor
dado por la teoría del capítulo 7. También es evidente que el valor dado por
(9.8-27) es un valor de campo pequeño que sólo es bueno en tanto que w 0 r P <a¡; 1; si
w 0 r P iguala o excede a la unidad, el término de magnetorresistencia de (9 .8-241
sería de magnitud comparable al término de campo cero y ya no se podría reemplazar Ex por lx/a 0 en (9.8-26). Ex tendría que expresarse como lx/a, en donde o
tiene una fuerte dependencia en función del campo magnético. El coeficiente de Hall
entonces presentaría una marcada dependencia en relación al campo magnético. La
extensión de estos análisis al caso en que w 0 r ya no sea pequeño en comparación
con la unidad, implica muchos cálculos numéricos que no se efectuarán aquí. En el
análisis anterior se supuso que los portadores de carga eran huecos. El resultado para
un espécimen tipo n, en donde los portadores de carga son electrones, se puede
obtener substituyendo en todos los puntos e por -e. Se debe hacer notar que
cuando esto se hace, la frecuencia característica (9.8-7) se convierte en - eB 0 /m~c.
y por tanto, también se debe substituir w 0 por - w 0 . De esta manera se puede
asegurar que cuando los portadores son electrones, se cambia el signo de coeficiente
de Hall; pero la forma de los coeficientes de conductividad y magnetorresistencia
queda igual.
Si el proceso de dispersión dominante es la dispersión de red de modo acústico, de acuerdo con los resultados de la sección 7.5, la trayectoria libre media será
básicamente independiente de la velocidad, por lo que Tp(v) = "A.p/v. De donde, es
evidente que (v 2 r ~> = ('A.~) = A.~; también, de acuerdo con (7 .3-12) y (7 .3-18), se
observa que (v 2 ) = 3kTfm y (v-zr p> = A.p<v> = A.pC, en donde e esta dada por (5.4-20).
Si se substituyen estos valores en (9.8-28), se obtiene r~/(7p) 2 = 3rr/8, y el coeficiente de Hall se convierte en
3n 1
R=-8 p0 ec
3n
1
8 n0 ec
=----
(tipo-p)
(tipo-n ).
(9.8-29)
El coeficiente de magnetorresistencia no se puede expresar en forma tan simple, porque diverge la integral requerida para evaluar T~ y es necesario un planteamiento más exacto. Esta divergencia se puede evitar señalando que para la dispersión de red, r se hace muy grande a velocidades bajas, en tanto que para la dispersión
por impurezas sucede exactamente lo contrario. Entonces, lo que sucede es que por
debajo de cierta velocidad, la dispersión de impurezas y no la de red es la que se
convierte en el factor dominante y para estas velocidades (a las que se encuentra la
divergencia), los promedios se deben calcular basándose en la relación tiempo de
relajación, en función de la velocidad asociada, con la dispersión de impurezas en
lugar de la que se asocia con la dispersión de red. Por tanto, se podría esperar que
la magnetorresistencia se vea afectada enormemente por pequeñas contribuciones de
la dispersión de impurezas. En efecto, este es el caso. También puede esperarse que,
sobre estas bases, el análisis que da el coeficiente de Hall suponiendo solamente la
dispersión de red, sea inválido en la región en donde r P está limitado por la dispersión de impurezas como en realidad sucede. En este caso no existe una divergencia
El efecto de Hall y la magnetorresistencio
313
en los promedios relacionados con este rango de velocidad. A menos que la densidad
de impurezas sea alta o la temperatura muy baja, la fracción de portadores dentro
del rango de velocidades bajas es muy pequeña y el resultado (9.8-29) no se afectará
mucho.
Ahora se verá un cristal semiconductor que no es fuertemente extrínseco, pero
que contiene electrones libres y huecos en concentraciones importantes. En este
caso, los huecos y los electrones, se pueden considerar por separado, utilizando
exactamente los mismos métodos que se emplearon antes para derivar las ecuaciones
(9.8-16) y (9.8-7). Entonces, las componentes de velocidad de los huecos y los
electrones se expresan como ecuaciones que tienen la forma de (9.8-16) y (9.8-17),
siendo las componentes de velocidad vpx y Vpy de los huecos idénticas a estas
ecuaciones, en tanto que las componentes de velocidad de los electrones Vnx y Vny
están dadas por ecuaciones en las que e se substituye por medio de -e, m; por
m~, r P por r n (en donde el último símbolo se relaciona con el tiempo de relajacwn para los electrones que están dentro de la banda de conducción) y eB 0 /m;c
por - eB 0 /m~c. Si también se supone que w 0 r <;¡; 1 tanto para huecos como para
electrones, de tal manera que el término w~r 2 pueda desecharse en los denominadores de los promedios, las componentes de la corriente se pueden expresar como
sigue
(9.8-30)
y
en donde
eB0
Won =-.-
y
m"C
eB0
m,c
Wop = -.-.
(9.8-32)
Si se usa (9.7-7) para eliminar las masas efectivas, y se reacomodan los términos, las ecuaciones anteriores pueden aparecer enJa forma
1" = noeJ.LnEE"- EyW0 n('r;/'rn)- E.xro:n(t!/tn)J
+ p0 e¡.t,[E.x + Eyw ,(r;¡:c")- E.xw:,(r!tt,)],
0
(9.8-33)
y
(9.8-34)
Dado que el voltaje de Hall se mide en condiciones de circuito abierto, ly = O,
como antes, de donde, (9.8-34) se reduce a
t2
p
t2
n
PoJ.L,Wop ::- - noJlnWon ::-
E =
y
r,
noJln + Pollp
t". E
"
(9.8-35)
314
Semiconductores electrónicos uniformes en equilibrio
Al substituir esta expresión de nuevo en (9.8-33), después de algunas operaciones algebraicas se obtiene
en donde a0 , como siempre, está dado por (9.7-8). El término de la magnetorresistencia es ahora mucho más complejo; pero sin embargo, es pequeño en comparación
con el valor de campo cero a condición de que Won T n .~ 1 y Wop T p <{ l. El campo
de Hall está dado por (9.8-35) y el coeficiente de Hall de campo pequeño se puede
obtener reeemplazando Ex por fx/a 0 , como se hizo antes, y en donde la diferencia
entre a y a 0 según se representa mediante el término de magnetorresistencia, es
despreciable en estas condiciones. Al expresar Won y w 0 p mediante (9.8-32) y
eliminando las masas efectivas en favor de las movilidades y los tiempos de relajación por (9.7-7), se obtiene
(9.8-37)
en donde, como siempre, b = llnlllp·
Esta expresión da el coeficiente de Hall en un semiconductor no extrínseco. Se
ve que se reduce a (9.8-29) cuando Po ~ n 0 o n 0 ~Po. Si el proceso de dispersión
dominante para huecos y electrones es la dispersión de fonones de modo acústico, 4
T'!/(7n) 2 = ~/(7p) 2 = 3rr/8 como se demostró anteriormente y, en este caso,
(9.8-37) da
(9.8-38)
Para un semiconductor intrínseco, Po = n 0 = n¡ y (9.8-38) se reduce a
3n 1 1 - b
R=---8 n¡ec 1 + b
(Intrínseco).
(9.8-39)
Para p 0 ~ n 0 , el coeficiente de Hall según lo da (9.8-37), es positivo y para
n 0 ~ p 0 es negativo. Se requiere una inversión del signo del coeficiente de Hall para
valores de p 0 y n 0 para que se desvanezca el numerador de (9.8-37). Si se satisfacen
las condiciones en las que (9.8-38) es válida, esta inversión del signo del campo de
Hall se produce cuando Po = b 2 n0 • Puesto que n 0 p 0 = n[, esto representa, sencillamente, Po = bn¡ o bien, n 0 = n¡/b. Si b 1, el punto de inversión no coincidirá exactamente con el punto intrínseco. Por ejemplo, para b > 1, se tendrá un rango de
concentración de portadores dentro del cual el signo del coeficiente de Hall es
negativo a pesar del hecho de que la muestra sea tipo p.
*
4 A pesar de que la fórmula (9.8-38) se usa con mucha frecuencia para analizar mediciones
de Hall en materiales no extrínsecos, estas condiciones no siempre quedan estrictamente satisfechas, sobre todo debido a la presencia de una dispersión de fonones de modo óptico.
El efecto de Hall y la magnetorresistencia
315
Además de cualquier interés fundamental que pueda despertar, el efecto de
Hall es importante debido a que permite un método práctico para saber si una
muestra es tipo n o tipo p y para determinar la concentración de los portadores.
Cuando se combina con mediciones de la conductividad, el efecto de Hall puede
usarse también para determinar la movilidad de los portadores de carga. En muestras
que son sumamente extrínsecas y en las que el mecanismo de dispersión predominante es la dispersión con fonones de modo acústico, de (9.8-29) es claro que la
medición de R se puede emplear directamente para obtener n 0 o p 0 y el tipo de
conductividad se obtiene del signo de R. Si hay otros mecanismos importantes de
dispersión, entonces, por supuesto, para obtener una medición absoluta de la concentración de portadores, se debe conocer la cantidad ? /(7) 2 asociada con el mecanismo dominante de dispersión y, para poder evaluarla, es necesario saber la forma
en que r varía como función de la velocidad. No obstante, el factor ?/(7) 2 no es
mucho mayor ni mucho menor que la unidad para cualquier proceso de dispersión
conocido que se produzca en la práctica, de tal modo que la medición de la concentración de portadores que sea exacta dentro de aproximadamente un factor de dos,
se puede obtener siempre, cualesquiera que sean los mecanismo de dispersión y, CO!l
frecuencia esto es todo lo que se requiere.
La movilidad de los portadores de carga en muestras extrínsecas se obtiene
eliminando la concentración de portadores entre la expresión (9.8-28) y la ecuación
a 0 =PoeJlp que se deriva de (9.7-8) cuando se hace caso omiso de la concentración
de los portadores minoritarios (en este ejemplo, los electrones). Para un semiconductor tipo p, el resultado es
(9.8-40)
Para un semiconductor extrínseco tipo n, se puede demostrar también que
(9.8-41)
El producto ± cRa 0 a menudo se define como la Movilidad de Hall, de donde,
ILHn = -cRao
(tipo-n)
cRa 0
(tipo-p).
ILHp =
(9.8-42)
Las ecuaciones (9.8-40) y (9.8-41) se pueden escribir, entonces como sigue
llp = ILHp((ip) 2 /~)
(9.8-43)
y
(9.8-44)
Las cantidades llp y Jln son las verdaderas movilidades de arrastre o movilidades de conductividad; por otra parte, la movilidad de Hall es simplemente una
cantidad con las dimensiones de la movilidad que se obtiene a partir de cantidades
que son muy fáciles de medir en la práctica. Se debe conocer el factor (7)2 /r 2 para
convertir la movilidad de Hall en la de arrastre real. Sin embargo, puesto que este
factor rara vez se aleja mucho de la unidad, la movilidad de Hall da una indicación
316
Semiconductores electrónicos uniformes en equilibrio
aproximada de la verdadera movilidad donde el error producido en la mayoría de los
casos se origina en el propio experimento. Las mediciones experimentales de la
concentración de portadores y la movilidad de Hall de electrones para muestras de
germanio tipo n, en función de la temperatura, se ilustra en la figura 9.11 para una
gran variedad de concentraciones de impurezas donadoras.
En el caso de muestras no extrínsecas, se procede más o menos en la mi~
forma. A partir de (9.8-37) o (9.8-38), se puede eliminar n 0 o Po por medio de la
relación de acción de las masas n 0 p 0 = n~.
La ecuación resultante que expresa a n0
1
o p 0 en función de R es de cuarto grado y no se puede resolver analíticamente de
un modo sencillo, sino que se debe resolver en cada caso por métodos aproximados
o numéricos. Además, existe una ambigüedad en el hecho de que se tienen dos
raíces reales en lugar de una. Esto se observa en la figura 9.14, en donde el coeficiente de Hall se ha graficado en función de p 0 ; para un valor dado de R existen
siempre dos valores posibles de Po. No obstante, en la práctica es bastante sencillo
seleccionar cuál de las raíces es la correcta haciendo una serie de mediciones del
R
OOin;
-Po
(escala logarítmica)
Figura 9.14.
Coeficiente de Hall de un cristal semiconductor en función de la concentración de
huecos.
efecto de Hall sobre una gran variedad de temperaturas. Además, para obtener las
concentraciones de portadores mediante el procedimiento anterior, es necesario conocer la relación de movilidades b. Esto se puede obtener haciendo mediciones
independientes de la movilidad de Hall en muestras sumamente extrínsecas tipo n y
tipo p o bien, a partir de los resultados de las mediciones de arrastre de portadores
en exceso que se verá más tarde. Si n 0 y p 0 se obtienen del coeficiente de Hall, y
si se conoce la relación llnfllo = b, la movilidades Jln y Jlp se pueden determinar
basándose en los datos de conductividad, según la expresión (9.7-8).
9.9
RESONANCIA DE CICLOTRON Y SUPERFICIES
ELIPSOIDALES DE ENERGIA
Se puede hacer que los electrones y los huecos de los semiconductores exhiban
una resonancia en presencia de un campo magnético fuerte y constante (que se
supondrá sobre el eje z) y una pequeña radiofrecuencia osciladora transversal o
Resonancia de ciclotrón y superficies elipsoidales de energía
317
campo electromagnético de microondas cuyo vector eléctrico queda en el plano xy.
Las órbitas resultantes de los huecos o los electrones son circulares en la resonancia
y la energía se absorbe del campo de radiofrecuencia cada medio ciclo, como en un
ciclotrón. En efecto, la situación es precisamente análoga a lo que sucede con partículas nucleares cargadas dentro de un ciclotrón y, por esta razón, el fenómeno se
denomina resonancia de ciclotrón.
Primeramente se investigará el caso de las superficies esféricas de energía y una
sola masa efectiva escalar. La fuerza de Lorentz sobre un hueco (y se estudiarán los
huecos de una muestra tipo p en este cálculo en particular), está dada por {9.8-4).
Si la masa efectiva
es independiente de la dirección y si se supone que el vector
eléctrico del campo oscilante, cuya frecuencia es w, vibra a lo largo de la dirección
x, entonces,
m;
(9.9-1)
mientras que
Bx = B, =O,
(9.9-2)
y las componentes de la fuerza de Lorentz dan, para las ecuaciones de movimiento,
(9.9-3)
(9.9-4)
(9.9-5)
Al escribir estas ecuaciones se supuso que el vector magnético del campo de
radiofrecuencias es despreciable en comparación con el campo constan te 8 0 • La
ecuación de la componente z {9.9-5) se limita a indicar que la partícula se desplaza
a velocidad constante sobre la dirección z; esto carece de interés especial y no será
necesario hablar más al respecto. Las ecuaciones de la componente x y y se pueden
escribir como sigue
d 2x
dy eE0 1...,
-=c.o
-+-e
0
2
dt
dt
m*
,
(9.9-6)
(9.9-7)
en donde w 0 es la misma frecuencia que define (9.8-7) en conexión con el efecto
de Hall.
Si se suponen soluciones oscilatorias de la forma x =x 0 &wt y y =y 0 eiwt
estas ecuaciones se reducen a
(9.9-8)
318 Semiconductores electrónicos uniformes en equilibrio
y
(9.9-9)
que se pueden resolver para las amplitudes x 0 y Yo para dar
Xo =
eE0 /m;
2
Wo -
w
2
iw 0
iw 0 eE 0 / m;
Xo = ( 2
w
w Wo - w 2)'
Yo = -
(9.9-10)
(9.9-11)
Cuando w = w 0 = eB 0 /m;c, se produce la resonancia y las amplitudes se hacen
muy grandes. La frecuencia de resonancia w 0 se denomina a menudo frecuencia de
ciclotrón. Evidentemente, si w 0 se mide de un modo experimental y si la inducción
magnética B 0 se conoce con precisión, se puede determinar la masa efectiva
En
la práctica, el efecto de la resonancia de ciclotrón constituye uno de los mejores
métodos para medir las masas efectivas. De acuerdo con (9. 9-l O) y (9 .9-ll ), se
observa que conforme w -+ w 0
m;.
(9.9-12)
de donde,
(9.9-13)
(9.9-14)
Entonces, en la resonancia, x(t) y y(t) son vibraciones armomcas ortogonales
con la misma amplitud y con una diferencia de fase de 90°. Se puede ver con
facilidad que la trayectoria de la partícula resultante, que representa la órbita del
hueco, es circular.
En la práctica, la resonancia se observa normalmente midiendo el factor Q de
una cavidad resonante de microonda mientras se hace variar el campo magnético B 0
(y, por ende, la frecuencia w 0 ). Cuando w 0 es igual a la frecuencia de excitación de
microondas, se obtiene una disminución brusca en el valor de Q de la cavidad, ya
que en la resonancia se absorbe una gran cantidad de la energía del campo electromagnético cuando los portadores se excitan a amplitudes grandes de resonancia y
luego se dispersan por acción de las impurezas o por las vibraciones de red. Conviene observar que en este experimento se desea que la cantidad w 0 T sea mucho
mayor que la unidad, de manera que los portadores puedan excitarse a través de
varias órbitas completas antes de dispersarse. En estas condiciones son capaces de
absorber una gran cantidad de energía de las microondas y cuando se produce la
dispersión, transformarla en vibraciones de la red cristalina. Por lo general, el experimento se lleva a cabo a una temperatura baja para obtener un valor grande de T, y
con un campo estático B 0 tan grande como sea posible para satisfacer el requisito
de que w 0 sea una frecuencia de microonda experimentalmente accesible. Por otro
lado, en el caso de las mediciones del efecto de Hall, el objetivo a menudo es lograr
que w 0 T sea mucho menor que la unidad para simplificar la interpretación de los
datos.
Cuando el efecto de resonancia de ciclotrón en el silicio y el germanio se
estudió de una manera experimental, se descubrió que para ambas substancias existen
Resonancia de ciclotrón y superficies elipsoidales de energía
319
más de dos resonancias (una para los electrones y otra para los huecos), como lo
predijo la teoría sencilla que se estudió anteriormente. 5 •6 Más aún, se observó que
algunas de las frecuencias resonantes del ciclotrón sufrían cambios notables cuando
se alteraba la orientación del cristal con respecto al campo magnético estático, en
tanto que otras eran prácticamente independientes de la orientación de la muestra.
Estos efectos se explicaron finalmente utilizando un modelo en el que las superficies
de energía constante de los electrones, dentro del espacio k, eran elipsoidales más
que esféricas, y en donde se consideró la presencia de tres bandas de valencia
independientes, dos de las cuales se degeneraban a k = O. Las superficies de energía
constante para huecos de estas bandas de valencia son más o menos esféricas, aunque, puesto que a2 e/ak 2 difiere para distintas bandas de valencia, existe más de una
masa efectiva posible para los huecos. Las diferentes características de este modelo se
han comprobado no sólo mediante la concordancia que tiene con los datos experimentales que se han obtenido, sino también por medio de cálculos de mecánica cuántica
de la estructura de bandas de energía que se inician más o menos a partir de los
principios. 7 • 8 • 9
En primer lugar se estudiará la cuestión de las superficies elipsoidales de energía y se investigará la forma en que los resultados del experimento de resonancia de
ciclotrón se modifican cuando las superficies de energía tienen esta forma. Hasta
ahora se ha supuesto siempre que el punto de energía mínima en la zona reducida
de Brillouin ocurre a k= O, en el centro de la zona, como se ilustra en la figura 8.6. En este caso, un electrón que se encuentra cerca de la energía mínima
presenta el comportamiento dinámico de un electrón libre, conduciendo a una superficie de energía constante que, dentro de esta región del espacio k, es más o menos
esférica, como se ilustra en la figura 8.ll(a).
Sin embargo, se encontró que el valor mínimo de energía dentro de la zona
reducida necesariamente no debía encontrarse en k= O, sino que podía localizarse en
cualquier otro punto dentro de la zona. En efecto, esta es la situación que se
observó en el caso de los electrones dentro de la banda de conducción del germanio
y el silicio. Puesto que la red de diamante, en realidad es dos redes cúbicas centradas en la cara que tienen una interpenetración y que están separadas a lo largo de
la diagonal del cubo por una distancia a ..j3/4 (en donde a es el lado del cubo), la
célula unitaria primitiva para esta red es la misma que la que se muestra en la
figura 1.5, excepto que existe un segundo átomo dentro de la célula. La red recíproca, por ende es la misma de la estructura cúbica centrada en la cara y, por
tanto, la zona de Brillouin tiene la misma forma que la zona cúbica centrada en el
cuerpo que aparece en la figura 8.14(c). En la figura 9.15(a) se ilustra una gráfica
de e en función de k en la dirección (1 00) en esta zona de Brillouin para los
electrones de la banda de conducción del silicio. El valor más pequeño de e se
alcanza a un valor de k que es aproximadamente 0.8(27T/a). Este es el valor mínimo
absoluto de e dentro de la zona de Brillouin. se pueden tener otras curvas de e en
función de k para otras direcciones, que presenten otros valores mínimos de e; pero
ninguno será tan bajo como el valor ee de la figura. Para energías mayores que ee,
se pueden construir superficies de energía constante alrededor del punto de energía
mínima. Es obvio que la curva de energía en función de la cantidad de movimiento
del cristal de la figura 9.15(a) es aproximadamente parabólica alrededor del punto
mínimo, correspondiendo al comportamiento del electrón libre con una masa efectiva
5 G. Dresselhaus, A. F. Kip y C. Kittel, Phys. Rev. 92, 827 (1953).
6 R. N. Dexter, H. J. Zeiger y B. Lax,Phys. Rev. 104, 637 (1956).
7 F. Herman, Phys. Rev., 93, 1214 (1954); Proc. lnst. Radio Engrs. 43,
8 D. P. Jenkins, Physica, 20, 967 (1954).
9 E. M. Conwell, Proc. Inst. Radio Engrs., 46, 1281 (1958).
1703 (1955).
320 Semiconductores electrónicos uniformes en equilibrio
••
-;0=-t---------;,---+(a) Silicio
Figwa 9.15.
*·
*··
-;o::;t-----------+-k{111)
(b) Germanio
Zona
de frontera
La relación de € en función de k para (a) la banda de conducción del silicio
graficada a lo largo de la dirección k, (b) la banda de conducción del germanio
graficada en la dirección (111) dentro del espacio k.
apropiada que se denominará mjj. Si se graficara la curva de e en función de k a lo
largo de una dirección que pase por el punto mínimo, pero perpendicular al eje kx
(por ejemplo, una línea paralela al eje ky). también se podría obtener una curva que
sería parabólica alrededor del punto mínimo; pero en este caso no se obtiene el
aspecto de simetría del cristal que requeriría que la curvatura en esta dirección
fuera la misma que se tiene a lo largo de la dirección kx. (Esta situación se ilustra
en -la figura 9.16.) Como resultado, la masa efectiva relacionada con los cambios en
la componente de h cantidad de movimiento en esta dirección tiene un valor que
Como se verá
difiere del que se dio con anterioridad y que se designará como
en breve, esto hace que los requisitos de la simetría del cristal establezcan que la
masa efectiva tenga el mismo valor
para cualquier dirección dentro del espacio k,
normal a la dirección kx en este ejemplo.
La energía que sobrepasa el valor de Ec representa la energía cinética de un
electrón libre dentro de la banda de conducción, de donde,
mi.
mi
(9.9-15)
c{k)
- Graficada hacia la dirección *•
- - Graficada hacia la dirección k, o kz
1
1
-4---------------r-----1--k
Figura 9.16.
La relación de E en función de k para la b.anda de conducción del silicio graficada
en la dirección k" (curva continua) y a lo largo de una línea normal al eje kx
que pasa por el punto kmín (curva punteada). Las diferentes curvaturas en el
punto mínimo reflejan la anisotropía de la masa efectiva.
Resonancia de ciclotrón y superficies elipsoidales de energía
321
en donde Pxo = hkxo representa el valor de Px en la base de la banda, como se
ilustra en la figura 9.15(a). De acuerdo con esto, la superficie de energía constante
de un electrón cuya energía e es ligeramente mayor que Ec, es un elipsoide de
revolución cuyo centro se localiza en kx = kxo, ky = kz =O. No obstante, puesto
que las seis direcciones (100) de una red cúbica son cristalográficamente equivalentes, la curva de e en función de k en cualquiera de estas seis direcciones debe ser la
misma. Entonces, deben tenerse seis mínimos de energía equivalentes a lo largo de
las seis direcciones (1 OQ)· y con cada uno de estos mínimos debe asociarse una
familia de superficies elipsoidales de energía constante similares a las que se describen en (9.9-15). En la figura 9.17(a) se da una representación de esta situación.
Esto pone en claro por qué los elipsoides deben ser de revolución; como se vio en
el capítulo anterior, la superficies de energías constantes deben tener todas las propiedades de simetría de la zona de Brillouin que, a su vez, conserva todas las
propiedades de simetría de un cristal cúbico. Si los elipsoides no son de revolución,
la familia de superficies de energía constante ya no sería invariable en todas las
operaciones para las que un cristal cúbico permanece invariable.
(a) Silicio
Figura 9.17.
(b) G~rmanio
Superficies elipsoidales de energía constante dentro del espacio k para (a) el silicio
y (b) el germanio. En el primero, los ejes principales de la elipsoide siguen las
direcciones {100} mientras que en el segundo, puesto que el mínimo de energía
se localiza en la frontera de zona, las superficies de energía constante forman
ocho medias elipsoides cuyos ejes principales quedan sobre las direcciones {111}.
La situación para los electrones de la banda de conducción del germanio es
algo similar, excepto que se tiene un conjunto de ocho puntos equivalentes de
energía mínima que quedan en las direcciones (111) dentro del espacio k en la
intersección de tales direcciones con la superficie de la zona de Brillouin. Por tanto,
estos mínimos quedan en centros de las caras hexagonales de la zona de Brillouin.
Las superficies de energía constante tienen nuevamente la forma elipsoidal; pero,
puesto que los mínimos de energía están en la frontera de la zona y, dado que
existe una región de energía prohibida bastante amplia que debe vencerse antes de
que los electrones puedan excitarse para salir de la zona de Brillouin en estas
direcciones, existen ocho mitades de elipsoides que se extiende hacia el interior de la
zona de Brillouin en las direcciones ( 111), como se muestra en la figura 9 .l 7(b ).
Esto puede considerarse, para muchos fines, como equivalentes a cuatro elipsoides
completos. En ambos casos se tiene un tensor de masa efectiva asociado con cada
322 Semiconductores electrónicos uniformes en equilibrio
elipsoide cuyos elementos describe la expresión (8.8-7). Al calcular las propiedades
de transporte y otras características físicas de los cristales en los que las superficies
de energía son elipsoidales, por lo general se determina el efecto debido a una
elipsoide (que es casi siempre anisotrópico) y luego se suma sobre todas las elipsoides. Se ha encontrado que las propiedades de transporte en cristales cúbicos son
isotrópicas después de efectuar la suma, a pesar del hecho de que las anisotropías se
asocian con elipsoidales individuales. Tanto en el germanio, como en el silicio, el
efecto lortgitudinal de la masa
es mucho mayor que la masa transversal
de
donde, los elipsoides son muy largos y delgados. Los valores reales, tal como se
determinan mediante los experimentos de resonancia de ciclotrón, 5 son los que aparecen en la tabla 9.2.
mW
m!,
TABLA 9.2.
Masas efectivas de electrones en el germanio
y el silicio
"relación de
masas"
mW/m!
m!
Germanio
Silicio
20.0
0.0819 mo
0.19 mo
1.64 mo
0.98 mo
5.2
A continuación se investigará el efecto de resonancia de ciclotrón en materiales
en los que las superficies de energía son elipsoidales. Para principiar, se calculará la
frecuencia de resonancia asociada con un solo elipsoide que se supondrá simétrico
alrededor del eje kz y que está centrado en el punto kzo, como se indica en la
figura 9.18. La inducción magnética B0 forma un ángulo 8 con el eje principaf del
elipsoide y, para mayor facilidad, se supondrá que el vector del campo eléctrico
oscilante tiene sólo una componente y. La selección de este sistema de coordenadas
se hace sólo con el fin de realizar estos cálculos y, cuando concluyan, se verá que la
única coordenada de importancia física es el ángulo () entre el campo y el eje
longitudinal del elipsoide.
En estas circunstancias, la ecuación de movimiento (para una partícula de carga
positiva e) se puede escribir en función del tensor (8.8-6) que representa la recíproca
de la masa efectiva como
-dv = ( - 1 ) · F = ( - 1 ) • (eE +-e v X B).
dt
m*
m*
e
(9.9-16)
La relación entre e y k para el caso de la superficie de energía elipsoidal que
se mu-:,tra en la figura 9.18, debe ser, de acuerdo con (9.9-15),
_
¡¡
_
,. 2 [k~ +k~
¡¡e-"
* +
2m.L
(k.- k. 0) 2 ]
*
2m 11
•
(9.9-17)
Las componentes del tensor (1/m*)«fl se pueden encontrar ahora de acuerdo
con (8.8-7). En este caso, a2 ejakaakfJ =O para oc"" {J, de tal manera que todos los
Resonancia de ciclotrón y superficies elipsoidales de energía
Figura 9.18.
323
Geometría vectorial usada en el cálculo de la sección 9.9.
elementos del tensor que quedan fuera de la diagonal son cero. Los elementos de la
diagonal se calculan fácilmente y el resultado es
(1/m*)xx = (1/m*)yy = 1/m!
y
(1/m*)u = 1/mjj ·
(9.9-18)
De donde, el tensor de la masa efectiva tiene la forma
1
o
mi
o
(~.) = o m1 o
o
o
(9.9-19)
1
---¡
mil
y
1
m1
o
o
Fx
Fxfm!
1
o
. F,
F,/m!
Fz
Fzfmii .
(~.). F = o
m!
o
o
1
m•u
(9.9-20)
Si se insertan las componentes de la fuerza de Lorentz para Fx, Fy y Fz, y se
igualan a lar. componentes de dvfdt, como lo requiere (9.9-16), la ecuación rlel
324 Semiconductores electrónicos uniformes en equilibrio
movimiento se puede escribir como sigue
(9.9-21)
Si se observa que Bx =bo sen8,Bz =Bo cosO, By= O,Ey =E0 eiwt,Ex =Ez= O.
estas ecuaciones se pueden expresar como
(9.9-22)
dv.fdt = - w 11 vY sen(}
en donde
y
eB 0
W¡¡
= -.-.
m c
(9.9-23)
11
Al igual que antes, se pueden suponer soluciones oscilatorias de la forma
x(t) = x 0 eiwt, y(t) = y 0 eiwt, y z(t) = z 0 eiw t, substituyendo éstas en las ecuaciones de
movimiento (9.9-22) y resolviendo para las amplitudes,
(9.9-24)
iw 11 sen (}
eE 0
Zo
= -
mi w(w
2 -
wf cos 2 ( } - wJ.wll sen 2 8) ·
Estas amplitudes se hacen muy grandes cuando
(9.9-25)
y este> ·.oncuerda con la frecuencia de resonancia de ciclotrón para el elipsoide
partirnldf que se está estudiando. La frecuencia de resonancia depende sólo del
ca•¡,po magnético, las masas efectivas y el ángulo (} comprendido entre el campo 8 0
:. el eje principal de la elipsoide. Para superficies de energía elipsoidales, es evidente
que la frecuencia de resonancia es una función fuerte de la orientación de la mues·
tra con el campo magnético. Se puede demostrar que, a la frecuencia de resonancia.
Resonancia de ciclotrón y superficies elipsoidales de energía
325
las órbitas de la partícula son elípticas, de acuerdo con (9.9-24) y que quedan en
un plano perpendicular al campo B0 . Los resultados anteriores se derivaron para
partículas positivas con carga e; pero para el caso de los electrones sólo se necesita
substituir e con -e (en cuyo caso también se debe hacer la substitución de wll por
- w 11 y w 1 por - w 1). Evi den temen te, la frecuencia de resonancia no la alteran
estas substituciones; la única diferencia es que los electrones atraviesan sus órbitas en
el sentido opuesto del que se encontró para las partículas positivas.
En el caso del silicio, si el campo B0 se orienta en la dirección z, entonces
(} = O para las dos elipsoides cuyos ejes principales se encuentran a lo largo de la
dirección kz y (} = 90° para los otros cuatro elipsoides. Entonces, de acuerdo con
(9.9-29), habrá dos picos de resonancia superpuestos en w = w1 de los dos primeros
elipsoides y cuatro resonancias superpuestas a w = ..jw1w 11 de los otros cuatro. Suponiendo que el número de electrones pertenecientes a cada elipsoide es igual, lo
cual es cierto en la condición de equilibrio, la segunda resonancia que cubre cuatro
elipsoides debe tener el doble de la fuerza de absorción de la primera, que sólo
cuenta con dos. Si el campo B0 tiene otra orientación, se pueden encontrar hasta
tres tipos de resonancia correspondientes a los tres ángulos posibles entre B0 y los
ejes de la elipsoide. Esta teoría de la resonancia de ciclotrón con las superficies de
energía elipsoidales sirven para explicar todas las resonancias observadas experimentalmente, que se ven muy afectadas por la orientación de la muestra, y permite determinar m l y m~ basándose en frecuencias de resonancia de ciclotrón determinadas de
un modo experimental, y así se pudo proponer un modelo correcto para la orientación de las elipsoides.
Los datos de resonancia de ciclotrón para huecos en las bandas de valencia del
silicio y el germanio no presentan las características típicas del efecto con superficies
de energía elipsoidales. Aunque en ambos materiales existen numerosos picos de
resonancia para los huecos, los cambios característicos de la frecuencia de resonancia
con la orientación de la muestra que se observan en las superficies elipsoidales de
energía, están ausentes o son mucho menos pronunciados. El modelo de la banda de
valencia que parece ajustarse mejor a estos (y otros) datos, es el de dos bandas
separadas que se degeneran en el máximo de energía en k = O; pero que tienen
diferentes masas efectivas. Existe también una tercera banda "de separación" con
una energía máxima (en k = O) un poco inferior a la parte superior de la banda de
valencia. En la figura 9.19 se ilustra esta situación. Están presentes simultáneamente
Figura 9.19.
Las tres distintas ramas de las bandas de valencia del silicio y el gennanio.
326
Semiconductores electrónicos uniformes en equilibrio
huecos ligeros y pesados (pertenecientes a las bandas l y h de la figura), y se puede
observar un efecto de resonancia de ciclotrón diferente para cada tipo. Puesto que
las l..Jperficies de energía asociadas con estas bandas son más o menos esféricas, la
dependencia de la orientación que tiene el efecto de resonancia de ciclotrón es
mucho menos pronunciada que la que se asocia con las superficies elipsoidales de la
banda de conducción. No obstante, las superficies de energía son aproximadamente
esféricas; están algo distorsionadas de la forma realmente esférica, incluso para valores pequeños de k. Esta "desviación" debe tomarse en cuenta para explicar todos
los detalles de los datos de resonancia de ciclotrón, sobre todo en el caso de la banda
de huecos pesados en donde la desviación de la esfericidad es más pronunciada.
La diferencia de energía entre el punto máximo de la banda "de separación" de
posición más baja y el máximo de la banda de valencia (ev- €8 en la figura 9.19).
es aproximadamente 0.28 eV en el germanio y 0.035 eV en el silicio. En el caso del
germanio, esta diferencia de energía es lo suficientemente grande para que en condiciones ordinarias, se desprecie la población de los huecos de la banda más baja.
Sin embargo, en el caso del silicio, excepto a temperaturas bajas, se encontrará un
número importante de huecos en esta banda. La separaclón de las bandas se debe a
la interacción de los espines electrónicos de los electrones de valencia con el momento magnético producido por su movimiento orbital. Si no fuera por este acoplilmiento esptn-órbita la diferencia de energía €v - e8 sería cero y las tres band~
coincidirían en el punto k= O. Las masas efectivas asociadas con las tres variedade
de huecos se dan en la tabla 9.3.
TABLA 9.3.
Masas efectivas de huecos en el germanio
y el silicio
Germanio
Silicio
0.044mo
0.16 mo
0.28 mo
0.49 mo
0.077 mo
0.245 mo
La existencia de un hueco como una especie particular, en general, está limi·
tada a un solo tiempo libre medio. Por ejemplo, un hueco se puede dispersar fácilmente de la banda l a la banda h, o viceversa, mediante cualquiera de los procesos
de dispersión con los que normalmente se asocia. Por esta razón no es posible
detectar la existencia de las variedades independientes de huecos en cualquier medi·
ción (por ejemplo, la conductividad o· el arrastre de portadores) que implica sólo el
comportamiento promedio del portador promediado sobre un gran intervalo durante
el que las identidades de los huecos dentro de las tres bandas pueden intercambiarse
con frecuencia. En el experimento de la resonancia de ciclotrón, en donde se mide
una resonancia que se excita en un tiempo corto en comparación con el tiempo
libre medio (w 0 r ;:¡¡:. 1), se puede manifestar fácilmente la presencia de algunas varie·
dades de huecos. Se puede hacer la misma observación en relación con los electrones
en los diferentes mínimos equivalentes de energía de la banda de conducción; los
procesos normales de dispersión pueden transferir electrones sin más problemas, de
una elipsoide a otra (dispersión entre valles), de tal manera que en un tiempo largo
en comparación con el de relajación, se pierde irrecuperablemente la identidad de un
electrón que indica a qué elipsoide en particular pertenece.
Densidad de estados, conductividad y efecto de Hall
9.10
327
DENSIDAD DE ESTADOS, CONDUCTIVIDAD Y EFECTO
DE HALL CON SUPERFICIES COMPLEJAS DE ENERGIA
En una situación en donde existen dos bandas parabólicas que se degeneran en
k = O, con superficies de energía esféricas que dan origen a dos especies diferentes
de portadores, las poblaciones relativas de las dos especies y los factores de densidad
de estados se pueden calcular con facilidad. Se analizará el caso de una banda de
valencia de esta naturaleza en la que se encuentran presentes simultáneamente huecos
ligeros (con una masa efectiva mt) Y huecos pesados (con una masa efectiva m~).
En estas circunstancias, el total de concentración de huecos p 0 se puede escribir
como la suma de la concentración de huecos ligeros p1 y la de huecos pesados Ph•
de donde, de acuerdo con (9.3-15) y (9.3-16),
(9.10-1)
en donde Uv 1 y Uvh son factores de la forma (9.3-16) para huecos ligeros y pesados. Esto se puede escribir en la forma
- (2nm;.kT)3/2
-c•,-•.>fkT
h2
e
'
Po- 2
(9.10-2)
como si se tratara de una sola especie de portadores, si se define la masa efectiva
equivalente de la densidad de estados m~ 9 , como
(9.10-3)
Esta es una aproximación de la situación real en la banda de valencia del
germanio y el silicio, aunque es sólo aproximada, ya que el efecto de la banda "de
separación" se hace a un lado por completo y dado que las superficies reales de
energía no son perfectamente esféricas en modo alguno. La conductividad procede
directamente de (9.10-2) utilizando (4.7-8).
Para un grupo de superficies elipsoidales de energía tales como las que se
vieron en relación con la banda de conducción del germanio o el silicio, se puede
calcular el factor de densidad de estados g(e) mediante una extensión del procedimiento desarrollado en la sección 5.2. La ecuación (9.9-17) para una de las elipsoides se puede reducir mediante la transformación
(9.10-4)
a la de una esfera dentro del espacio p'.
8 - Be=
p~2
+ p'2 + p'2
>'
2m 0
z
p'2
= 2m 0 •
(9.10-5)
328 Semiconductores electrónicos uniformes en equilibrio
El volumen del espacio p' de la capa esférica limitada por los radios p' y
p' + dp' para una sola elipsoide, ahora se puede calcular del mismo modo que se
hizo en la sección 5.2 para las superficies esféricas de energía; pero puesto que se
tiene más de una superficie elipsoidal de energía constante, el volumen total del
espacio p' correspondiente a las energías dentro del rango e a e+ de, se obtiene
multiplicando el volumen encontrado para una sola superficie por el número de
elipsoides equivalentes. Si este número es v, el volumen correspondiente dVp, dentro
del espacio rJ es
(9.10-6)
Sin embargo, de acuerdo con (9.10-4), los elementos de volumen dV =
dpxdPydPz y dVP' = dPx•dPy•dPz' están relacionados por medio de
m~/2
dVp' = ( m.~.*2 m*)1/2 dVP,
(9.10-7)
11
por lo cual, el volumen dVP del espacio p dentro del rango de energía e a e+ de.
se convierte en
dVP-- 4V¿.
'2nv(m*.l. 2 m*)
11 112 Je - ee de •
(9.10-8)
Al dividir esto entre el volumen h 3 /2 asignado a un solo estado cuántico, se
obtiene el número de estados cuánticos dentro de este rango de energías que, por
definición, es g(e)de, de donde,
8 ¡;;2 ( *2 *)1/2
( )de -_ ...; ...nv hm.~. m 11
g e
3
J-e - ee de.
(9.10-9)
Si de nuevo se define una masa efectiva equivalente de densidad de estados
m~ 9 , como
*3/2 _ (m*2m*)1/2
m ds
.l.
11
'
(9.10-10)
la ecuac10n (9.10-9) se puede escribir (excepción hecha del factor v) en la misma
forma (5.2-22) como la expresión acostumbrada de la densidad de estados para el
caso en que las superficies de energía son esféricas. Aplicando directamente los
procedimientos por los que se obtuvieron (9.3-6) y (9.3-7), es claro que se debe
obtener
(9.10-11)
siendo r,¡Js como lo indica (9.10-10).
Al calcular la conductividad de un semiconductor en el que las superficies de
energía constante son elipsoidales, primero es necesario determinar la contribución de
eurriente o conductividad para una sola elipsoide y luego sumar sobre todas las
elipsoides para determinar la conductividad total. Puesto que la masa efectiva asociada con cada elipsoide individual es una cantidad tensorial, también lo será la conductividad. En general, las ecuaciones relacionadas con la densidad de corriente y el
Densidad de estados, conductividad y efecto de Hall
329
campo eléctrico se pueden escribir como relaciones tensoriales de la forma
(9.10-12)
y
E= p· 1
(9.10-13)
en donde a es el tensor de conductividad y p es un tensor de resistividad. Evidentemente, pÜesto que de acuerdo con (9.10-12) (9.10-13),
y
e · 1 = e · ~ · E = E,
(9.10-14)
se de be tener
(9.10-15)
en donde ! es el tensor unitario cuyos elementos son {Ja. 8 . En consecuencia, el
tensor de resistividad es la inversa del tensor de conductividad, es decir,
(9.10-16)
Los elementos del tensor de cvnductividad a<il relacionados con la iésima
elipsoide de energía se pueden escribir, en analogía con (7 .3-15), como
(9.10-17)
en donde rl(i) es la densidad de portadores de carga asociados con dicha elipsoide.
Por tanto, la conductividad total se puede expresar como
(9.10-18)
y la suma se hace sobre todas las elipsoides. Si se usa (8.8-7) para expresar las
componentes tensoriales (9.1 0-17) se puede escribir como sigue
a2¡p>
ak X2
. n< 0e 2i ¡J2¡;(i)
a<•>= - 1i2
oky okx
a2e(i)
ok% okx
a2e(i)
a2e(i)
okx oky
o 2e(i)
okx okz
a2e(i)
o~k2y
a2¡;<i>
aky ak% '
o 2e(i)
okz oky
ok z2
(9.10-19)
en donde ¡;(i)(k) es la energía expresada en función de k para la iésima elipsoide.
En el caso del silicio, los principales ejes de las elipsoides yacen a lo largo de
los ejes de coordenadas del espacio k; para las dos elipsoides cuyos ejes principales
quedan sobre el eje kz, en las direcciones [001] y [001], la función ¡;(OOI)(k) está
dada por (9.9-17), lo cual conduce a las componentes de tensor (9.9-18) para el tensor
330 Semiconductores electrónicos uniformes en equilibrio
de conductividad para estas elipsoides se convierte, entonces, en
1
m!
a<OOl)
= a<oon = n<001>e2i o
o
o
o
1
o
m!
(9.10-20)
o m¡¡1
*
Las ecuaciones de las otras elipsoides se pueden escribir y los componentes de
tensor se obtienen de la misma manera. Para las dos elipsoides cuyos ejes principale1
se orientan a lo largo del eje kx,
1
CJ(lOO)
= CJ(TOO) = n(lOO)e2i
o
*m u 1
o
o
m*J.
o
o
o
(9.10-21)
1
m*J.
en tanto que, para los dos elipsoides cuyos ejes principales siguen la dirección de:
eje ky,
1
m!
CJ(OlO)
= CJfOTO) = n(010)e2i o
o
o
o
1
o
*m u 1
o
(9.10-22)
m!
Dado que las seis elipsoides tienen mínimos de energía equivalente n(loo) =
n<1oo) = n<tot) = n<ofo) = n< 001 ) = n<oo1) = n 0 /6. Cuando se efectúa la suma indicada en (9.3-14) y se aplica este hecho, se obtiene
1( 2
1)
o
o
3 m!+ m 0
1( 2
1)
o
o
3 m!+ m 0
1( 2
1)
o
o
3 m!+ m0
*m )t_
1 ( --¡
2 + 1
= n 0 e 2 i -3
m1.
(9.10-23)
11
para la conductividad total. Puesto que CJ es un múltiplo escalar del tensor unitario
!_, la conductividad total es isotrópica (a -pesar de que la conductividad asociada con
Densidad de estados, conductividad y efecto de Hall
331
una sola elipsoide no lo sea). La magnitud escalar de la conductividad se puede
representar como
(9.10-24)
en donde m~ es una masa efectiva de conductividad defmida por
l.
1( 2
1)
m: = 3 m! + m¡j ·
(9.10-25)
Se puede demostrar que se obtendría exactamente el mismo resultado para
cualquier conjunto de superficies elipsoidales de energía de que se trate, siempre y
cuando la configuración sea invariable en todas las operaciones de simetría en las
que el cristal cúbico sea inalterable. De hecho, se puede demostrar que la conductividad de todos los cristales cúbicos debe ser isotrópica sea cual fuere la forma
específica que puedan tomar las superficies de energía constante. En particular, las
ecuaciones (9.10-23) a (9.10-25), también son válidas para los electrones de conducción en el germanio, en donde las elipsoides de energía constante están orientados a
lo largo de las direcciones (111). Es muy ilustrativo desarrollar el tensor de conductividad para el germanio, y este problema queda asignado como ejercicio para el
lector.
El tensor de resistividad
es una matriz de componentes inversa a la matriz
de conductividad. Lo elementos de la matriz que es la inversa de la ~ cuyos
elementos son a,.11 están dados por la fórmula
e
_ 1
a,.p =
cof(a 11,.)
á(a) '
(9.10-26)
en donde cof (a11,.) es el cofactor 10 del elemento a11,. y A(a) es el determinante de
los coeficientes de ~· En consecuencia, es evidente que los elementos de e_ son
anayz - a:x:yarr
a""a•• - a;.
(9.10-27)
en donde
(9.10-28)
Se ve claramente que si a tiene la forma (9.10-23), el tensor de resistividad
es isotrópico y se puede represeñtar mediante una cantidad escalar cuya magnitud es,
sencillamente, el recíproco de la conductividad (9.10-24).
A continuación se ilustrará la computación del efecto de Hall en un material
con superficies elipsoidales de energía, considerando en detalle el efecto de Hall en
lO Véase, por ejemplo, L. A. Pipes, Applied Mathematics for Engineers and Physicists. Nueva York. McGraw-Hill (1946), página 71.
332 Semiconductores electrónicos uniformes en equilibrio
un material en el que los ejes principales de las elipsoides se extienden a lo largo de
los ejes kx, k y y kz (como por ejemplo, en el silicio), en el caso espec:al en el que
el campo magnético está orientado en la dirección z y la corriente fluye en la
dirección x. También se supondrá que existe sólo una especie de portadores. En
estas condiciones, los tensores inversos de la mas.a efectiva para diferentes elipsoides
tienen la forma que se señala en las ecuaciones (9.10-20, 21 y 22) y, en particular.
la ecuación tensorial de movimiento para portadores con carga e en los elipsoides
(100) y (TOO), se pueden escribir, en analogía con (9.8-4), como
o
e
eEx +- (v,B. - v.B,)
dvxfdt
1
(~.).! = o mi o
e
eE7 + - (v.Bx- vxB.)
dv7 /dt
1
e
eE. +- (vxBy- v1 Bx)
dv.fdt
1
o
mn*
o
o
e
e
mi
e
(9.10-29)
Si se hacen las multiplicaciones de matriz indicadas, se escriben las ecuaciones
de las componentes del movimiento y se observa que Bx =By =O, en tanto que
Bz = 8 0 se obtiene
dvx eEx
-=-+w 11 v7
dt
mjj
dv,
eE,
dv.
eE.
dt = mi- WJ.Vx
(9.10-30)
dt= mi'
en donde wll y w 1 son como se indica en {9.9-23).
_
_
Si la primera de estas ecuaciones se multiplica por yw1 y se suma a iywll por
la segunda, la ecuación resultante se puede expresar en la forma
dZ
. ~
(JroJ.
-d + !y ro 11 roJ.Z =e -.-Ex+--.- E,
t
m 11
mJ..
iJW"; )
(9.10-31)
en donde Z es la cantidad compleja
z = vxJwJ. + iv,Jwn.
(9.10-32)
Evidentemente, la ecuación (9.10-31) tiene exactamente la misma forma que
(9.8-8). Todos los pasos comprendidos en la solución de esta ecuación y el promedio
sobre las trayectorias y la distribución de velocidad que conducen a las ecuaciones
(9.8-16) y (9.8-17), se pueden repetir ahora principiando con (9.10-31). La justificación física de cada etapa es la misma que ya se dio. De esta manera, se puede
demostrar que
ii~too) = ii~Too> =
1
-
~ Re(Z)
yC.OJ.
(9.10-33)
Densidad de estados, conductividad y efecto de Hall
333
mientras que
1
T
-
¡;~too> = ¡;~ oo> = - = lm(Z)
Jwu
(9.10-34)
Si estos resultados se restringen al coeficiente de Hall de campo pequeño, se
puede suponer wnwlr 2 ~ 1 y dejar sin efecto los términos wnwlr 2 de los denominadores de las ecuaciones (9.10-33) y (9.10-34). Ahora se pueden obtener las densidades de corriente a partir de las velocidades, al igual que antes, de donde, para la
iésima elipsoide,
¡<i) = p<i>ev<i>
y
y
o
y '
(9.10-35)
mientras que, sumando todas las elipsoides, las componentes del total de densidad de
corriente son
1X = "L.- p(i>ev<i>
o X
y
J~i) =
i
¿ pg>ev~i)·
(9.10-36)
i
En el estado estacionario no puede haber una corriente en la dirección y, de
modo que, de acuerdo con (9.10-36), se debe tener
(9.10-37)
Como se dijo antes, las concentraciones p~> para las ~eis elipsoides son las
misma e iguales a p 0 /6. La expresió~ para vvoo) y ii~ 100 ) se dio antes en
(9.10-34). Para las elipsoides (010) y (010), se puede establecer fácilmente, usando
el tensor de masa apropiado en (9.10-29), que las ecuaciones de movimiento para las
componentes x y y de la velocidad son las mismas que las que se dan en (9.10-30),
excepto que ~e intercambian mjj y m! y wu y w1 . Entonces, la expresión para
¡¡~o1o) y ¡;~0 1 0) es (9.10-34) intercambiando estas cantidades. En el caso de las
elipsoides (001) y (OOI), es obvio, siguiendo el mismo razonamiento, que las ecuaciones de movimiento de las componentes x y y de la velocidad son las mismas que
las de (9.1 0-30), excepto que mjj y w 11 no aparecen en absoluto y que, en todo_§ los
casos, se substituyen por mi y w 1 . De donde, la expresión de ¡;}0° 1 ) y P}001 ) se
obtiene a partir de (9.10-34), substituyendo mjj y wu por mi y w1. Después de
hacer todas estas substituciones, efectuar la suma indicada en (9.10-37) y resolver
para Ey en función de Ex. se obtiene
_ eB 0 ( ' 2 )
E,- 7
i
2mt f m1
•2
"'( 2
1 ) Ex.
(9.10-38)
m1. m 11 ---¡ +---¡
m1. m 11
Desechando los efectos de la magnetorresistencia, que no son importantes para
fuerzas reducidas de campo magnético, Ex se puede expresar en términos de lx de
acuerdo con (9.10-24) como sigue
Ex= lx/t1o =
31 x
.
( 2 +---¡
1)
Poe2 i---¡
m1.
m 11
(9.10-39)
334 Semiconductores electrónicos uniformes en equilibrio
Al substituir esto en (9.10-38), se puede escribir finalmente
(9.10-40)
siendo
3(2m! + mjj)
_ _1_ -r 2
R-
p0 ec (i)
2
*2 • ( 2
1)
m.~. m -;¡;+11
m.~.
2·
(9.10-41)
ut
Esto se escribe a menudo de una manera. algo diferente; si K se defme como
la relación de la masa longitudinal a la transversal, según lo cual,
(9.10-42)
entonces, (9.10-41) se puede expresar como
1 T 2 3K(K + 2)
R = -p0-ec -(i-)2 ~(2:-K.:......._+-:-1)=2 •
(9.10-43)
Aunque se supusieron direcciones particularmente simples para la corriente de
la muestra y el campo magnético, si se hubiera procurado obtener el resultado para
una dirección arbitraria de flujo de corriente u orientación de campo, se habría
descubierto que el coeficiente de Hall de campo pequeño {9.10-41) ó (9.10-42) es
independiente de la orientación de la corriente y la dirección de campo con respecto
a las elipsoides de energía. Por tanto, se puede demostrar que el coeficiente de Hall
de campo pequeño es isotrópico, aunque esto no es correcto si el campo magnético
es tan grande que w uw 1T 2 ya no sea pequeño en comparación con la unidad. Los
resultados anteriores se obtuvieron también para un conjunto particularmente sencillo de
elipsoides de energía; pero se puede demostrar que se aplican a cualquier grupo de super·
ficies elipsoidales de energía, siempre que dicho grupo tenga una simetría cúbica. Por
supuesto, estos resultados se desarrollaron para portadores con una carga +e. Para
semiconductores tipo n (y Si y Ge tipo n son los ejemplos más comunes de substancias con superficies elipsoidales de energía), se debe substituir e por medio de -e y
p 0 con n 0 en (9.10-41) y (9.10-43). Si la ecuación (9.10-43) se multiplica por a0
y si la cantidad Ra0 se defme, al igual que antes, como la "movilidad de Hall"
Jl.H, es obvio que la relación de la movilidad de Hall a la movilidad de arrastre real
J1. está dada por
JlH
T2
3K(K + 2)
¡; = (t)2 (2K + 1)2
(9.10-44)
para un semiconductor con superficies de energía constante elipsoidales.
El presentar una exposición completa de los efectos galvanométricos y la magnetorresistencia para semiconductores con superficies elipsoidales de energía es algo
que están más allá del alcance de esta obra y, por ende, se omitirá. Sin embargo, se
debe hacer notar especialmente que la magnetorresistencia no es isotrópica en estas
condiciones y que las mediciones de ésta, en func\ón de la orientación de la muestra
y la dirección del campo magnético pueden constituir una fuente abundante de
datos experimentales con los que se puede comprobar en detalle cualquier modelo
propuesto de superficies de energía.
Mecanismos de dispersión y movilidad de los portadores de carga
9.11
335
MECANISMOS DE DISPERSION Y MOVILIDAD
DE LOS PORTADORES DE CARGA
En los semiconductores, al igual que en los metales, los procesos de dispersión
más importantes incluyen las interacciones de los electrones (o huecos) con las
vibraciones de red y con átomos de impureza. En cristales relativamente puros o a
temperaturas más o menos altas, la primera interacción es casi siempre predominante
en tanto que a temperaturas bajas o en especímenes impuros, la segunda parece ser
más importante. Existe un amplio rango de posiciones intermedias en las que ambos
procesos son significativos.
El efecto de cualquier interacción de dispersión, particular i, se puede evaluar
calculando el tiempo libre medio T ¡ asociado con este proceso. Entonces, el tiempo
libre T se puede expresar mediante
1
1
-=¿-r
i
(9.11-1)
'r¡
como se indicó en la secc10n 7.5. Esto pone en claro que el proceso de dispersión
que conduce al tiempo libre más corto T¡, es el dominante. Una vez que se conoce
el tiempo libre medio T, la movilidad se puede expresar fácilmente como e1' /m*.
Desafortunadamente el cálculo del tiempo libre asociado con cualquiera de los
procesos de dispersión que tienen cierta importancia en los semiconductores, es muy
prolongado y elaborado, y los detalles matemáticos que comprende están por encima
del nivel que se ha fijado para este estudio. Por tanto, será necesario limitar este
análisis a un planteamiento cualitativo más o menos aproximado de la dispersión de
red, aunque se tratará de dar un método más o menos completo de la dispersión de impurezas siguiendo el lineamiento que desarrollaron Conwell y Weisskopf. 11
A temperaturas bajas, es muy limitada la energía térmica disponible para excitar vibraciones de red de modo óptico, y el proceso de dispersión de la red, más
importante, es la dispersión de portadores de carga mediante vibraciones de la red de
modo acústico. Sólo se tendrá en cuenta la dispersión de portadores mediante vibraciones de tipo longitudinal; la razón por la que se desecha el efecto de los modos
transversales quedará demostrado en el curso de este estudio.
El paso de una vibración longitudinal a través de un cristal da origen a regiones alternas de compresión y expansión de dicha red cristalina. Cuando el cristal se
comprime, las posiciones de las bandas de energía se alteran de tal manera que la
anchura de la banda prohibida se reduce (véase la figura 9.2); en la condición de
expansión, la anchura de la banda prohibida se incrementa . .&te efecto produce una
variación local en la energía asociada con el borde de la banda de conducción, como
se indica en la figura 9.20(a), que, para simplificar el cálculo, se puede substituir
con la variación escalonada que aparece en la figura 9.20(b) sin introducir un error
importante. Existe una variación similar en energía del borde de la banda de valencia. Por tanto, se puede calcular la probabilidad de reflexión para un electrón incidente sobre un solo "escalón" de la figura 9.20(b).
Para hacer esto, el electrón incidente sobre un escalón de esta naturaleza, con
una altura liec se representa mediante una función de onda de partícula libre con
una cantidad de movimiento positiva de la forma
(9.11-2)
11 E. Conwell y
V. F. Weisskopf, Phys, Rev., 71, 388 (1950).
336
Semiconductores electrónicos uniformes en equilibrio
-----
<e
-x
••
s.c
(a)
1
<c_jr---------,__________J~:-----~--------1
1
¡---T-x
Ev-,L_________~---------¡________
Figura 9.20.
(b)
_r--------,L . . , _
La variación sinusoidal de las energías de l¡¡ banda de conducción y la de valenca
en un cristal semiconductor, producida por fuerzas de compresión y t.xpansióc
asociadas con una vibración térmica longitudinal. (b) Una variación "de onch
cuadrada" que se aproxima a la ilustrada en (a) y que simplifica el cálculo de!
tiempo de relajación.
Como se ilustra en la figura 9.21, el electrón se puede "reflejar" o transmitir
en el escalón. De aquí que pueda haber una componente de la función de onda
asociada con una cantidad de movimiento negativa en la región (x < 0), representando al electrón reflejado que debe tener la forma
(9.11-3)
En la regwn que queda más allá de la barrera (x >O), la función de onda que
representa a un electrón transmitido sobre dicha barrera es
(9.11-4)
Todas éstas son funciones de onda de partícula libre que satisfacen la ecuación
de Schrodinger para un potencial constante. Puesto que la cantidad de movimiento liko
para la componente reflejada se supone idéntica a la cantidad de movimiento de la
partícula incidente, se supone que la interacción de colisión es perfectamente elás·
tica. Sin embargo, puesto que la onda de la red representada por la barrera de
energía, se desplaza con la velocidad del sonido, en realidad existe un efecto de
Doppler que hace que la cantidad de movimiento reflejada sea diferente de la incidente. Dado que la velocidad del sonido es pequeña en comparación con la velocidad térmica promedio de la partícula, el cambio de cantidad de movimiento es
sólo una fracción pequeña de la cantidad de movimiento de la partícula incidente y,
por ende, se puede omitir sin riesgo alguno en estos cálculos. De acuerdo con (4.9-8).
es obvio que si la energía de un electrón incidente es e0 y la de un electrón
"transmitido" es e 1 ,
y
(9.11-5)
Transmitida= 'i3(xl-
lncidente =.¡,, (x) - - -
1
¡
Reflejad:< _=_.¡,2_(_x_l_
__
- _ _ _ __, ___sj~
_
x-
1
x=O
Figura 9.21.
La "reflexión" de un electrón desde una barrera de potencial cuya altura es liec.
Mecanismos de dispersión y movilidad de los portadores de carga
337
de donde,
(9.11-6)
Puesto que la función de onda y su derivada deben ser continuas en x = O, se
puede escribir
(9.11-7)
y
1/lí(O) + 1/12(0) = 1/13(0).
Al substituir los valores dados en (9.11-2, 3 y 4) en estas ecuaciones, se puede
demostrar que
B k 0 - kt
-=--A k 0 + kt
y
e
-=
A
2k0
k0 + k 1 ·
(9.11-8)
Las probabilidades de transmisión y reflexión R y T están dadas por
(9.11-9)
(9.11-10)
Si la altura del escalón liec es pequeña, lo que se supondrá en este caso, de
acuerdo con (9.11-6) k 1 ===k0 , y (9.11-9) se puede expresar con la ayuda de esta
aproximación y (9.11-6), como
)2
( m*&
R ~ 2¡2k¡ .
(9.11-11)
La cantidad liec se puede relacionar con la deformación de compresión o
expansión li V/V0 a una primera aproximación mediante una relación lineal de la
forma
- «5V
- «5ec = .::.e • Vo '
(9.11-12)
en donde la constante del potencial de deformación Zc representa el cambio en el
borde de la banda de conducción por unidad de deformación de dilatación.
Puesto que las distorsiones cortantes asociadas con los modos de vibración
transversales no producen ningún cambio de primer orden en el volumen, estas
vibraciones no originan ningún cambio en Ec y su efecto de dispersión en los portadores de carga es despreciable. El paso de una onda elástica longitudinal por el
cristal va acompañado, no obstante, de regiones coherentes de compresión y expansión que son del orden de 1/2 en extensión lineal, en donde l es la longitud de
onda de la perturbación. Si un elemento de volumen V0 de esa extensión lineal se
338
Semiconductores electrónicos uniformes en equilibrio
somete a un esfuerzo de dilatación produciendo una presión maxnna {)p y un cambio de volumen {j V, se ve claramente que la energía de deformación almacenada :-s
--tDP {j V, y si la fuente de la energía de deformación es térmica, su magnitud de~
ser proporcional a kT; en otras palabras,
oe = -!op oV= ckT
(9.11-131
en donde e es una constante.l 2 Sin embargo, puesto que la compresibilidad (3 se
define como
(9.11-141
se puede expresar en función de (3 gracias a esta ecuación, y substituir el resu1tado en (9.11-13) con el fin de obtener
{)p
1 (oV) 2
Oe=---=ckT
2 {JV0
(9.11-15.
de donde,
(oV) 2
V~
2cf:JkT
=-y;-
(9.11-161
Si se substituye este resultado en (9 .11-12) y se usa la expresión resultan te
para oe~ en (9.11-11), R se puede escribir como
(9.11-171
Ahora, en una distancia ox, la probabilidad de dispersión (reflexión) es ox/"An.
en donde An es la trayectoria libre media. Para una distancia l/2 (la dimensión lineal
del volumen V0 ), la probabilidad de reflexión es aproximadamente el valor dadc
como R en la expresión anterior. Entonces, l/2"An se puede igualar a R y resolverse
para An, a fin de obtener
(9.11-181
La segunda expreswn procede de la primera, ya que V0 = P /8 y k 0 = 21rjl
Suponiendo que An es independiente de la velocidad cuya validez aproximada se vio
ya en la sección 7.5, An y el tiempo libre medio se relacionan mediante la expresión (7.3-18). Usando esta ecuación y la expresión (5.4-20), :¡= n se puede expresar en
la forma
(9.11-19)
12 Esta constante se relaciona principalmente con la fracción de todos los modos normales
posibles de vibración que contribuyen a una deformación de dilatación del tipo que se vio aquí.
Es evidentemente independiente de la temperatura, la masa efectiva y la constante del potencial
de deformación.
Mecanismos de dispersión y movilidad de los portadores de carga
339
Este cálculo es evidentemente aproximado. Sobre todo, se observa que no se
ha intentado evaluar c. No obstante, ilustra con claridad los principios comprendidos
y también muestra la dependencia de Tn y, por tanto, de la movilidad con respecto
a la temperatura, la masa efectiva y la constante del potencial de deformación. Un
planteamiento completo de acuerdo con la mecánica cuántica 13 da el resultado
(9.11-20}
en donde c11 es la constante de elasticidad para una expansión longitudinal en la
dirección [110]. La movilidad correspondiente es
Jsn:
ei
eli 4 c11
J.l.n = m: = -3- m:312(kT)3f2E;.
(9.11-21)
Si las superficies de energía constante son elipsoidales más bien esféricas, [de
acuerdo con (9.11-5)], es obvio, que la masa efectiva m:; en (9.11-17, 19 y 20)
debe reemplazarse con la masa efectiva de densidad de estados (9 .1 0-1 O). El factor
adicional de m~ que aparece en (9.11-21), debe ser en este caso, la masa efectiva de
conductividad (9.1 0-25), de tal modo que el factor m:;s 12 del denominador de
(9.11-21), se convertirá en m~ 9 3 1 2 m~. Los cálculos anteriores se refieren específicamente a electrones en la banda de conducción; pero el procedimiento para huecos
en la banda de valencia es prácticamente el mismo, y los resultados son idénticos a
los que se acaban de dar, substituyendo las masas electrónicas y la constante del
potencial de deformación de la banda de conducción por sus equivalentes respectivos
de la banda de valencia.
De acuerdo con (9.11-20) y (9.11-21), la movilidad debe variar como T- 3 12 y
m~- 5 12 cuando la dispersión de la red en modo acústico es la interacción dominante. Si se calcula la relación de la movilidad de electrones a la de huecos, como lo
expresa (9.11-21) y su equivalencia para los huecos, se puede demostrar que
J.l.n -_ ( mn*/ mp*)- 5/2("::'
/"::' )- 2 .
-e-.,
J.l.p
(9.11-22)
Puesto que Zc y Zv son casi siempre más o menos idénticas, con frecuencia se
toma como regla práctica que la relación de las movilidades es la relación inversa de
las masas efectivas a la potencia f.
Desafortunadamente los resultados experimentales concuerdan sólo en parte con
las predicciones de (9.11-21). La variación de la movilidad con respecto a la temperatura en el rango de las temperaturas en donde predomina la dispersión de la red,
en particular, casi siempre es más fuerte que la variación T- 3 / 2 que se encontró con
este análisis. En la tabla 9.4 se indican los valores promedio de la movilidad medida
a 300°K (en donde la dispersión de red es la dominante en todas las muestras,
excepto las muy impuras) y la variación de la movilidad con relación a la temperatura para huecos y electrones en el germanio y el silicio. En materiales con superficies de energía que son esencialmente esféricas, por ejemplo, Si y Ge tipo p, el
efecto de dispersión por vibraciones de la red de modo óptico es importante, sobre
todo a temperaturas más altas. 14
13 Véase, por ejemplo, W. Shockley, Electrons and Holes in Semiconductors. Nueva York:
D. van Nostrand Inc., (195 Nostrand Inc., (1950) página 539.
14 H. Ehrenerich y A. W. Overhauser, Phys. Rev. 104, 649 (1956).
340 Semiconductores electrónicos uniformes en equilibrio
TABLA 9.4.
Datos de la movilidad medida para el silicio y el germanio
P.•
Si
Ge
Variación de JJ.n en
función de la temperatura
1600
3800
T-z-5
p.,
Variación de llp en
función de la temperatura
500
1900
T-1·66
T-1·3
T-1 3
Cuando las superficies de energía son elipsoidales, por ejemplo, en Ge y Si
tipo n, los efectos que se originan en la dispersión de electrones de una elipsoide a
otra (dispersión entre valles), que no se ha tomado en cuenta en el cálculo anterior,
también tiene gran importancia. En este proceso, cuando un electrón se transfiere de
una elipsoide a otra, la conservación de la cantidad de movimiento requiere la
generación o la absorción de un fonón cuya energía es del mismo orden que la del
electrón mismo. Por tanto, estos eventos de dispersión no se pueden considerar
como aproximadamente elásticos. Un estudio detallado de este tipo de dispersión.
realizado por Herring, 15 demostró que la dependencia de la movilidad que se observó en relación con la temperatura, en Ge y Si tipo n, se puede explicar basándose
en la dispersión entre valles aunque, por supuesto, la contribución de modo óptico
es importante sin lugar a dudas. Además, el efecto de los modos transversales de
vibración es mucho mayor cuando la estructura de la banda es de la forma de
"muchos valles",l 6 y, por ende, no se puede omitir por completo para el Ge y el Si
tipo n. Se recomienda consultar los excelentes artículos de Herring 15 y Blatt 17 para
hacer un estudio más detallado de estas cuestiones.
El cálculo del tiempo de relajación para la dispersión de impurezas se basa en
la teoría de la dispersión de partículas cargadas mediante el potencial de Coulomb
de los núcleos, que originariamente fue desarrrollada por Rutherford para explicar la
dispersión de partículas o:. 18 • 19 En un cristal semiconductor que contiene impurezas
de substitución y el potencial de Coulomb debido a los iones cargados, donadores y
receptores, sirven para desviar las trayectorias de electrones y huecos, al igual que lo
hace el potencial de un núcleo pesado que desvía una partícula o: en el experimento
de dispersión de Rutherford.
Si la sección transversal diferencial a(O) se define en tal forma que a(O) dll, es
el área diferencial del haz incidente de partículas que se dispersa a través de un
ángulo 9 en un elemento con un ángulo sólido dll, se puede demostrar mediante la
mecánica clásica o la cuántica,t9 que
a( O) dO. = (
15 C. Herring, Bell Syst.
zé* ) 2 --dO.
1
2
2Km v0
4 (J
(9.11-23)
sen 2
Tech. J. 34, 237 (1955).
lli C. S. Smith, Phys. Rev., 94, 42 (1954).
J 7 F. J. Blatt, Theory of Mobility of Electrons
in So lid State Physics, Advances in Research and Applications. Nueva York: Academic Press (1957), Vol. 4. página 199. Véase particuldrmente la página 332 ff.
18 E. Rutherford, Phil. Mag., 21, 669 (1911).
19 R. B. Leighton, Principies of Modem Physics, Nueva York: McGraw-Hill (1959), página
485 ff.
Mecanismos de dispersión y movilidad de los portadores de carga
341
y que
o
Ze 2
tan-=----.
2 Kam*v~
(9.11-24)
La geometría de dispersión se ilustra en la figura 9.22 para una interacción de
Coulomb de repulsión (hueco
ion donador) y en la figura 9.23, para una interacción de Coulomb de atracción (electrón e ion donador); las ecuaciones anteriores se
aplican a ambos casos. La cantidad K es la constante dieléctrica de la substancia, v0
es la velocidad inicial (y final), y a es el "parámetro de impacto" o la distancia
perpendicular entre el centro de dispersión y la proyección de la línea inicial de
acercamiento de la partícula.
Para una sola partícula incidente, el número de colisiones que puede sufrir por
unidad de tiempo en un ángulo sólido dn, claramente es Nv 0 a(O) dQ, en donde N
es el número de impurezas de dispersión por unidad de volumen. Puesto que la
energía se conserva en la interacción de dispersión, las magnitudes de las cantidades
de movimiento inicial y final de la partícula dispersada son las mismas; sin embargo,
puesto que la dirección cambia por acción del ángulo de dispersión (), existe un
cambio consecuente en la cantidad de movimiento de la componente x en sentido
directo de
e
flpx
= Po(l - COS 0).
(9.11-25)
Ahora, según (9.11-23), es evidente que casi todas las colisiones producen sólo
un pequeño ángulo de deflexión. No obstante, el tiempo de relajación es el lapso
que se requiere en promedio para que la velocidad directa de la partícula se reduzca
a cero y éste es, obviamente, mucho mayor que el tiempo promedio entre tales
eventos de dispersión. En efecto, de acuerdo con (9.11-25), se puede observar que el
número efectivo de colisiones que destruyen la velocidad es menor que el número
total real de dispersiones, por un factor (1,- cos 0). El número equivalentes de colisiones que destruyen la velocidad por unidad de tiempo, comprendiendo un ángulo
de deflexión O en un ángulo sólido dQ no es, por ende, Nv 0 a{O) dQ sino más bien,
dnerr = Nv 0 u(O)(l - cosO) dO. = d(l/r).
(9.11-26)
Estado
final
Trayectoria
del hueco
Estado inicial
Po
Px =Po
Ion de impureza,
carga +Ze
Figura 9.22.
La trayectoria de un hueco que se dispersa mediante la interacción de Coulomb
con un centro de dispersión fijo de carga + Ze.
342
Semiconductores electrónicos uniformes en equilibrio
a
Figura 9.23.
Trayectoria de un electrón dispersado por un centro fijo de dispersión de carga
+Ze.
Esta cantidad es precisamente la recíproca del tiempo de relajación para partículas con esta velocidad inicial específica que sufren colisiones relacionadas con
este ángulo de dispersión en particular. El tiempo total de relajación se puede calcular integrando sobre el ángulo sólido y promediando sobre las velocidades.
Puesto que la dispersión es independiente del ángulo azimutal <P alrededor del
eje polar, dQ = 21T sen e de, e integrando (9 .11-26) sobre el ángulo sólido, se puede
obtener
-1) = 2nNv0
-r(vo
f"
Bo
(
2
o-(0)(1- cosO) sen OdO= 2nNv 0 2 Ze* 2 )
Km Vo
= -16nNv0 (2 ze* 2 )
2
Km v0
2
2
f"
Bo
(1- cosO)esen e dO
4
sen 2
2
2
2
(} 0
) ]
In sen-=
8nNv 0 ( Ze* 2 ) In [ 1 + ( 2 Km*v~
•
2 N 1 ,3
2
2Km v0
Ze
(9.11-27)
Al efectuar la integración, es mejor expresar todas las funciones trigonométricas
de acuerdo con el argumento e12. El límite superior de la integral debe ser e=-¡;_
que corresponde a un "choque directo" que refleja a la partícula incidente de nuevo
hacia su trayectoria original. Para una colisión de esta naturaleza, el parámetro de
impacto a es cero. El límite inferior sería G = O para un centro de dispersión aislado
(que daría origen a una sección tranversal para la dispersión infinita); pero dentro
del cristal, la influencia de un centro de dispersión individual se extiende hacia
afuera sólo a una distancia del orden del espaciamiento medio entre los iones de
dispersión Por tanto, conviene "cortar" la dispersión de un ion en particular cuando
el parámetro de impacto a es igual a d/2, en donde d = N- 1 / 3 es la distancia media
entre los átomos de impureza. Entonces, el límite inferior de la integral se encuentra
en
1
(9.11-28)
a= 2N1/3
que, de acuerdo con (9.11-24), corresponde a
(9.11-29)
Mecanismos de dispersión y movilidad de los portadore~ de carga
343
Los cálculos anteriores permiten expresar a -r(v 0) en la forma
(9.11-30)
Ahora es necesario calcular T por medio del proceso acostumbrado de los
promedios, de acuerdo con el cual,
(9.11-31)
Esta integral no se puede evaluar con prec1s10n por medios analíticos; pero si
se observa que el término logarítnúco del denominador sólo varía muy lentamente
con respecto a v0 , en comparación con el factor de multiplicación vóe-m*vo 2 12 kT,
se puede obtener un valor aproximado suponiendo que el término logarítmico tiene
un valor constante que es igual al valor que alcanza cuando el factor de multiplicación es máximo. Se puede asegurar que este valor máximo se obtiene para Vo =
.J7kT/m*. Haciendo que v0 sea igual a esta cantidad en el término logarítmico,
eliminándolo de la integral y evaluando las integrales restantes de acuerdo con la
tabla 5.1, se puede obtener
(9.11-32)
por lo cual, la movilidad estará dada por
(9.11-33)
Conwell y Weisskopf11 , 20 desarrollaron originalmente este método de cálculo y
(9.11-33) se cita a menudo como la fórmula Conwell-Weisskopf. Brooks y Herring 21
desarrollaron el mismo cálculo de un modo algo más refinado y su resultado es
similar, excepto que el término logarítmico que varía con lentitud es algo distinto.
Las dependencias en relación con la temperatura y la concentración son idénticas en
ambos casos. En el cálculo anterior, el promedio se sacó suponiendo que las superficies de energía eran esféricas. El cálculo para superficies elipsoidales es mucho más
complejo y no se efectuará aquí; la magnitud del tiempo de relajación se verá
afectada, pero no así las dependencias de la temperatura y la concentración. En
20 Este parece un error en el artículo original de Conwell-Weisskopf que ha persistido en
casi todos los estudios de este tema realizados por otros autores. Conwell-Weisskopf indican en
su artículo original [su ecuación (18)] que el máximo de la función que multiplica el término
logarítmico del integrando en el numerador de (9.11-31) ocurre en v2 =6kT/m, en tanto que
basta un simple cálculo para demostrar que en realidad se produce en 7 kT/m. Esto explica el
factor 7/2 en el argumento del término logarítmico de (9.11-33) que va en lugar del factor 3,
que es el que aparece en la fórmula original de Conwell-Weisskopf. La corrección aplicable al
resultado original es obviamente m u y pequeña y no afecta su validez general.
21 H. Brooks, Phys. Rev. 89, 879 (1951).
344
Semiconductores electrónicos uniformes en equilibrio
todo el desarrollo se supuso que los átomos de impurezas estaban completamente
ionizados; a temperaturas muy bajas¡ esto no es exacto. En estas circunstancias, se
debe considerar que la cantidad N de las ecuaciones anteriores representa la concentración exclusiva de los centros de impureza ionizados, como lo indican (9.5-4) o
(9.5-8). Esto introduce una dependencia adicional en relación con la temperatura.
pero es importante sólo a temperaturas muy bajas.
De acuerdo con la ecuación (9.11-33), cuando domina la dispersión de impurezas ionizadas, se debe encontrar que la movilidad es proporcional a T3 12 y que
presenta una dependencia inversa en relación con la concentración de impurezas.
Aunque es difícil obtener especímenes en los que la dispersión de impurezas determine solamente la movilidad, estas predicciones se han verificado por la experiencia.
cuando menos de un modo aproximado. En la figura 9.24 se ilustra una gráfica de
la movilidad en función de la concentración de impureza para el germanio. En
concentraciones reducidas de impurezas, la interacción de dispelSión dominante es la
de la red, es independiente del contenido de impureza, y por tanto la movilidad
[como se da, por ejemplo, en (9.11-21)], también es independiente de la densidad de
impurezas. A altas concentraciones de átomos de impurezas, la dispersión de impurezas ionizadas se convierte. en el proceso de dispersión más importante y la movilidad decrece al incrementarse la densidad de impurezas, como lo predice la fórmula
Conwell-Weisskopf, (9.11-33). En el rango intermedio las interacciones de dispersión
de ambos tipos son importantes y la movilidad 1J. debe expresarse como IJ- 1 =
IJ.11 + IJ/1 en donde IJ.¡ es la movilidad que puede atribuirse sólo a la dispersión de
impurezas ionizadas y IJ.¡ la que se puede encontrar en los casos en que la dispersión
de la red es el único proceso importante.
Además de la dispersión de la red y la de impurezas, hay otras interacciones
de dispersión que tienen una importancia ocasional. Los centros de impurezas neutras, al igual que los ionizados, pueden producir una dispersión apreciable, si existen
en cantidades suficientes. Erginsoy 2 2 realizó un estudio de este tema. Se ha descubierto que la dispersión de impurezas neutras es independiente de la temperatura y.
por tanto, puede tener importancia a temperaturas muy bajas cuando la dispersión
de la red es despreciable y la mayoría de las impurezas no están ionizadas. Es más.
las vacantes, átomos intersticiales, dislocaciones, fronteras de grano y las superficies
de la muestra pueden dispersar huecos y electrones aunque, en muchos casos, la
¡.<¡
4000
------------
3000
2000
1000
10 20
IC 19
1018
10 17
10 16
10 1 ~
10 14
10 13
Densidad de donadores Nd
(Germanio tipo n, 300°K)
Figura 9.24.
Efecto de la concentración de impurezas en la movilidad de los electrones, a la
temperatura ambiente, en el germanio tipo n, de acuerdo con la teoría ConwellWeisskopf de la dispersión de impurezas. [Tomado de E. M. Conwell, Proc. I.R.E.,
40: 1327 (1952).]
22 C. Erginsoy, Phys. Rev.,
79, 1013 (1950).
Mecanismos de dispersión y movilidad de los portadores de carga
345
dispersión atribuible a estos medios se desecha en comparación con la dispersión de
red o impurezas.
La exposición del comportamiento volumétrico de semiconductores dada en
este capítulo de ningún modo es completa. En realidad, no se han tratado las
propiedades térmicas y ópticas en absoluto y, por falta de espacio, ha sido necesario
omitir una explicación de los efectos sumamente interesantes que se pueden observar
en semiconductores sometidos a esfuerzos hidrostáticos o uniaxiales. 23 No obstante,
se espera que este estudio haya aclarado los campos muy básicos e importantes y
haya desarrollado métodos de utilidad general en la investigación de algunos de los
temas que no se han visto en detalle.
EJERCICIOS
l. En papel semilogarítmico, haga las gráficas de la concentración de los portadores intrínsecos n¡ en función de 1/T para (a) germanio, (b) silicio, (e) InSb (LlE=0.22 eV, m;!; =0.013
m 0 , mp = 0.18 mo), (d) GaAs (Á€= 1.5 eV, m~= 0.1 m 0 , mp = 0.4 m 0 ). Asegúrese de que las
gráficas indiquen con claridad la variación de n¡ en función de T sobre el rango comprendido
entre 10° y 500°K.
2. Estudie un semiconductor intrínseco bidimensional en el que, al igual que en los sistemas metálicos bidimensionales, las funciones de densidad de estados son
e> ec
g(e) =O
e.< e< ec
g.(e) de= (41Tm: /h 2 ) de
e< e.
Demuestre, utilizando sólo la estadística de Fermi y sin recurrir a la aproximación de Boltzmann, que para el caso en que mp/m~ = 2, la posición del nivel de Fermi se puede expresar
como
1
kT 8
~
ec- ef = 2 !le- -zln 3 + kTin cos 3'
en donde
~ =
32
]1/2
tan- 1 [ 27 (r"''n)- 1
3. Haga las gráficas de la conductividad para el germanio tii?o p y n en función de la
concentración neta de impurezas J/'!.d- Ngl para valores de INd- N0 1 que van de O a 10 1 'cm- 3
a las siguientes temperaturas: 80 K, 300 K, 500°K. Suponga que J.l.n varía como r- 1 •65 Y f.lp
como r- 3 ·2 . Haga estas gráficas en papel logarítmico.
4. ¿Para qué valores de concentración de portadores n 0 , Po es mínima la conductividad de
un semiconductor? ¿Cuál es el valor del contemdo neto de impurezas ¡Nd- N 0 i que esto
implica?
5. Para un semiconductor con superficies de energía esféricas tanto en la banda de conducción como en la de valencia, pero con dos especies de huecos, demuestre que el coeficiente de
Hall de campo pequeño se puede escribir como sigue
23 R. W. Keyes, "The Effects of Elast1c Deformation on the Electrical Conductivity of
Semiconductors." en Salid State Physics, Advances in Research and Applications. Nueva-York:
Academic Press (1960), Vol. 11, página 149.
346 Semiconductores electrónicos uniformes en equilibrio
en .do~de Pot. p 02 son las .concentraciones, 1Jp 1 , 1Jp2 las movilidades y Tp 1, Tp 2 los tiempos de
relajac!On para las dos especies de huecos.
6. Para cada una de las superficies de energía constante del germanio, encuentre los tensores individuales de conductividad a~'J relacionados con los ejes cúbicos como ejes de coordenadas. En el germanio, las superficies de energía constante son cuatro elipsoides cuyos ejes
principales caen a lo largo de las cuatro direcciones (111). Demuestre que el resultado (9.10-23)
se obtiene sumando totalmente las elipsoides.
7. Demuestre que si el campo estático está en la dirección [100]. sólo se observará un pico
de resonl!-ncia de ciclotr~n a la frecuencia w = ~eJ!/c)[(mf¡ +?ml>!}mfiml2 1I¡2 en el germanio. ~Qué
resonancias Se observanan COn el campo estat!CO en fa dueCCIOn r111 l7
8. Con las leyes de la mecánica clásica, derive la fórmula de dispersión de Rutherford
(9.11-23) y la relación asociada (9.11-24).
9. Se ha determinado que un espécim de semiconductor tiene una resistividad de 12.5
ohm-cm. El espécimen tiene 1 cm de longitud, por 5 mm de ancho y 1 mm de grosor. Se hace
fluir una corriente de 1 mA a lo largo de la dimensión más larga de la muestra y se mide un
voltaje de Hall de 5 m V en la anchura de 5 mm de la muestra, cuando se usa un campo
magnético de 2000 gauss. ¿Cuál es la concentración de portadores y la movilidad de Hall de los
portadores en la muestra? Se puede suponer que la muestra es extrínseca, que las superficies de
.:nergías son esféricas y que la dispersión acústica de modo acústico es el proceso de dispersión
dominante.
10. Escriba los detalles relacionados con la maximización de la expresión (9.5-2) por el
método de los multiplicadores lagrangeanos, completando así la derivación en (9.5-3).
11. Demuestre que (9.3-6) y (9.3-15) se pueden transformar de tal modo que indiquen
12. Explique físicamente las características principales de las curvas experimentales ilustradas en la figura 9.13, y analice las relaciones entre las tres gráficas separadas.
LECTURAS RECOMENDADAS
A. C. Beer, "Galvanomagnetic Effects in Semiconductors"; suplemento 4 en So/id State Physics.
Advances in Research and Applications, Academic Press., Inc., Nueva York (1963).
F. J. Blatt, "Theory of Mobility of Electrons in Solids," en So/id State Physics, Advances in
Research and App/ications, Vol. 4, Academic Press., Inc., Nueva York (1957).
H. Brooks, "Theory of the Electrical Properties of Germanium and Silicon," en Advances in
Electronics and Electron Physics, Vol. 7, Academic Press, Inc., Nueva York (1955).
E. Burstein y P. H. Egli, "The Physics of Semiconductor Materials," en Advances in Electronics
and Electron Physics, Vol. 7, Academic Press., Inc., Nueva York (1955).
H. Y. Fan, "Valence Semiconductors, Germanium and Silicon," en So/id State Physics, Advances
in Research and Applications, Vol. 1, Academic Press., Inc., Nueva York (1955).
R. W. Keyes, "The Effect of Elastic Deformation on the Electrical Conductivity of Semiconductors," en Salid State Physics, Advances in Research and Applications, Vol. 11, Academic
Press, Inc., Nueva York (1960).
W. Shockley, Electrons and Hales in Semiconductors, D. van Nostrand Co., lnc., Nueva York
(1950).
R. A. Smith, Semiconductors, Cambridge University Press, Nueva York (1961).
cAPITuwlO
Exceso de portadores
en semiconductores
10.1
INTRODUCCION
En un metal prácticamente es imposible alterar la concentración volumétrica de
los portadores de carga libres. Se puede introducir un exceso de portadores; pero
sólo induciendo una carga eléctrica en el espécimen. En estas condiciones, la densidad de carga en exceso reside esencialmente en la superficie del metal y no se
afecta la concentración volumétrica de los portadores de carga. En esta situación no
se observa ningún cambio en las propiedades volumétricas de transporte.
Sin embargo, en un semiconductor se puede alterar profundamente la concentración de portadores de carga en el material sin introducir ninguna densidad de
carga eléctnca importante. Esto se logra gracias a que pueden tenerse simultáneamente dos tipos de portadores de carga, huecos y electrones; si los huecos y los
electrones en exceso se introducen en pares, se pueden crear grandes desviaciones de
los valores de equilibrio térmico de la concentración volumétrica de portadores sin
que se forme ninguna densidad de carga neta. La formación de estas densidades de
portadores en exceso del nivel de equilibrio va acompañada de una modulación
notable de la conductividad volumétrica del material, como lo establece {9.7-6). Esta
posibilidad es la que permite el uso de elementos semiconductores como dispositivos
electrónicos tales como rectificadores, transistores y unidades de conmutm:ión. Si se
extraen huecos y electrones en pares, se pueden obtener concentraciones volumétricas de portadores inferiores a los valores de equilibrio, con la misma facilidad con
que se crean concentraciones en exceso mediante la introducción o inyección de
pares de portadores de carga. 11, absorbe. Por tanto, el espectro de absorción de un
semiconductor se caracteriza siempre por un cambio muy rápido
Los portadores excedentes se pueden crear en los semiconductores iluminando
el material con una frecuencia tal que la energía del fotón hwo sea igual o sobrepase a la energía de la banda prohibida ~€. En estas condiciones, los fotones incidentes tienen la suficiente energía para romper los enlaces covalentes de la red de
pares de electrones, liberando electrones libres y dejando los huecos en los sitios de
excitación. Los electrones y los huecos en exceso que se crean de esta manera en
pares, contribuyen a la conductividad del cristal, que luego se incrementa bajo la
iluminación, siendo el aumento proporcional a la intensidad de la luz. Este fenómeno se denomina fotoconductividad y es muy característico de todos los semiconductores. Puesto que en la creación de cada par electrón-hueco se absorbe un fotón,
la luz con una longitud de onda lo suficientemente corta para que la energía del
fotón sobrepase ~€, se absorberá con mucha fuerza dentro del cristal. Por otra
347
348
Exceso de portadores en semiconductores
Coeficiente de
absorción
<T
(t)
Borde de
absorción
(hw 0 : Ó<)
a
~~x,
Opaco
1
Transparente
~----------~.r¡------•X
Tiempo
1-- Luz ---l
Obscuro
(o)
Figura 10.1.
Obscuro
(w>w 0 )
(b)
(a) Espectro de absorción de un semiconductor típico cerca del borde de absorción fundamental. (b) Respuesta fotoconductiva de un cristal semiconductor a una
luz con una longitud de onda lo suficientemente corta para excitar pares electrónhueco en exceso.
parte, la luz con una longitud de onda mayor, cuya energía de fotón es inferior a
~e, no puede crear pares electrón-hueco y raramente se absorbe. Por tanto, el
espectro de absorción de un semiconductor se caracteriza siempre por un cambio
muy rápido en el coeficiente de absorción, a una longitud de onda que corresponde
a la energía del fotón ~e, teniendo el cristal una mayor fuerza de absorción para
longitudes de onda más corta y siendo casi transparente para longitudes de onda más
largas, como se ilustra en la figura lO.l(a). La región de transición brusca de la
opacidad a la transparencia se denomina borde de absorción. En el germanio, el
borde de absorción se produce en el infrarrojo cercano a aproximadamente X =
1.75 Jl., correspondiendo a ~€ = 0.7 eV, y en el silicio, a alrededor de 1.13 Jl., correspondiendo a ~e= 1.12 eV. La banda de energía prohibida ~e se puede determinar
con precisión en el espectro de absorción, midiendo la longitud de onda a la que se
produce el borde de absorción. En la figura 1O.l(b) se muestra la respuesta fotoconductiva de un semiconductor a la luz con una longitud de onda lo suficientemente
corta para crear pares electrón-hueco.
Los portadores excedentes también se pueden crear en cristales semiconductores por medio de haces de partículas de alta energía (electrones, protones, partículas a), rayos X, radiación 'Y y mediante contactos metal-semiconductor debidamente polarizados o uniones p-n. Volveremos sobre estos conceptos más adelante.
10.2
COMPORTAMIENTO DEL TRANSPORTE DE LOS PORTADORES
EXCEDENTES; LAS ECUACIONES DE CONTINUIDAD
En cualquier cristal semiconductor, continuamente se generan pares electrón·
hueco por medios térmicos o de otra índole, y se están recombinando de un modo
continuo. En equilibrio térmico, el único proceso de generación es el térmico. La
velocidad a la que se generan los pares y a la que se recombinan debe ser idéntica:
de otra manera, la concentración de electrones. y huecos crecería o declinaría como
una función del tiempo. La velocidad de generación térmica de equilibrio
g 0 ( cm- 3 seg- 1 ) es el número de pares electrón-hueco generados por unidad de volumen en unidad de tiempo, mediante la ruptura térmica de enlaces covalentes. Esta
Comportamiento del transporte
349
cantidad es una función de la temperatura y ciertos parámetros del cristal; pero es
independiente de la concentración de electrones y huecos. La velocidad de recombinación se relaciona con el tiempo medio que transcurre entre la generación de un
electrón o un hueco y su recombinación subsecuente. Esta cantidad se conoce como
tiempo medio de vida del portador. Si sólo se tuviera un portador de una especie
dada por unidad de volumen del cristal, en cualquier tiempo en particular, el número de sucesos de recombinación por unidad de volumen por segundo de este tipo
de portador sería 1/r, en donde T es el tiempo de vida de dicha especie de portadores.1 Cuando se tienen n portadores por unidad de volumen, la velocidad de
recombinación (número de eventos de recombinación por unidad de volumen por
unidad de tiempo) es n veces mayor, es decir, n/r. En las condiciones de equilibrio
térmico, la concentración de electrones es n 0 y la concentración de huecos es p 0 y,
puesto que las velocidades de generación y recombinación de huecos y electrones
deben ser iguales en estas circunstancias, es obvio que
y
(10.2-1)
en donde g 0 n y g 0 P son las velocidades de generac10n térmica en equilibrio para
electrones y huecos, respectivamente, y en donde T no y T po son los tiempos de vida
promedio para las especies de portadores respectivas en la situación de equilibrio.
Además, puesto que la generación térmica siempre da como resultado la producción
de pares electrón-hueco, se está generando un hueco por cada electrón y g0 n y g0 p
deben ser iguales, de donde,
(10.2-2)
La igualdad de las velocidades de generación y recombinación se aplica a todos
los sistemas de estado estacionario, aun los que no están en equilibrio térmico. La
igualdad de las velocidades de generación de electrones y huecos, así como la igualdad de las velocidades de recombinación de electrones y huecos, deben conservarse
también en sistemas que no se encuentran en la situación del estado estacionario, ya
que la generación (o recombinación) de un electrón va acompafíada inevitablemente
de una generación (o recombinación) de un hueco. No obstante, en sistemas que no
tienen un estado estaeionario, las velocidades de generación y recombinación para electrones (o huecos) pueden ser diferentes. En todo caso, es necesario escribir siempre
y
(10.2-3)
en donde gn y gP son las velocidades reales de generación, n y p las concentraciones
locales y ·r n y T P el tiempo de vida de electrones y huecos, respectivamente. En
1 Hasta ahora se han usado los símbolos T n• T P y T para representar los tiempos de
relajación asociados con procesos de dispersión. Sin embargo, los mi;;mos símbolos se usan
universalmente en las obras impresas para representar también los tiempos de vida de recombinación. Puesto que esta práctica ha quedado justificada por los numerosos años de uso y, dado
que no se desea adoptar una notación muy compleja, se usarán los mismos símbolos para los
dos grupos de cantidades. No obstante, de aquí en adelante se dará por sentado que T, Tn y T P
se refieren siempre a los tiempos de vida de recombinación, a menos que se especifique otra
cosa.
350 Exceso de portadores en semiconductores
X
Figura 10.2.
x+dx
Flujo de portadores que entran y salen de un pequeño elemento de volumen del
cristal.
estas ecuaciones, las velocidades de generac10n gn y gP, al igual que las concentraciones n y p, y los tiempos de vida r n y T P, deben considerarse generalmente como
funciones de las coordenadas de espacio y tiempo, dentro del cristal.
Ahora se verá una región del cristal cuyas dimensiones son dx, dy, dz, como
se indica en la figura 10.2. Supóngase que hay unas densidades de flujo de partículas JP y Jn de huecos y electrones, respectivamente, que fluyen dentro y fuera de
esta región. La componente x de J P en x + dx se puede expresar en función de J P
en x, haciendo una expansión de Taylor de lpx(x + dx); en el límite en donde dx
se hace pequeña, sólo los dos primeros términos son importantes, de donde,
()Jpx
JPix + dx) = JPx(x) + ox dx.
(10.2-4)
El incremento neto en el número de huecos dentro de la región, por unidad
de tiempo, originados en una diferencia en las componentes x de JP en las dos caras
ABCD y EFGH, entonces es
[Jpix)- Jpx(x + dx)] dy dz =
a:
oJ
dx dy dz.
(10.2-5)
También se tendrán términos similares que se originan en la diferencia de las
componentes y de JP en las caras ACGE y BDHF, y en la diferencia de las componentes z de JP en ABFE y CDHG. El incremento neto total por unidad de tiempo
en el número de huecos dentro de la región, que se origina debido a estos términos
es - V • JP dx dy dz. Si los procesos de generación y recombinación son activos
dentro del volumen, habrá gp dx dy dz huecos generados y (pjr P) dx dy dz que se
pierden por recombinación por unidad de tiempo dentro de la región de interés. La
suma algebraica de todas estas cantidades representa el incremento neto total del
número de huecos dentro del volumen dx dy dz por unidad de tiempo que es,
evidentemente, (opjot) dx dy dz. Si se saca la suma algebraica de las diferentes contribuciones, se iguala a (opfot) dx dy dz y se anula el elemento de volumen en
ambos lados de la ecuación, se puede demostrar que
P
op
-V·J P +g p - =Ot
-'
t"
p
(10.2-6)
Comportamiento del transporte
351
mientras que con un cálculo similar para los electrones dentro del mismo elemento
de volumen, se obtendrá
n
on
'n
t
-V ' Jn + Un - - = -0 •
(10.2-7)
Las expresiones ( 10.2-6) y ( 10.2-7) se citan como las ecuaciones de continuidad para los electrones y los huecos. En condiciones apropiadas de frontera, las
soluciones de estas ecuaciones describen la distribución de la concentración de electrones y huecos en función de las coordenadas del espacio y el tiempo, y proporcionan una descripción completa del comportamiento de transporte de electrones y
huecos dentro del semiconductor en condiciones que no sean las de equilibrio. Para
llegar a soluciones explícitas de las ecuaciones de continuidad, es necesario expresar
la corriente en función de la concentración. Esto se logra escribiendo la densidad del
flujo de partículas como la suma de una densidad de flujo de difusión y una
densidad de corriente de arrastre producida por cualquier campo eléctrico que pueda
estar presente. En consecuencia, se puede escribir
(10.2-8)
y
(10.2-9)
El origen de la componente de corriente debida al campo, en las ecuaciones
anteriores, queda perfectamente en claro. 2 El término de difusión establece que
siempre que exista un gradiente de concentración Vp, se tendrá un flujo neto de
corriente de partículas de las regiones de alta concentración a las de baja concentración, proporcional al gradiente de la concentración en cualquier punto. Este flujo de
difusión es análogo al flujo de calor en presencia de un gradiente de temperatura. La
constante de proporcionalidad se denomina coeficiente de difusión o difusibilidad. Se
puede demostrar rigurosamente que la componente de difusión de la corriente debe
tener esta forma, aplicando los métodos desarrollados en el capítulo 7, principiando
con la ecuación de Boltzmann y suponiendo la aproximación del tiempo de relajación (7.24). No se incluirá aquí la reproducción de los detalles de esta demostración, sino que se asignarán como un ejercicio para el lector, lo cual constituye una
buena práctica en el uso de la teoría del transporte que se vio con anterioridad.
Cuando la trayectoria libre media es independiente de la velocidad, que es una
aproximación aceptable en los semiconductores, en donde la dispersión de red es el
proceso dominante, resulta que los coeficientes de difusión de los electrones y los
huecos se pueden expresar como
y
(10.2-10)
en donde "-n y Ap son las trayectorias libres medias del electrón y el hueco, y en y
cP son las velocidades térmicas medias de los electrones y los huecos, respectivamente. En las circunstancias en que ( 10.2-10) es válida, las trayectorias libres medias
2 En (10.2-8) y (10.2-9) se supone que no hay campos magnéticos presentes o cuando
menos, que, su efecto en los portadores es pequeño en comparación con el del campo eléctrico.
Los símbolos ln y Jp se usarán para representar la densidad de flujo de partícula en tanto que
In(=- eJn) y lp(= eJp) se usarán para la densidad de la corriente eléctrica.
352
Exceso de portadores en semiconductores
y los tiempos de relajación de electrones y huecos están relacionados por medio de
(7 .3-18). Si las ecuaciones (10.2-10) se expresan en función de los tiempos de
relajación, y si las velocidades térmicas se representan por (5.4-20), con el uso de las
masas efectivas apropiadas, se puede demostrar fácilmente, utilizando (7.3-13), que
los coeficientes de difusión se pueden representar de acuerdo con las movilidades
como sigue
y
p.PkT
D =--.
e
P
(10.2-1!)
Estas relaciones entre los coeficientes de difusión y las movilidades se conocen
como relaciones de Einstein. Aunque se derivaron antes basándose en suposiciones
muy restrictivas, se puede demostrar que se aplican a todos los sistemas que obedecen a la estadística de Boltzmann. En realidad, si se incluye una constante numérica
apropiada, se puede demostrar que se aplican también a los sistemas de Fermi.
Si las ecuaciones de la corriente ( 10.2-8) y ( 10.2-9) se substituyen en las
ecuaciones de continuidad (10.2-6) y (10.2-7), esta última se puede escribir como
p iJp
DpV2 p - p. pV • (pE) + g p - 't- p = -iJt
(10.2-l2J
y
n
iJn
DnV 2 n + p.n V· (nE) + gn - =..,
ot .
(10.2-13)
Los términos de divergencia en las ecuaciones anteriores se pueden transformar
a una forma más manejable utilizando la identidad vectorial
V· (</JA) =A· V</J + </JV ·A
(10.2-14)
que es aplicable a cualquier vector A y cualquier función escalar 1/J. De igual manera,
conviene expresar las velocidades de generación como la suma de la velocidad de
generación térmica, más la velocidad a la que se generan los portadores en exceso de
la velocidad de generación térmica, de donde,
g, = gon + g~
y
gp = gOp + g~,
(10.2-15)
en donde g~ y g~ son las velocidades de generación del exceso. Las velocidades de
generación térmica pueden expresarse ahora en función de las concentraciones en
equilibrio y los tiempos de vida por medio de (10.2-l). Después de efectuar estas
transformaciones, las ecuaciones de continuidad (10.2-12) y (10.2-13) toman la forma
(10.2-16)
n
n0 )
iJn
D,V 2 n + p.,(E • Vn + nV • E) + g~ - ( - - = -.
-r,. -r,.o
iJt
(10.2-17)
El campo E se puede expresar como la suma del campo aplicado y el campo
interno que se origina por el hecho de que las partículas en difusión están cargadas,
por lo cual,
E = E;nt + Eap.
(10.2-18)
Comportamiento del transporte
353
Concentración
-
Etnt
t=o
l>o
-x
(e)
(a)
Figura 10.3.
Etapas sucesivas en la dispersión difusiva de una distribución de pru:es electrónhueco en exceso, que inicialmente tiene la forma de una función 8 en un semiconductor intrínseco.
El campo interno tiene su origen en el hecho de que las trayectorias libres
:nedias (y, por ende, los coeficientes de difusión) de los electrones y los huecos
pueden ser diferentes. Si los electrones y los huecos pudieran moverse por completo
de un modo independiente entre sí, las especies de difusión más rápida tenderían a
adelantarse a las especies de difusión más lenta, dejando a estas últimas totalmente
detrás. Sin embargo, ya que las partículas de difusión están cargadas, cuando esto
sucede en realidad, comienza a producirse una separación de las cargas positivas y
negativas, se establece un campo eléctrico interno que tiende a retardar a las partículas de difusión rápida y a impulsar a las más lentas. Este es el campo Eint de la
ecuación (10.2-7). Finalmente, este campo se hace lo suficientemente fuerte para
contrarrestar por completo cualquier tendencia de las distribuciones de carga positivas y negativas a separarse más todavía; entonces, las distribuciones de partículas
positivas y negativas se difunden juntas y el coeficiente de difusión efectiva es
mayor que el de las especies de difusión más lenta, pero menor que el del tipo de
difusión más rápido. Este fenómeno, denominado difusión ambipolar, se ilustra en la
figura 10.3. Como se verá en seguida, un efecto similar altera el carácter del movimiento de arrastre que se produce cuando existe un campo eléctrico aplicado.
En las ecuaciones (10.2-16) y (10.2-17), es evidente, de acuerdo con la exposición anterior, que en realidad contienen tres cantidades desconocidas, n, p y E.
Para encontrar estas cantidades, es necesario recurrir a otra ecuación. El conjunto de
ecuaciones se puede completar escribiendo la expresión de Poisson que relaciona el
campo eléctrico y la densidad neta de carga e(p - n + Nd -Na+ Pa - nd ). De acuerdo con esto,
V. E= 4np = 4ne(p- n + N 4 - Na+ Pa- n4)
K
K
(10.2-19)
en donde K es la constante dieléctrica. Debe hacerse notar que, puesto que el
campo aplicado Eap no tiene fuentes o pozos internos, su divergencia es cero, por
lo cual, de acuerdo con (10.2-18)
V· E= V· E;nt·
(10.2-20)
Las ecuaciones (10.2-16), (10.2-17) y (10.2-19) forman ahora un conjunto de
tres ecuaciones que en principio, pueden resolverse para las tres incógnitas n, p y
Eint·
Desafortunadamente parece no existir un medio para llegar a una solución de
estas tres ecuaciones de una manera analítica directa. Por tanto, es necesario hacer
354
Exceso de portadores en semiconductores
una aproximación física razonable que permita llegar a una solución que, aunque no
sea exacta, sea adecuada para la mayoría de los casos de importancia práctica. La
aproximación que se utilizará con este fin es la condición de neutralidad eléctrica o
la suposición de balance de carga. Se supondrá en (10.2-16) y (10.2-17) que la
densidad de electrones en exceso ón = n- n 0 se equilibra mediante una densidad de
huecos en exceso óp = p- Po. Es evidente que esto no es del todo cont:cto, porque
entonces, jamás se podría establecer un campo interno, y es este campo interno,
originado en la disparidad básica de las trayectorias libres medias de electrones y
huecos, el que tiende a conservar unidas las distribuciones de densidad de electrones
y huecos de difusión. N o obstante, esta pequeña diferencia entre la densidad de
electrones y huecos (en comparación con las densidades de excesos de portadores
propiamente dichas) es lo que se requiere normalmente para crear este campo interno. La aproximación del equilibrio de carga es casi siempre apropiada en lo que
respecta a las densidades de portadores de las ecuaciones ( l 0.2-16) y (1 0.2-17). Sin
embargo, no es de esperarse que se use la suposición de neutralidad de carga en
(10.2-19). Al contrario, se puede calcular el campo Eint a partir de (10.2-16) y
(1 0.2-17) empleando la suposición de neutralidad de carga, ya que entonces se tendrán sólo dos incógnitas, óp y E¡n t' en estas ecuaciones. Este valor calculado de
Eint se puede utilizar en (10.2-19) para determinar la densidad de la fuente (y, por
tanto, la disparidad en las densidades de electrones y huecos) requerida para mantener el campo. Si la densidad de la fuente calculada es sólo una fracción pequeña de
las densidades de electrones y huecos en exceso calculadas en (1 0.2-16) y (1 0.2-17), se
puede tener la seguridad de la consistencia de los cálculos y la validez de las suposiciones
en las que se basan; de otra manera, será necesario llegar a la conclusión de que los
resultados no concuerdan con las hipótesis originales y los cálculos están equivocados.
Más tarde se verá que el primer caso es el que se encuentra casi siempre en la
práctica real. 3
Por tanto, siguiendo esta línea de razonamiento, se supondrá inicialmente que
(10.2-21)
bn = n- n 0 = p- Po= bp.
Este estudio se limitará a muestras homogéneas, en donde la densidad de impurezas
es uniforme en todo el material. Para tales muestras, n 0 y p 0 son constantes y los
gradientes y las derivadas del tiempo para n y p son iguales a los gradientes y a las
derivadas del tiempo de ón y óp, respectivamente. De igual manera, de acuerdo con
(10.2-3), se ve claramente que los términos de generación y recombinación de
(10.2-12) son iguales a los de (10.2-13). Los términos de generación y recombinación de (10.2-16), que se originan directamente de los términos correspondientes de
(10.2-12) son iguales a los términos de generación y recombinación de (10.2-17) que
se originan en la misma forma que los términos de (10.2-13). Si se emplean estos
resultados en (10.2-16) y (10.2-17), se puede demostrar que
DPV 2 (bp)- J.lp(E. V(bp) + pV. E)+ g'-
o(bp)
(Po+'P bp - Po)
- = - - (10.2-22)
O(
!Po
2
•
D"V (bp) + J.ln(E • V(i5p) + nV ·E) +.g'-
(Po +bp - Po)
o(bp)
- = - (10.2-23)
Tp
!Po
O(
3 W. van Roosbroeck fue el primero en adoptar esta línea de planteamiento para el caso
del semiconductor [Phys. Rev., 91, 282 (1953)]; pero mucho antes se utilizaron métodos similares para resolver problemas relacionados con el transporte de electrones e iones en descarga~
gdseosas, que son muy similares.
Comportamiento del transporte
355
en donde
(10.2-24)
El término que comprende V • E se puede eliminar multiplicando (1 0.2-22)
por nJJ.n, (1 0.2-23) por PJJ.p y sumando las dos ecuaciones (observando en (1 0.2-21)
que n - p = n 0 - Po) para obtener
npnDp + PJ1pDn V2(bp) _ llnJ1p{no- Po) E. V(bp) + g' _(Po+ bp _Po)= iJ(bp).
nJln + PJlp
nJ1n - Pllp
7: p
7: PO
iJt
(10.2-25)
Ahora, en el coeficiente del primer término anterior, las movilidades se pueden
expresar en función de los coeficientes de difusión mediante las relaciones de
Einstein (10.2-11). Por tanto, la ecuación (10.2-25) se puede escribir como sigue
bp iJ(bp)
D*V 2 (bp)- 11*E • V(bp) + g' - - = - r
iJt
(10.2-26)
D* = ( n + p )D .D P = -,---(_n-'-0-=-+~P_o_+_2.,-b_p_)D_n-::-D~P:-=nDn + pDP
(no+ bp)Dn +(Po+ bp)Dp
(10.2-27)
en donde
(10.2-28)
y en donde T es un "tiempo de vida del portador en exceso" definido por
bp
Po + bp
Po
n 0 + bp
n0
(10.2-29)
7:
La concentración en exceso de las otras especies de portadores, on, es por supuesto
igual a op de acuerdo con la suposición del balance de carga (10.2-21).
La expresión ( 10.2-26) es la ecuación de transporte ambipolar que obedecen la
densidad de electrones y huecos en exceso. 4 El coeficiente de difusión ambipolar D*
y la movilidad ambipolar p*, de acuerdo con (1 0.2-27) y (10.2-28) en general, son
dependientes de la concentración op de portadores en exceso. Es imposible resolver
(10.2-26) en estas circunstancias y casi siempre se debe proceder a partir de este
punto, a usar métodos numéricos o de aproximación. No obstante, si la densidad de
portadores en exceso op es mucho menor que la mayor de las dos cantidades (n 0 ,
p 0 ), D* y p* son substancialmente constantes y se pueden obtener fácilmente soluciones analíticas para (10.2-26). Este estudio se restringirá al análisis de situaciones
en que se satisface esta condición y ésta se denominará el caso de nivel bajo.
4 Esta ecuación se parece a la de \:Ontinuidad para partículas que se difunden de un modo
mdependiente, que tendría la forma (10.2-13); pero no es exactamente la misma, ya que el
término E· \1p substituye a \1 ·(pE). Si el campo es constante, los términos son iguales; pero,
de otra manera, las ecuaciones y sus soluciones serán diferentes.
356
Exceso de portadores en semiconductores
Ahora se verá el caso de un material fuertemente extrínseco tipo n, en donde
n 0 >Po o 6p. Por ejemplo, supóngase que se tienen 10 15 electrones y 1011 huecos
por cm 3 en equilibrio. Se tendrá un tiempo de vida de electrones en equilibrio T no
y un tiempo de vida de huecos en equilibrio T po que estarán relacionados por
(10.2-2) ó (10.2-3). Es obvio que T po es mucho más pequeño (por un factor de
1O" en este caso) que T n 0 • Supóngase ahora que se crea una densidad uniforme de
pares electrón-hueco en exceso de tal modo que 6p = 6n = 10 11 cm- 3 • La caneentracción de electrones ahora es n0 + 6n = 1.0001 x 10 15 cm- 3 , con un .incremento
del 0.01 por ciento sobre la densidad de equilibrio, en tanto que la concentración
de los huecos es 2 x 10 11 , que es el doble de la densidad de equilibrio. Puesto que
la densidad de electrones relativa a la densidad de equilibrio prácticamente no se altera
la probabilidad por unidad de tiempo de que un hueco dado se encontrará con un
electrón casi no varía tampoco. En consecuencia, el tiempo de vida del hueco no se
afecta y será prácticamente independiente de 6p para valores pequeños como estos
de 6p. Por otra parte, puesto que la densidad de los huecos se ha duplicado, la
probabilidad de que cualquier electrón dado se encuentre con un hueco se ha duplicado también, y el tiempo de vida del electrón se reducirá más o menos a la mitad
de lo que era en el estado de equilibrio. De donde, el tiempo de vida de electrones
debe variar rápidamente con 6p aun a pesar de, que dicha cantidad sea muy pequeña. Evidentemente, la situación será justamente la opuesta en un material tipo p
sumamente extrínseco. En general, se observa que el tiempo de vida de los portadores minoritarios es fundamentalmente independiente de 6p para valores pequeños
de 6p, en tanto que el tiempo de vida de los portadores mayoritarios no lo es. En
un semiconductor de fuerte tipo n, T P = r P para 6p <no, y el tiempo de vida de
los portadores en exceso r, como lo define (~0.2-29) se reduce a
(10.2-30)
(material de fuerte tipo-n)
De la misma manera, para un cristal tipo p fuertemente extrínseco, se ve claramente
que ( 10.2-29) se reduce a
(10.2-31)
(matenat de fuerte tipo-p)
Luego para el caso de nivel bajo, el tiempo de vida de los portadores en exceso T se
reduce simplemente al tiempo de vida de los portadores minoritarios. Los términos
tiempo de vida de portadores en exceso y tiempo de vida de portadores minoritarios
se usan con frecuencia indiferentemente, a pesar de que no siempre son iguales. En
especial, cuando las condiciones del caso de nivel bajo no se satisfacen o cuando el
cristal es casi intrínseco, el tiempo de vida de los portadores en exceso T difiere del
tiempo de vida de los portadores minoritarios. Este tiempo de vida de los portadores en
exceso es el que se mide casi siempre en los experimentos diseñados para detectar la fotoconductividad de los portadores en exceso.
En las condiciones de nivel bajo, (1 0.2-27) y ( 10.2-28) muestran que en el caso
de un semiconductor tipo n fuertemente extrínseco, D* y p* se reducen a Dp y llp
y que, para un material tipo p fuertemente extrínseco, D* y p* se reducen a Dn Y
lln· Si se combinan estos resultados con los expresados en (10.2-30) y (10.2-31), se
puede escribir la siguiente expresión para las muestras extrínsecas tipo n
bp
c(t5p)
O(
D V 2(t5p)- p. E· V(bp) + g ' - - = - P
p
T Po
(no~ p0 ,t5p)
(10.2-32)
Comportamiento del transporte
3S7
y para muestras extrínsecas tipo p
(p 0 ~ n0 ,<5n). (10.2-33)
En cualquier caso, la concentración de la otra especie se obtiene de la relación
8p = 8n. Estas ecuaciones son muy parecidas a las de continuidad para el flujo de
portadores minoritarios. Los parámetros de transporte y recombinación, en todos los
casos, son los de los portadores minoritarios. A menudo se dice que en la situación
anterior, se escribe y resuelve la ecuación para los portadores minoritarios de flujo
de difusión, aunque esto no es cierto en realidad: las t::cuaciones (10.2-32) y (10.2-33)
además contienen una suposición implícita relacionada con el comportamiento de los
portadores mayoritarios.
En una muestra para la que n 0 y Po no son muy diferentes y en donde 8p es
mucho menor que el valor más pequeño de (n 0 , p 0 ), los coeficientes de transporte
ambipolar, (10.2-27) y (10.2-28), son constantes y se puede expresar como
D* =(no + Po)DnDp = (p~ + nf)DnDp
n 0 Dn + p0 DP
nfDn + p~DP
(10.2-34)
y
(10.2-35)
El coeficiente de difusión ambipolar se acerca a Dp para p 0 ~ n¡ y a Dn para
p 0 ~ n¡. Para valores intermedios de Po, D* queda en algún punto entre estos dos
valores extremos. De igual manera, para p 0 ~ n¡, p.* tiende a Jl.p y, para p 0 ~ n¡, p.*
tiende a - P.n, quedando entre estos límites para valores intermedios de p 0 . Para un
material que es precisamente intrínseco, Po = n¡ y las ecuaciones anteriores se reducen a
y
p.~=
o,
(10.2-36)
de donde, la ecuación de continuidad (10.2-26) se convierte en
(10.2-37)
En realidad, para un material precisamente intrínseco, se observa en (10.2-27)
y ( 10.2-28), que esta es la ecuación de continuidad correcta para 8p sin importar lo
grande que sea 8p en comparación con n 0 o p 0 • De la misma manera, se puede ver
que esta ecuación de continuidad es aproximadamente correcta para los materiales
casi intrínsecos, siempre y cuando la densidad de portadores en exceso 8p tenga un
exceso muy notable en relación ecn h1 densidad de los portadores mayoritarios en
equilibrio, ya que en es'te caso, p.* se hace siempre muy pequeño. Como se verá en un
capítulo posterior, este hecho sunplifica enormemente el análisis de las estructuras
de dispositivos semiconductores en condiciones de corriente elevada. El hecho de
que p.* tienda a cero en muestras intrínsecas, no significa que los electrones y los
358 Exceso de portadores en semiconductores
huecos no adquieran una velocidad de arrastre cuando se aplica un campo eléctrico,
sino solamente que una distribución de la concentración de portadores en exceso no tiene
arrastre en estas circunstancias. Los electrones y los huecos entran y salen de una distribución semejante aunque la distribución propiamente dicha pueda permanecer estacionaria o casi estacionaria.
Se debe tener cuidado de observar que el campo eléctrico E de las ecuaciones (10.2-26), (10.2-32) y (10.2-33), se relaciona con el campo eléctrico total como lo
defme (10.2-18), que incluye el campo interno originado por la difusión ambipolar y
el arrastre de las partículas cargadas del sistema. Se puede derivar una expresión
para este campo haciendo notar que la densidad total de la corriente eléctrica 1 se
puede escribir, con la ayuda de (10.2-8), (10.2-9) y (10.2-21}, como
1 = e(J,- Jn) = uE + e(Dn- D,)V(bp),
(10.2-38)
en donde a es la conductividad según la da (9.7-5). Resolviendo para el campo,
utilizando las relaciones de Einstein para expresar las constantes de difusión en los
términos de las movilidades e introduciendo la relación de movilidad b, se puede obtener
1 kT b- 1
E = - - - -b-- V(bp) = Eap.+ E;n 1•
q
e n +p
(10.2-39)
El primer término anterior es el campo que se crea al aplicar una fuente de potencial externo y el segundo representa el campo interno. Es evidente que el campo
interno, como se expresa en el segundo término, se desvanece cuando no existe un
gradiente de concentraCión de portadores y también, si las movilidades de huecos y
electrones son idénticas (b = 1). En el último caso, (10.2-27) y (10.2-28) dan D* =
D y p.*= [(n 0 - p 0 )/(n + p))p., en donde D y p. son el coeficiente de difusión de
huecos y electrones y la movilidad. Utilizando estos valores, se puede proceder a
resolver (10.2-26) usando para E el valor del campo aplicado y sin dar mayor interés
al campo interno.
Para materiales en los que las movilidades de los electrones y los huecos son
distintas, es evidente que el campo interno contribuirá al campo total E de
(10.2-26). Sin embargo, se verá que en la gran mayoría de los casos, se puede hacer caso
omiso de esta contribución. La razón es que, además de los efectos que se han
incorporado en los coeficientes de transporte modificados D* y p.*, el campo interno
ejerce ordinariamente sólo una pequeña influencia directa en la distribución espacial
de los portadores en exceso, en comparación con la de la difusión y los campos
aplicados. Esto se puede demostrar comparando las soluciones de (10.2-26) en donde
existe una difusión, pero no hay campo, y cuando se tiene un campo; pero esencialmente ninguna difusión. En el primer caso (suponiendo una geometría unidimensional en la que 8p varía en la dirección x, en que la velocidad de generación
volumétrica en exceso g' es cero y que prevalecen las condiciones de estado estacionario de tal modo que a(8p )jat = 0), la ecuación (1 0.2-26) se reduce a
(10.2-40)
Si sólo se buscan soluciones que tiendan a cero conforme x aumenta, se debe
escribir
(10.2-41)
Comportamiento del transporte
359
como la solución de (10.240). Por otro lado, si existe un campo constante E y si el
transporte de difusión puede omitirse, (10.2-26) se puede escribir aproximadamente
como
d(~p)
~p
dx = - p*E-r'
(10.2-42)
cuya solución es
(10.2-43)
De acuerdo con estas ecuaciones, es obvio que existe una longitud característica (D*r ) 1 / 2 asociada con el transporte puramente difusivo en el estado estacionario, y otra longitud característica p.*Er en este caso, en donde el efecto del campo
es predominante. Si el campo es cero, la segunda longitud será también cero. Queda
claro, de acuerdo con los resultados anteriores, que la distribución de portadores en
exceso resultante del transporte puramente difusivo, no se verá muy afectado por la
presencia de un campo eléctrico, a menos que dicho campo sea tan grande que
p*Er sea comparable en magnitud con la longitud característica de difusión
(D*r ) 1 / 2 . En otras palabras, si
(10.2-44)
ó
entonces, el efecto del campo eléctrico en la distribución de la concentración de
portadores en exceso será despreciable. Al incluir los valores de D* y p.* de
(10.2-27) y ( 10.2-28) y el valor del campo interno dado en (10.2-39), en esta
expresión, se puede obtener como condición para el gradiente de concentración que
IV(~p)l ~
1
(n + p)(nb + p)
.JD*t (b - 1)(no - Po)
(10.2-45)
para que el efecto del campo interno pueda omitirse en (10.2-26). En la práctica se
puede proceder inicialmente omitiendo el campo interno y calculando rrp a partir de
(10.2-26), utilizando el campo aplicado en el lugar de E. El gradiente de op se
calcula entonces basándose en la solución resultante y se comprueba con (10.245)
para asegurarse que la solución satisfaga esta condición en todos los puntos dentro
de la región de interés. Si se violara (10.245), la solución tendría que rechazarse y
sería necesario elaborar un nuevo cálculo en el que se incorporara el campo interno
desde el principio. En sistemas puramente difusivos, se verá que la solución tiene a
menudo la forma op = (const) e-xfL en donde L es aproximadamente (si no con
precisión) igual a (D*r ) 1 12 • En tales casos, el gradiente de op está dado por - opfL.
Se ve claramente en la forma de ( 10.245), que la condición que expresa esta
ecuación nunca se viola seriamente, sean cuales fueran los valores que puedan tener
n 0 , p 0 , op y b. Se pueden obtener valores mayores de V(~p) si hay un campo
aplicado presente; pero en estas circunstancias, aunque la condición ( 10.245) ya no
se satisfaga, se encontrará por lo general que el campo interno que se genera ahora
es pequeño, en comparación con el campo aplicado que se requiere para mantener
este estado. De donde, se puede llegar a la conclusión de que generalmente es buena
aproximación considerar que el campo E de la ecuación (10.2-26) es el campo
aplicado, sólo haciendo caso omiso del efecto explícito del campo interno. No obstante, se debe notar que el efecto del campo interno está implícitamente comprendido en los coeficientes de transporte modificados D* y p*.
360 Exceso de portadores en semiconductores
Las ecuaciones de continuidad (10.2-16) y (10.2-17) conducen directamente a
la ecuación diferencial ( 10.2-26) para fJp, cuando se hace la suposición de la neutralidad eléctrica. Cuando una expresión de fJp se ha obtenido como solución a
(10.2-26), la validez de la suposición de neutralidad eléctrica se puede corroborar
fácilmente computando la desviación de la neutralidad de carga para producir el
campo interno dado por ( 10.2-39) y comparando la diferencia en las densidades de
carga obtenidas de esta manera, con la densidad total de portadores excedentes que
se obtuvo en la solución (Hl.2-26). Usando (9.5-12), se puede escribir la ecuación
de Poisson (10.2-19) en función de las densidades de exceso fJn y fJp; si se usa
(10.2-20) y (10.2-39) para expresar el campo eléctrico, se obtiene
= 4ne(bp- bn) = kT ~ V 2 (bp).
V. E.
IRI
e nb + p
K
(10.2-46)
La razón de la diferencia de densidades fJp - fJn requerida para establecer el
campo interno a una densidad real, fJp se puede escribir como sigue
(10.2-47)
La expresión del lado derecho de esta ecuación debe ser mucho menor que la
unidad para que sea válida la suposición del balance de carga ( 10.2-21 ). Esta condición se puede expresar de un modo algo diferente m•lltiplicando el numerador y el
denominador anteriores por n¡. Por tanto, la condición para la validez de la suposición del balance de carga se convierte en
l)ni V (8p) 1
-lbp-bponl = L (bnb + p
op
~-=---
2
2
D,
~
(10.2-48)
en donde
(10.2-49)
¡:s un parámetro con las dimensiones de longitud, que se conoce como "longitud
intrísenca de Debye" asociada con el material. A 300°K, la longitud intrínseca de
Debye es aproximadamente 34¡.t para el silicio y 0.96¡.t para el germanio. Si, como
sucede con mucha frecuencia, la densidad de concentración en exceso tiene la forma
fJp = (const)e±xJL en donde L es una distancia característica de decaimiento que en
sistemas puramente difusivos tiene el valor (D*T) 1 12 , entonces, V2(f>p)fop = 1fL2 y
(10.243) se puede expresar como
bp - bnl = L~, (b - l)n; ~ l.
bp
L2 nb + p
(10.2-50)
'
Esto deja en claro que la suposición de la neutralidad eléctrica debe ser aceptable cuando la distancia característica L es mucho mayor que la longitud intrínseca de
Debye y cuando nb + p es mucho mayor que (b - l),li' Estas condiciones se satisfacen casi siempre en muestras intrínsecas o extrínsecas de silicio y germanio, a menos
que el tiempo medio de vida de los portadores en exceso, T, sea extremadamente
Algunas soluciones particulares de la ecuación de continuidad
361
corto. En los semiconductores compuestos de tipo III-V, como inSb y GaAs, los
tiempos de vida de los portadores, por lo general son muy cortos; para estos materiales, la condición (10.2-50) se satisface con frecuencia, aunque no siempre. Las
substancias semiaisladoras en las que nb + p, al igual que L pueden ser muy pequeñas, la condición ( 10.2-50) se viola la mayor parte de las veces y es necesario aplicar
otros métodos para analizar los problemas de los portadores agregados. En consecuencia, la situación es por lo general muy compleja, aunque Roosbroeck 5 desarrolló
una teoría muy general para el análisis de problemas de esta índole. Puesto que la
suposición del balance de carga es válida para la gran mayoria de los casos relacionados con los materiales semiconductores más conocidos, no se tomarán en cuenta
explícitamente las situaciones en que se viola.
10.3
ALGUNAS SOLUCIONES PARTICULARES
DE LA ECUACION DE CONTINUIDAD
A continuación convendrá examinar la forma que adquiere la solución de la
ecuación de continuidad en ciertos casos especialmente sencillos e importantes. En
primer lugar, se examinará lo que sucede en un cristal uniforme muy grande cuyas
fronteras, para fines prácticos, pueden suponerse en el infinito, en cuyo caso no se
tiene un campo aplicado ni una generación volumétrica de los pares electrón-hueco
en exceso. En el tiempo t = O se supondrá que de alguna manera se ha creado una
distribución espacial uniforme de densidad de portadores excedentes. En estas circunstancias V (op) = V 2 (lJp) =O, y, dado que el efecto de difusión es siempre reducir
más que crear gradientes de concentración, estas cantidades seguirán siendo cero en
todos los tiempos posteriores. En consecuencia, la ecuación (1 0.2-26) toma la formd
d(Jp)
Jp
----¡¡-= -"7.
(10.3-l)
Si T es independiente de op, esto se puede resolver fácilmente y se obtiene
Jp = p- Po= Ae-rtr
(10.3-2)
en donde A es una constante arbitraria que aquí es igual al valor de op en t = O. En
este caso, la densidad de portadores en exceso se pierde en todos los puntos de un
modo exponencial en función de una constante de tiempo T igual al tiempo de vida
de los portadores en exceso.
Otro caso de gran importancia es la solución de estado estacionario para una
muestra infinita en la que los portadores en exceso se crean a través de una fuente
uniforme plana de generación que, para mayor facilidad, se supondrá que coincide
con el plano yz. En este caso tampoco se tiene un campo aplicado o cualquier
generación de portadores en exceso en la muestra. En estas condiciones, la densidad
de portadores en exceso variará sólo a lo largo de la dirección x. Para simplificar las
cosas, se estudiará el caso de una muestra tipo n fuertemente extrínseca en la que la
densidad de portadores en exceso, en todas partes es mucho menor que la concentración de los portadores mayoritarios. En estas circunstancias, los coeficientes de
transporte D*, JJ*, y T se reducen a los coeficientes constantes Dp, Jl.p y T P relacionados
con los portadores minoritarios, y (10.2-26) se convierte en
s W. van Roosbroeck, Phys. Rev., 123 474 (1961).
362
Exceso de portadores en semiconductores
{10.3-3)
en donde
{10.3-4)
LP = JDPtP.
Las soluciones de {10.3-3) deben tener en todas partes la forma general
op = p(x)- Po= Ae"/Lp + Be-x/Lp
(10.3-5)
en donde A y B son constantes arbitrarias. Puesto que existe una fuente plana de
portadores ubicada en x =O en el plano yz, se tendrá cierto tipo de singularidad en
la solución en este punto, y es mejor considerar la solución de 8p en la regiór.
x <O (que se denominará 8p_(x)), y la solución en la región x >O {que se llamará
8p+(x)) independientemente. Por tanto, de acuerdo con esto y con (10.3-5), éstas
deben tener la forma
(x >0)
{10.3-6)
(x < 0).
(10.3-7)
y
op_(x) = p_(x)- Po= A_ex/Lp + B_e-x/Lp
Puesto que existe una velocidad de recombinación volumétrica diferente a cero.
las densidades de los portadores en exceso debe tender a cero al alejarse de la
fuente. Estas condiciones de frontera requieren que A+= B_ =O. Además, de acuerdo con la simetría geométrica de la situación, es evidente que 8p(x) debe ser una
función par de x, por lo cual, A_= B+ = A 0 y
op+(x) = P+(x)- Po = A 0 e-xfLp
(x > 0)
(10.3-8)
op_(x) = p_(x)- Po = Aoe"/Lp
(x < 0).
(10.3-9)
y
La concentración de electrones en exceso, de acuerdo con (10.2-21), es igual a la
concentración de huecos en exceso. En la figura 10.4 se muestran los perfiles de concentración resultantes. La concentración de portadores en exceso se pierde exponencialmente en ambos lados de la fuente, plana con una distancia característica de
decaimiento de Lp.
La corriente de difusión de los portadores minoritarios asociada con la distribución de portadores en exceso, se puede calcular a partir de {10.2-8) y es
J
(x) = -D d(op+) = AoDp e-x/Lp
P
dx
Lp
(x > O)
(10.3-10)
(x) = -D d(op_) = - AoDp e"'Lp
P
dx
L
p
(x < 0).
(10.3-11)
p+
J
p-
Conforme x tiende a cero a través de valores positivos, Jp+ se acerca a AoDp(Lp, en
tanto que conforme x se acerca a cero a través de valores negativos, Jp- tiende a
Algunas soluciones particulares de lo ecuación de continuidad
363
-x
Figura 10.4.
Concentraciones de electrones y huecos en estado estacionario dentro de un cristal
infinito en el que existe, en x =O, una fuente plana para la generación de portadores en exceso.
-AoDp/Lp. La diferencia entre estas cantidades es el flujo total de la fuente o el
número de portadores minoritarios por cm 2 por segundo, emitidos por la fuente. En
otras palabras,
(10.3-12)
en donde F 0 es el flujo de la fuente. Esta ecuación permite expresar el coeficiente
A 0 de ( 10.3-8) y ( 10.3-9) en términos del flujo F 0 cuando la fuente se describe en
función del flujo inicial emitido. Para una muestra que no es fuertemente extrínseca,
sino en la qae la densidad de portadores en exceso, en todos sus puntos es lo
suti.cientemente pequeña, las soluciones a (10.3-8) y (10.3-9) por supuesto son correctas todavía a condición de que Lp se substituya por medio deL*= (D*r) 1 12 •
Para comprender la naturaleza física del transporte ambipolar, conviene examinar en detalle los flujos de electrones .y huecos. que estan presentes en esta muestra
en particular. Con este fin se verá una muestra en la que la densidad de equilibrio
de los portadores es arbitraria, en lugar de ver un material extrínseco tipo n. En
general, habrá flujos de huecos y electrones que se originan de la difusión y, al
mismo tiempo, flujos de las dos especies de portadores, que se deben a la presencia
del campo interno como lo da (10.2-39). Si se observa que en la región
(x >O) op+ = A 0 e-xfL •, de donde, d(op+)fdx = - op+fL*, y utilizando las relaciones de Einstein (10.2-11), los flujos de huecos y electrones debidos a la difusión
se pueden escribir como sigue
J
d
p+
dp+
d(()p+)
p.,kT ()p+
=-D-=-D--=---P
dx
P
dx
e
L*
(10.3-13)
y
Jd
n+
= -D dn+ = -D d(()p+) = P.nkT ()p+
"
dx
"
dx·
e
L* .
(10.3-14)
Los flujos de huecos y electrones que se crean debido al campo interno (10.2-39)
son
(10.3-15)
364 Exceso de portadores en semiconductores
y
(10.3-1~
Los flujos totales de electrones y huecos se pueden encontrar ahora sumando la
componentes de la difusión y el campo interno. El resultado es
Jl.pkT b(n+ + P+) ~P+
Jp+ =Jn+ = - b
r* •
e
n+ + P+ LJ
{10.3-17)
De acuerdo con estas ecuaciones, la fracción del flujo total de las dos especies
de portadores que se debe a la difusión y a la presencia del campo interno se
puede calcular con suma facilidad. Se encontrará que
J~+
n+b + P+
-=
Jn+
n+ + P+
J~+
n+b + P+
Jp+ = b(n+ + P+)
J~+
{10.3-18)
P+(b- 1)
Jp+ = b(n+ + P+)
Es muy interesante examinar estas expresiones en los tres casos específicos:
materiales extrínsecos tipo n, en donde n+ ~ P+, materiales extrínsecos tipo p, en
donde P+ ~ n+ y el material intrínseco, en donde n+ = P+· En estos tres casos, las
ecuaciones (10.2-18) se convierten en
intrínseco (n+ = P+)
b+l
1.
'
2b
1
b'
O;
1--.
b;
1.
'
1- b;
o·'
b-l
2b
b+l
(10.3-19)
2
l-b
2
De acuerdo con estos resultados, es obvio que en las muestras extrínsecas, el
flujo de portadores minoritarios debidos al campo interno es insignificante en comparación con el flujo de difusión. Sin embargo, el flujo de portadores mayoritarios
debido al campo es importante. En efecto, este flujo debe ser tan grande que
asegure la casi neutralidad en todos los puntos. Por tanto, debe compensar el desequilibrio entre los flujos de difusión de portadores minoritarios y los mayoritarios
originados por la desigualdad de los coeficientes de difusión de los electrones y los
huecos. Esta situación se puede comprender mejor observando en (10.2-39) que, en
muestras extrínsecas, la magnitud del campo externo se hace muy pequeña debido al
factor nb+P del denominador que se hace muy grande en muestras extrínsecas. No
Algunas soluciones particulares de la ecUJJción de continuidad
365
obstante, el flujo de portadores mayoritarios que se produce debido al campo interno sigue siendo apreciable, ya que es proporcional al producto del campo interno
muy pequefio y la gran densidad de portadores mayoritarios. Por supuesto, el flujo
de portadores minoritarios debido al campo interno es extremadamente pequefio,
puesto que tanto el campo interno como la densidad de portadores minoritarios son
pequefios. Por otra parte, los flujos de difusión de los portadores mayoritarios y
minoritarios dependen sólo de los gradientes de concentración y los coeficientes de
difusión inherentes, tanto de electrones como de huecos, y, puesto que los gradientes de concentración de electrones y huecos son los mismos, deben ser comparables
en magnitud y difieren sólo en una cantidad proporcional a la diferencia entre las
difusibilidades inherentes de los dos portadores.
El estudio de esta situación puede llevar a explicar por qué en las muestras
extrínsecas, el coeficiente de difusión ambipolar es el coeficiente inherente de difusión de los portadores minoritarios. En estas condiciones, el campo interno es pequefio y puede crear flujos relativamente grandes de portadores mayoritarios; pero
se desecha su influencia en el flujo de portadores minoritarios. En consecuencia, el
flujo de portadores minoritarios se debe exclusivamente a la difusión de los portadores minoritarios y en esencia no se lo afecta el campo interno. El flujo de
portadores minoritarios observado, por ende es el que producen independientemente
los portadores minoritarios en difusión. Para que se satisfaga la situación de casi
neutralidad, el flujo de portadores mayoritarios debe ser el mismo. Parte de este
flujo se debe a la difusión de los portadores mayoritarios; pero, puesto que las
difusibilidades inherentes de las dos especies de portadores son desiguales, se tendrá
un déficit (o exceso) inevitable. Este déficit o exceso puede deberse al flujo de
portadores mayoritarios cuya fuente es el campo interno. El efecto neto es que los
flujos de electrones y huecos son iguales entre sí y al flujo que produciría una
distribución de portadores minoritarios difundiéndose imdependientemente; es así como se relaciona el -::oeficiente de difusión de la distribución de portadores en exceso
con los portadores minoritarios. Por tanto, en sistemas extrínsecos casi siempre se
requiere considerar explícitamente sólo el comportamiento de los portadores minoritarios. Por supuesto, en muestras que son intrínsecas o casi intrínsecas, es importante
el efecto del campo interno en los dos tipos de portadores. Este caso se ilustra en la
expresión (10.3-19) y a través de la dependencia de los coeficientes de transporte
ambipolar en relación con la difusibilidad o movilidad de electrones y huecos. Aunque estos resultados se vieron en conexión con una muestra específica más restringida,
es evidente que los principios físicos implícitos son los mismos en todos los sistemas
y que las conclusiones obtenidas tienen una aplicación general.
Ahora se puede constatar que los flujos de difusión de los portadores minoritarios (10.3-10) y (10.3-11) son los flujos totales de los portadores minoritarios en el
caso de una muestra extrínseca tipo n. En un cristal que no es extrínseco, los flujos
totales de electrones y huecos se pueden obtener de (10.3-17), escribiendo b = JJ.n/JJ.p
y usando las relaciones de Einstein, en la forma
(10.3-20)
Por supuesto, dado que en esta muestra no se tiene un campo aplicado, la corriente
eléctrica total 1 = e(JP + - J n +) es cero.
A continuación se estudiará la extensión de la solución precedente para el caso
en que existe un campo constante aplicado E 0 en la dirección positiva n. La ecuación diferencial (10.2-26) se puede escribir para el material extrínseco tipo n como
366
Exceso de portadores en semiconductores
d_2 (bp)
d(bp)
_ 0
_2_ _ f.1pEo
___
_ _ _bp
__
dx
DP dx
LP
o
(10.3-21'
Esta ecuacton se puede resolver utilizando las técnicas normales aplicables ¡
ecuaciones diferenciales lineales con coeficientes constantes, lo que da
i5p(x) = p(x)- Po= AeYp+xfLp + BeYp-x/Lp
(10.3-22)
en donde
(10.3-23,
y
(10.3-24)
Esta solución es la misma que (1 0.3-5) excepto que los argumentos de lO!i
factores exponenciales se multiphcan por los factores 'Yp+ Y - 'Yp-, que depender;
del campo eléctrico. De acuerdo con la definición dada antes, se ve claramente que.
sea cual fuere el valor que pueda tener E 0 , 'Yp+ debe ser siempre positivo, mientras
que 'Yp- debe ser siempre negativo; cuando 'Yp+ y 'Yp- se grafican en función del
campo, las dos cantidades se representan por medio de dos ramas de una hipérbola_
como se ilustra en la figura 10.5. Para 'YP = O, a un campo cero, ( 10.3-14) se reduce
f (Yp)
3
-3
Figura 10.5.
Gráfica de las funciones 'Yp+ y 'Yp-·
a la ecuación de la sección anterior. Para valores positivos grandes de 'Yp (y, por
ende, para campos tales que E 0 ;p 2kTfeLp), se puede demostrar con la ayuda de la
expansión binómica y (10.24) que
LP
--= ----
(10.3-25)
mientras que es obvio que, en estas circunstancias,
(10.3-26)
Algunas soluciones particulares de la ecuación de continuidad
Se puede ver claramente en (10.3-15) que
siempre por medio de
'Yp+ y 'Yp-
'l'p+'l'p- =-l.
367
están relacionados
(10.3-27)
Ahora se puede repetir el desarrollo del caso del campo cero que se da en las
ecuaciones (10.3-6) (10.3-12), suponiendo, como antes, que hay dos expresiones
separadas para l>p+(x) en la región x >O y l>p_ (x) en la región x <O, con los
coeficientes A+, B+, A_ y B_, y demostrando en Ia misma forma que A+ y B_
deben tomarse como cero para asegurar el comportamiento apropiado en ± oo. El
resultado se puede escribir como sigue
(x > O)
(10.3-28)
(x < O)
(10.3-29)
en donde A 0 es una constante arbitraria que expresa la intensidad de la fuente de
generación. La concentración de electrones en exceso será igual a la concentración
de huecos en exceso. En la figura 10.6 se ilustran los perfl.les de concentración para
un valor positivo de E 0 . Puesto que las características de transporte de la distribución de portadores en exceso son prácticamente las de los portadores minoritarios,
tenemos que el transporte de los portadores en exceso hacia la derecha (en dirección
del movimiento de los huecos bajo un campo aplicado) se ve favorecido por la
acción del campo, en tanto que se retrasa el transporte de portadores en dirección
opuesta. De acuerdo con ( 10.3-25), se puede verificar que (1 0.3-28) tiende al resultado que se obtuvo antes, (10.2-43), para campos grandes aplicados, como sería de
esperarse. Al igual que antes, los flujos de partículas portadoras minoritarias Jp+(x)
y Jp_(x) pueden calcularse a partir de (10.2-8); las contribuciones se obtienen
ahora tanto del término de difusión como del término del campo eléctrico. Parte del
flujo de partículas resultante se deberá al arrastre de los huecos que están presentes
en equilibrio térmico cuando, el campo está aplicado, y otra se deberá a la difusión
p(x), n(x)
- - - --------~
-------------Figura 10.6.
Concentraciones de electrones y huecos en un estado estacionario, dentro de un
cristal en el que existe, en x =O, una fuente plana de portadores en exceso y estando
presente un campo eléctrico constante en la dirección x.
368 Exceso de portadores en semiconductores
y al arrastre de la distribución de portadores en exceso. El flujo producido por este
último efecto, evaluado en el plano de la fuente, es
(10.3-30}
Esta ecuac10n es análoga a (10.3-12), que relaciona al coeficiente de amplitud Ao
con el número total de portadores por unidad de área por unidad d~ tiempo, Fop.
generados en el plano de la fuente. Cuando la muestra no es fuertemente extrínseca
y cuando la densidad de los portadores agregados es lo suficientemente pequefia, las
soluciones anteriores seguirán siendo válidas a condición de que Dp, JJ.p, Lp y r P se
substituyan respectivamente por D*, JJ.*, L * y r.
Las mismas observaciones que se hicieron sobre la relación de los flujos debidos a la difusión y a los campos internos en conexión con el caso libre de campo.
también se aplican en esta situación; por ejemplo, en una muestra extrínseca, el
flujo de portadores minoritarios producido por el campo interno es despreciable en
comparación con el flujo de difusión correspondiente, mientras que los flujos de los
portadores mayoritarios atribuibles a cualquiera de las dos fuentes tienen una magnitud comparable. Sin embargo, ahora se cuenta además con flujos grandes de los dos
tipos de portadores, comprendiendo tanto a los portadores en exceso como a los de
equilibrio, debido al campo aplicado. Estos flujos se superponen a los flujos producidos por la difusión y los campos internos; como resultado, la densidad total de la
corriente eléctrica ya no se desvanece, sino que por el contrario se representa por
medio de aEapl· En relación a esto, se debe observar que el ejemplo que se está
estudiando comprende sólo una situación en la que 8p es, en todos sus puntos,
mucho menor que la densidad de portadores mayoritarios en equilibrio. Puesto que
la densidad total de corriente eléctrica debe ser la misma en todas partes, una
situación en la que Dp es lo suficientemente grande para modular apreciablemente la
conductividad, implicaría un campo que no puede ser constante; pero que es grande
cuando Dp es pequeño y viceversa. Para valores pequeños de Dp, subsiste la misma
dificultad, pero las variaciones correspondientes del campo son tan pequeñas que el
planteamiento del campo constante constituye una aproximación aceptable. Por supuesto, existen muchas otras dificultades que se presentan cuando [)p se hace comparable a la densidad de portadores en equilibrio.
Como ejemplo final, se verá un sistema uniforme unidimensional en el que se
generan simultáneamente N pares de electrón-hueco en un punto x = x' al tiempo
t = t'. Se supondrá que la muestra se extiende al infinito en ambas direcciones a lo largo
de eje x y que se aplica un campo eléctrico constante E 0 . Por tanto, para una
muestra extrínseca tipo n, la ecuación ( 10.2-26) se convierte en
(10.3-31)
Una solución de esta ecuacwn, válida para todos los valores t > t' que satisfaga
todos los requisitos del problema es
_(
)_
op x,t -
t- t'] (10.3-32)
N _ __ exp [ - {(x- x')- JJ.pE 0 (t- t')} 2 - - - .
../4rrDp(t- t')
4Dp(t- t')
<p
_
Algunas soluciones particulares de la ecuación de continuidad
369
El hecho de que (10.3-32) satisface la ecuación diferencial (10.3-31), se puede establecer por substitución directa. 6 Se puede demostrar fácilmente que el valor inicial
op(x, O) es cero en todos los puntos excepto cuando x = x', punto en el que se hace
infmito. La distribución inicial de concentración, entonces corresponde a una función
o de Dirac. Para tiempos posteriores, la distribución tiene una forma gaussiana,
cuya anchura media aumenta con respecto al tiempo y cuya amplitud máxima decrece
con relación al tiempo. El punto de concentración máxima se desplaza también a lo
largo de la dirección del campo, a una velocidad JJ.pEo. La expresión (10.3-32) se puede
integrar sobre x entre los límites - oo y + oo (haciendo que u= (x- x')- JJ.pE 0 (t- t'),
de donde, du = dx, y t se considera constante) para obten~r el número total de huecos
en exceso oP en la distribución como una función del tiempo. El resultado es
i5P(t) = J~oo bp(x,t) dt =N e -(1-t')/rp.
(10.3-33)
Por tanto, el número total de portadores, que es N originalmente, desciende de
un modo exponencial con la .::onstante de tiempo T P, como podría esperarse. En la
figura 10.7 se ilustra el comportamiento de la concentración de portadores en exceso
en función de x y t.
8P(x,t)
8P (x,t)
t=O
t=O
-x
(al
Figura 1O. 7.
-X
(b)
(a) Dispersión difusiva de portadores en exceso inyectados inicialmente como una
distribución
en x =O, sin tener un campo eléctrico aplicado. (b) Dispersión
difusiva Y arrastre de la distribución en (a) aplicando un campo eléctrico constante en la dirección x. En ambos casos O <t 1 <t2 <t3 <t4 .
o
Si ahora se revisa la definición de N, la intensidad inicial de la fuente, tomando a N(x', t') dx' d t' como el número de huecos o electrones en exceso generados
en un intervalo d t' alrededor de t = t', dentro del elemento de espacio dx alrededor
de x = x', entonces, la concentración subsecuente debida a este elemento de generación en función de x y t se obtendrá substituyendo N de (10.3-32) con N(x',
t') dx' dt'; la distribución de concentración resultante debe marcarse como una función de x' y t', al igual que de x y t, es decir, se debe escribir como sigue:
6 La solución de (10.3-32) se puede obtener por medio de las técnicas de transformación
de Laplace o por la integral de Fourier.
370
Exceso de portadores en semiconductores
óp(x,t;x',t'). La concentración óp(x,t) que se ongma de una distribución arbitraria
conocida de generación cuya intensidad puede variar con las coordenadas del espacio
y el tiempo x', y t' se puede calcular superponiendo soluciones de esta forma, cada
una de las cuales se caracteriza por la intensidad de generación local N(x', t') dx' dt'.
Esta superposición de elementos infinitesimales, cada uno con su propia intensidad
de fuente local, lleva a una integral sobre dx' y dt' de la forma
bp(x,t) =
I
r foo
-oo
N(x',t')
[ {(x - x')- J1 E 0 (t- t')} 2 t - t']
, ,
exp P
- -dx dt .
-oo .j4nDp(t- t')
4Dp(t- t')
rP
(1 0.3-34)
Por supuesto, la integral se desarrolla sólo hasta t' = t, debido a que la generación futura no contribuye a la concentración observada al tiempo t. Naturalmente, la
solución anterior se aplica sólo a una muestra infmita en que la distribución de
concentración satisface la condición de frontera de que la concentración debe tender
a cero lejos de la fuente. Para muestras finitas, primero se deberá encontrar una
solución para una función ó de distribución de fuente inicial, por ejemplo, (10.3-32):
pero satisfaciendo además las condiciones de frontera apropiadas en las superficies de
la muestra. 7 Entonces se podría usar el mismo procedimiento de superposición para
obtener la solución de una distribución arbitraria de ~eneración con respecto a las
coordenadas del espacio y el tiempo para muestras de esta clase.
Este procedimiento se puede generalizar con cierta facilidad a sistemas tridimensionales. La solución para una generación instantánea de N(r', t') dv' dt' dentro
del elemento de volumen dv' alrededor del punto r = r' al tiempo t = t', describiendo la distribución de concentración subsecuente que se origina de este elemento
de generación inicial dentro de una muestra infmita, es
. , , _ N(r',t') du'dt' ex [- {(r- r')- J1pE 0 (t- t')} 2 _ t- t']
bp(r,t,r,t)-[4nDp(t-t')]f p
4Dp(t-t')
rP ·
(10.3-351
En este caso se puede verificar también que (10.3-35) es una solución para la
ecuación tridimensional de difusión correspondiente a {10.3-31) por medio de una substitución directa. La superposición de soluciones de la forma (10.3-35) ahora se puede
hacer en la misma forma que antes, dando como resultado una integral sobre la distribución de la fuente de generación de la forma
.
op(x,t) =
J' f
-oc
N(r',t')
[ {(r- r')- J1pE 0 (t- t')} 2 t- t'] 'd,
, t exp ,
- - - dv t .
v[4nDP(t-t)]
4Dp(t-t)
rP
Se descubrirá que casi todas las soluciones particulares de la ecuación de continuidad que se han descrito en esta sección, son útiles para estudiar trabajos experimentales relacionados con distribuciones de portadores en exceso o estructuras de
dispositivos semiconductores de importancia tecnológica.
7 Por lo general, la solución para una distribución inicial de fuente de una función ó se
cita como la función de Creen apropiada para un sistema dado y un conjunto particular de
condiciones de frontera.
Movilidad de arrastre y el experimento de Haynes-Shockley
10.4
371
MOVILIDAD DE ARRASTRE Y EL EXPERIMENTO
DE HAYNES-SHOCKLEY
El experimento de Haynes-Shockley se realizó originalmente para medir con
precisión y de un modo directo, la movilidad de arrastre de huecos y electrones en
cristales semiconductores. 8 Aunque tiene un gran interés debido a que fue la primera
medición directa 9 de la velocidad de arrastre de los portadores de carga, que se
realizó con verdadero éxito, también es muy instructivo para dilucidar el comportamiento de transporte de electrones y huecos en exceso en semiconductores, y también para demostrar las características básicas del funcionamiento del transistor, ya
que el circuito Haynes-Shockley es, en efecto, un tipo de transistor.
- ,,,,1-+----.
+o-+-------.
Generador
de pulsos
Batería
del colector
Señal Sincro·
.-+--+-o Osciloscopio
~~~~~~~~~----,~~~,~~~~
1
x=O
1
x=d
1111111-------1
L...---'llfl'.~-----1+
Batería
de barrido
Figura 10.8.
Diagrama esquemático del experimento de Haynes-Shockley.
Como se ilustra en la figura 10.8, en el experimento de Haynes-Shockley se
inyecta un exceso de portadores minoritarios al cristal y se recogen de éste mediante
un contacto de puntas de prueba metálicas. Aunque se debe posponer una descrip·
ción detallada de lo que sucede en un contacto rectificador de puntas de metal, en
la figura 10.9 se capta una idea general de su comportamiento. En esta ilustración se
describe una muestra de semiconductor en el que se ha establecido un contacto de
puntas de prueba y se ha formado una gran zona de contacto. El área grande de contacto,
que se puede haber fabricado apropiadamente por soldadura, una región de aleación
o por un contacto a presión, actúa como un contacto óhmico de la muestra y no
afecta considerablemente a la distribución de portadores en la muestra. Sin embargo,
la punta de prueba actúa como un contacto rectificador; cuando se polariza de tal manera
que atraiga hacia ella a los portadores minoritarios, actuará como un colector de portadores minoritarios vaciando la región del cristal adyacente a ella de estos portadores,
hasta que se llega a un estado estacionario en que los portadores minoritarios se
difunden desde el interior del cristal con la suficiente rapidez para satisfacer el
déficit causado por su desaparición en las puntas de prueba. En estas condiciones
J. R. Haynes y W. Shockley, Phys. Rev., 81, 835 (1951).
En contraste con el efecto de Hall que sólo admite la determinación indirecta de la
movilidad.
8
9
372
Exceso de portadores en semiconductores
--+---
+----=n-type =
+
Colecta huecos
corriente pequeña
Inyecta huecos
corriente grande
Colecta electrones
corriente pequeña
1nyecta electrones
corriente grande
(o)
(b)
(e)
(d)
1
1
==;;;:¡;of---v
DiaQramas de
cornente·voltaje
Figura 10.9.
tipo·n
tipa-p
(e)
( f)
Rectificador semiconductor con contactos de puntas (a) tipo n. con polarización
inversa, (b) tipo n con polarización directa, (e) tipo p con polarización inversa, (d)
tipo p con polarización directa, (e) característica corriente-voltaje del rectificador tipo
p de contacto de puntas.
(que se conoce como polarización inversa), esta corriente de portadores minoritarios
es la única que puede fluir por la punta de prueba y, puesto que es muy pequeño
el abastecimiento de portadores minoritarios del cristal, el flujo de la corriente se
reduce mucho y es relativamente independiente del voltaje de polarización, ya que al
suministro de portadores minoritarios no le afecta el cambio del voltaje de polariza.
ción inversa. Esta situación se ilustra en la figura 10.9(a) y (e) para materialeJ
semiconductores tipo n y p. Cuando el voltaje de polarización se invierte para atraer
a portadores mayoritarios a la punta de prueba, se encuentra que, además del flujo
de éstos hacia ella, se inyecta un exceso de portadores minoritarios a la muestra en
el contacto de puntas. En esta forma de operación, la corriente fluye con facilidad y
se pueden alcanzar flujos de corriente relativamente grandes con pequeños voltajes de
polarización. Se ha encontrado que la corriente aumenta de un modo más o menos
exponencial conforme se incrementa el voltaje de polarización, y no es difícil producir un número suficiente de portadores inyectados para modular con gran fuerza la
conductividad del semiconductor. 10 En la figura 10.9(b) y (d) se muestra el caso
de esta polarización directa. Las relaciones corriente-voltaje para cristales tipo n y
tipo p se ilustran en el mismo conjunto de diagramas en (e) y (f), respectivamente. El
efecto de rectificación por contacto de puntas, como se presenta en (e) y (f), en efecto
proporciona una prueba muy sencilla para distinguir los cristales semiconductores tipo n
de los tipo p.
lO Debe recordarse que un exceso de concentración de los portadores mayoritarios siempre debe ir acompañado de una distribución de portadores minoritarios en exceso. Los portadores mayoritarios necesarios para conservar la neutralidad eléctrica abundan en el volumen dd
cristal de donde se extraen atraídos mientras se forma la distribución de portadores minoritarios
en exceso. Cualquier déficit resultante en la concentración de portadores mayoritarios en d
volumen se contrarresta inmediatamente con los portadores mayoritarios obtenidos por el contacto metálico óhmico.
Movilidad de arrastre y el experimento de Haynes-Shockley
373
En el experimento de Haynes-Shockley se inyectan portadores minoritarios en
el emisor e de la f:tgura 10.8. La muestra tiene la forma de una barra larga y delgada, y se
establece un campo eléctrico mediante una batería externa que, por supuesto, hace que
fluya una corriente ls por la muestra. Este campo eléctrico barre los portadores minoritarios inyectados dentro de la muestra, pasando por un segundo electrodo ubicado a una
distancia conocida d del primero, que se polariza de un modo inverso, de tal manera que
actúa como colector de portadores minoritarios. Cuando no se tienen portadores en exceso en el colector, la única corriente que fluye en dicho electrodo es una pequefia corriente de saturación que se debe a la recolección de portadores minoritarios de equilibrio
que realiza la punta de pruebas. Conforme la distribución de portadores minoritarios
inyectados pasa por el colector, la concentración de éstos en su cercanía va en
aumento y el número de ellos que se recoge allí por unidad de tiempo asciende
proporcionalmente. Si el trazo del osciloscopio se inicia en el momento en que se
inyecta originalmente el impulso de portadores, no se observará nada en la pantalla
hasta que la distribución de portadores en exceso haya llegado al colector, tiempo
en el que la corriente de colector se incrementará y se observará un impulso de
sefial en el osciloscopio.
Puesto que la concentración de portadores en exceso es una función de la
distancia x en la dirección de la muestra, es básicamente la que se da en (10.3-32) y
que se ilustra de un modo gráfico en la figura 10.7(b), es evidente que el máximo
de la distribución de concentración se desplaza también, con una velocidad igual a
JL*E0 , en donde JL* es la movilidad ambipolar y E 0 es el campo aplicado. (En
(10.3-32) se supone que las condiciones son tales que D* y JL* son iguales a Dp y
Jlp; pero es posible que esto no pueda aplicarse a todos los casos.) Parece que el
tiempo t 0 requerido para que el máximo del impulso de concentración atraviese la
distancia conocida d entre el emisor y el colector es
d
d
1 ----0 - v- Jl*Eo
(10.4-1)
Jl * =dtoEo
(10.4-2)
lo cual da
Si las condiciones son tales que JL* es igual a - Jln o Jlp (es decir, si la
muestra es fuertemente extrínseca), este experimento permite medir con precisión la
movilidad de arrastre de los portadores minoritarios.
Desafortunadamente el impulso que llega al colector no es perfectamente agudo, sino que más bien es ancho debido a la difusión, como se ve en la figura
10.7(b). Esto no causa dificultades en las mediciones; pero origina ciertos errores en
la interpretación de los datos, a menos que se tenga un cuidado extremo. Pues lo
que realmente se ve en la pantalla del osciloscopio no es una gráfica de la concentración en función de la distancia en un tiempo fijo dado, sino una gráfica de la
concentración en un punto específico en función del tiempo, 8p(d,t). Una medición
del máximo de esta curva no representa exactamente el tiempo de arrastre, a menos
que se arreglen las condiciones del experimento de tal suerte que se produzca un
mínimo de dispersión por difusión, conforme la distribución sufre un arrastre entre ~
el emisor y el colector. Por ejemplo, supóngase que el campo aplicado es cero.
Entonces, la distribución de portadores en exceso se difundirá como se indica en la
figura 10.7(a). Sin embargo, aunque no haya un campo aplicado en este caso, se ve
claramente en la figura que se observará un máximo de la concentración como
función del tiempo, en un punto x = d. En el ejemplo presentado en esa figura, el
máximo se produce más o menos en t = t 3 • Este máximo se observa simplemente
porque el transporte por difusión por sí solo basta para mover el exceso de porta-
374
Exceso de portadores en semiconductores
dores perteneciente a la distribución, del emisor al colector y luego más allá. Este
efecto conduce a la observación de un tiempo de arrastre finito en ausencia de UD
campo que, de acuerdo con (10.4-2) corresponderá a una movilidad infinita. Evidentemente, si lo que significa tiempo de arrastre t 0 es el lapso que transcurre entre la
inyección y la observación del valor máximo obtenido por op(d,t), según lo cla
( 10.3-32) (y que es lo que en realidad se mide en el trazo del osciloscopio), entonces, la ecuación ( 10.4-2) no puede ser correcta tal y como está expresada.
En realidad, la ecuación (10.4-2) es más o menos correcta siempre que l2
dispersión por difusión de la distribución de portadores sea razonablemente pequeña
durante el tránsito del emisor al colector. Estas condiciones se pueden efectuar
experimentalmente mediante el uso de campos aplicados muy grandes que, no obstante, producen efectos de calentamiento graves a menos que se recurra a técnicas
de pulsos muy laboriosas. Una alternativa es derivar una expresión correcta para el
tiempo de tránsito a partir de (10.4-2) que toma totalmente en cuenta la difusión
para llegar a una expresión modificada 11 de la forma
(10.4-31
en donde
x = 2kT (~ + ~).
eE 0 d r
2
(10.4-41
Por supuesto, es necesario conocer el tiempo de vida de los portadores en
exceso T para utilizar esta fórmula; sin embargo, como se verá más adelante, esta
cantidad se puede determinar fácilmente mediante una simple medición independiente. Los detalles del cálculo de (10.4-3) quedan asignados como ejercicio para el
lector.
En el capítulo 13 se demostrará cómo el funcionamiento del transistor se
puede explicar y comprender basándose en el experimento de Haynes-Shockley. Si se
mide tanto la dispersión de la difusión, como el tiempo de tránsito, se puede determinar
el coeficiente de difusión D* al igual que la movilidad de arrastre, aplicando la técnica
Haynes-Shockley. Esta posibilidad se ha utilizado 12 para verificar experimentalmente la
relación de Einstein en muestras de germanio muy extrínsecas.
10.5
RECOMBINACION SUPERFICIAL Y CONDICIONES
DE FRONTERA SUPERFICIALES
Si el efecto de las superficies de un cristal fmito tuviera como único fin
confmar a los portadores de carga al interior de la muestra, entonces la condición de
frontera que la distribución de portadores de carga en exceso tendría que satisfacer
en las superficies de la muestra sería simplemente que las corrientes de electrones y
huecos deben desvanecerse en las superficies. Sin embargo, la situación no es tan
sencilla, ya que los portadores de carga pueden recombinarse err la superficie por
medio de mecanismos que son muy independientes de los que regulan las velocidades
11
J. P. McKelvey, J. Appl. Phys., 27, 341 (1956).
Transistor Teachers Summer Schooll (Bell Telephone Laboratories), Phys. Rev., 88.
1368 (1952).
12
Recombinación superficial y condiciones de frontera superficiales
375
de recombinación de los portadores de carga en el interior de la muestra. En estas
circunstancias, la superficie actúa como un absorbedor parcial de electrones y huecos, y puede haber una corriente neta que fluye hacia las superficies de la muestra.
A primera vista, se podría pensar que, puesto que los electrones y los huecos
pueden recombinarse en la superficie de un cristal, debe haber una deficiencia en la
concentración de portadores de carga cerca de la superficie, que produciría una
corriente difusiva de portadores hacia la superficie, aun en el estado de equilibrio
térmico. No obstante, esto no sucede debido a que, además de la recombinación, la
generación térmica de pares electrón-hueco se produce también en la superficie y, en
condiciones de equilibrio térmico, la velocidad de generación es idéntica a la velocidad con la que los pares de portadores se recombinan en la superficie. Por tanto,
no existe un flujo neto hacia la superficie ni se produce cambio alguno en las
concentraciones de la regtón de la superficie en condiciones de equilibrio térmico. 13
Esta situación es un ejemplo específico de un principio muy general de la mecánica
estadística, denominado el principio del balance detallado o el de la reversibilidad
microscópica. Este principio establece que en la condición de equilibrio térmico,
cualquier proceso microscópico dado y su proceso inverso debe producirse a la
misma velocidad. Ya se encontró antes un ejemplo de la validez de este principio
cuando se comprobó que la velocidad de recombinación volumétrica en equilibrio de
pares electrón-hueco y la velocidad de generación térmica volumétrica son iguales.
La situación actual, en que la velocidad de recombinación superficial y la de generación térmica superficial son iguales en la condición de equilibrio, sirve sólo para
ilustrar la misma ley general. Por supuesto, debe hacerse notar que el principio del
balance detallado se aplica sólo al estado de equilibrio térmico. En el ejemplo que se
estudia, la velocidad de generación térmica superficial es una función exclusiva de la
temperatura y es muy independiente de las concentraciones locales de portadores de
carga, en tanto que la velocidad de recombinación depende clara y directamente de
las concentraciones locales de portadores. Si la concentración local de los portadores
de carga excede el valor del equilibrio térmico, la velocidad de recombinación superficial sobrepasará la velocidad de generación superficial y como resultado se tendrá una
absorción neta de portadores en la superficie que, a su vez, establecerá un flujo por
difusión de portadores hacia ella. Si se tiene una deficiencia de concentración de
portadores en exceso en la cercanía de la superficie, también se producirá un flujo
por difusión de portadores en exceso térmicamente generados que se aleja de la
superficie. Por supuesto, se pueden hacer observaciones similares en relación al flujo
de portadores en el volumen, que se originan por excesos o deficiencias locales en
las concentraciones volumétricas de portadores. Es importante comprender que estas
conclusiones generales son válidas independientemente de los mecanismos en particular implicados en los procesos de generación y recombinación.
El efecto de la recombinación superficial sobre la distribución de portadores de
carga dentro de la muestra se puede investigar ahora, considerando el intercambio de flujo
entre la superficie y la región interior de la muestra, como se ilustra en la figura 10.10. Se
principiará definiendo el coeficiente de reflexión superficial R 0 como la probabilidad
de que un solo portador, en una sola colisión con la superficie, sea devuelto al
interior del volumen en lugar de ser absorbido por recombinación. La probabilidad
correspondiente de recombinación, por tanto es 1 -- R 0 • De igual manera, el coefi13 Este enunciado se aplica al modelo simple de la superficie que se está viendo. Existen
cambios en la concentración de portadores en equilibrio cerca de la superficie asociados con una
capa de carga espacial superficial, originada por la presencia de estados superficiales, en la superficie física real de la muestra como se verá más adelante. El punto de vista sencillo aquí
adoptado casi siempre es adecuado para un estudio fenomenológico de la recombinación superficial.
376
Exceso de portadores en semiconductores
Flujo incidente
neto
Flujo que se desarrolla debido a la
generación térmica superficial
A
F,8
-X
Concentración local de
portadores en la región
de la superficie: P,
interior: coeficiente
de reflexión B
Figura 10.10.
Superficie: coeficiente
de reflexión Ro
Diagrama de flujo que ilustra el intercambio de flujos entre el interior y la
superficie.
dente de reflexión volumétrica B se define como la probabilidad de que un portador, al entrar al interior del cristal, proveniente de la superficie, reaparecerá en ésta
en el curso de su desplazamiento aleatorio a través del material antes de recombinarse en el interior. Se supone que estos coeficientes son independientes de los
flujos o las concentraciones de portadores. Entonces, se puede considerar el sistema
de flujos establecido entre la superficie y el interior, como se ilustra en la figura
10.10. Se supone que hay un flujo neto de partículas de magnitud A, que se origina
en el interior, y el flujo de generación superficial gs está dirigido de la superficie al
interior del cristal. La superficie del cristal de la figura 10.1 O se muestra separada
del interior para ilustrar con claridad el intercambio de flujos entre estas dos; pero.
por supuesto, las dos regiones son físicamente contiguas en realidad. El flujo total
F 1 , que va del interior a la superficie, y el flujo inverso total F ~ se pueden obtener
observando que F 1 se compone del flujo incidente A más la parte de F; que es
reflejado por el volumen, de donde,
(10.5-1)
De igual manera,
(10.5-2)
Estas dos ecuaciones se pueden resolver para F 1 y F;, y dan
F _A+ Bg,
1 -
l-R 0 B
(10.5-3)
y
, _ g, + AR 0
F¡
1- R 0 B
(10.5-4)
Ahora se puede demostrar fácilmente que, para una distribución de partículas
libres que obedece a la estadística de Boltzmann, el número de partículas por unidad de tiempo que cruza una superficie plana de área en cualquier dirección, es
Recombi1lllción superficial y condiciones de frontera superficiales
377
pCJ4, en donde pes la concentración local de partículas. 14 En el estado de equilibrio
térmico, la concentración de partículas es p 0 en todos los puntos y
F 1 = F; = p 0 c/4.
(10.5-5)
Estos valores de F 1 y F; se puede substituir en (10.5-3) y (10.5-4) y el par de
ecuaciones resultantes se resuelve para g8 y A 0 , que es el valor del flujo incidente A
en condiciones de equilibrio térmico, lo cual da
Po e
g.= --¡-(1- R0 )
(10.5-6)
Po e
A 0 = --¡-(1- B).
(10.5-7)
y
Ya se vio en el argumento anterior que, en el estado de equilibrio térmico, F 1
y F; tienen el valor común pc/4. Si existe una desviación del equilibrio térmico
producida por un flujo por difusión establecido por un gradiente de concentración, y
si esta desviación del estado de equilibrio es tan pequeña que la distribución de
Boltzmann sigue siendo más o menos correcta en todos los puntos del sistema,
entonces, F 1 y F 1' ya no serán iguales. En estas circunstancias, se debe tener en
c"Uenta el flujo positivamente dirigido que llega al punto x 0 y que se originó, en
promedio, a una distancia del orden de la trayectoria libre media "corriente arriba"
y el flujo negativamente dirigido que llega al mismo punto y que se originó a una
distancia promedio del orden de la trayectoria libre media "corriente abajo". Entonces, el flujo con dirección positiva F; se puede escribir como sigue
[
,(ap) ]:¡·e
F¡ = p(xo)- ::XA ax xo
(10.5-8)
en donde a es una constante numenca del orden de la unidad, ya que la cantidad
entre paréntesis angulares representa, aproximadamente la concentración local en el
punto en que se originó el flujo que llega a x 0 • De igual manera, el flujo con
dirección negativa F 1' se puede escribir como
(10.5-9)
Es obvio que la ~urna de los flujos debe ser, entonces,
(10.5-10)
en donde p es la concentración local, independiente del gradiente de concentración,
con tal que la función de distribución no se perturbe seriamente de su forma en
equilibrio.
Si se usa (10.5-10) para expresar la suma de los flujos F 1 y F; en la región
de la superficie y, si se usan las expresiones (10.5-3), (10.5-4) y (10.5-6) para
representar F 1 , F; y g8 , se obtiene
14
Por ejemplo, véase el ejercicio 7 que aparece al final del capítulo 5.
378
Exceso de portadores en semiconductores
p.c _ F
T -
1
+
F' _ A(1 + R 0 ) p0 c (1 - R 0 )(1 + B)
1 1 - R0 B + 4
1 - R0 B
'
(10.5-11)
en donde Ps representa la concentración en la cercanía de la superficie. Por supuesto, se debe recordar que, aunque g8 tiene el mismo valor que en el estado de
equilibrio térmico, esto no se aplica a A, cuya magnitud depende de la naturaleza de
la distribución de portadores en exceso que pueda estar presente en el volumen. En
efecto, la ecuación (10.5-11) debe resolverse para A, de tal modo que dé
p.c 1 - R 0 B
A=---2 1 + R0
Poc (1 - R0 )(1 + B)
4
1 + R0
(10.5-12)
F:
es el flujo neto de portadores que, si no se tiene
La diferencia entre F 1 y
un campo eléctrico, como se supondrá, es igual a la corriente neta de difusión
-Dp(o(fJp)/ox) evaluada en las superficies. Si se escribe la expresión para F 1 - F 1'.
usando (10.5-3) y (10.54) para representar los flujos y a (10.5-6) y (10.5-12) para
representar los valores de g8 y A, se puede obtener, después de numerosas operaciones algebraicas complejas, pero directas,
F 1 _ F~ = A(l - R 0 ) _ g.(l - B) =(p.- p 0 )c 1 - R 0 = -DP(i!(bp)).
1 - R0 B
1 - R0 B
1 + R0
2
ox
(10.5-13)
s
En realidad, esta ecuación es un enunciado de la condición de frontera superficial que se debe aplicar a la ecuación de continuidad. Esto se puede expresar
convenientemente en la forma
-Dp (
iJ(bp))
---a;-
S=
S. (bp).
(10.5-14)
en donde
e 1- R 0
S=----.
21 + R 0
(10.5-15)
Los subíndices s indican que las cantidades implicadas se evalúan en la superficie. Por lo general, la constante s se denomina la velocidad de recombinación
superficial; su relación con el coeficiente de reflexión más fundamental está dada por
(10.5-15). La condición superficial de frontera (10.5-14) se puede expresar en forma
vectorial más general como sigue
-DP[n • V(bp)]. = s · (bp).,
(10.5-16)
en donde n es un vector unitario saliente, normal a la superficie.
Si no existe una recombinación superficial, R 0 = 1 y s =O, de acuerdo con
(10.5-5). En este caso, (10.5-14) da o(óp)/ox =O, correspondiente a la condición en
que no se tiene un flujo neto difusivo hacia la superficie. Si los portadores se recombinan inevitablemente al llegar a la superficie, Ro =O y s =e /2; evidentemente,
este valor es un límite superior para la velocidad de recombinación superficial.
No obstante, en este caso restrictivo es muy común hacer que s = oo en (10.5-14),
que equivale a hacer que la concentración de portadores en exceso de la superficie
(óp)8 sea cero. Se puede demostrar que esta aproximación, que facilita enormemente
los cálculos, es apropiada, a condición de que Dp/Lp ~ C/2. Para el germanio a
300°K, DP ~SO cm 2 /seg, e~ 107 cm/seg, y Lp es casi siempre mayor que 10- 3 cm;
Fotoconductividad de estado estacionario
319
por tanto, la condición queda perfectamente satisfecha y este constituye un ejemplo
típico. A decir verdad, las circunstancias en las que se viola el requisito se presentan
muy raramente y, por tanto, casi siempre se justifica adoptar la condición de frontera s = oo ó (8p )8 = O en el límite superior de la recombinación superficial. Se
asignará como ejercicio para el lector, un ejemplo que demuestre con claridad el
origen de la condición que se acaba de ver. En todos los casos intermedios en los
que la probabilidad de recombinación no es ni cero ni la unidad, se debe usar la
condición de frontera de la forma (10.5-14). Todos los cálculos anteriores se desarrollaron en relación con un exceso de huecos en un material tipo n; pero, por supuesto, se pueden aplicar observaciones exactamente iguales a los electrones en exceso en
un semiconductor tipo p.
En el germanio se pueden obtener coeficientes de reflexión muy elevados
(-0.99999) correspondientes a velocidades de recombinación superficial del orden de
100 cm/seg, en muestras cuyas superficies se han preparado mediante un cuidadoso
proceso de ataque químico. En muestras cuyas superficies han quedado muy dañadas
por pulimento u otra acción abrasiva, existen muchas dislocaciones y otras imperfecciones de red en la superficie que pueden actuar como centros de recombinación.
En tal caso, la velocidad de recombinación superficial puede sobrepasar a 105 cm/seg,
correspondiendo esto a un valor de menos de 0.99 para el coeficiente de reflexión.15 En el silicio, la velocidad de recombinación superficial es casi siempre
mucho mayor en superficies atacadas químicamente, por ejemplo un valor típico sería
más o menos 2000 cm¡ seg.
10.6
FOTOCONDUCTIVIDAD DE ESTADO ESTACIONARIO
Para ilustrar la aplicación de algunos de los principiOs que se vieron en las
secciones anteriores, se procederá a calcular la respuesta de fotoconductividad en
estado estacionario, de una muestra uniforme de semiconductor que se ilumina con
una radiación de una longitud de onda lo suficientemente larga que permita ser
absorbida sólo ligeramente al pasar por el cristal; pero, al mismo tiempo, lo suficientemente corta para crear una concentración medible de pares electrón-hueco. Por
tanto, una longitud de onda apropiada quedará justamente en el lado de las longitudes de onda largas del borde de absorción en la posición A. 1 de la figura 10.l(a).
Se supondrá que esta muestra tiene la forma de un sólido rectangular cuyas dimensiones son x 0 , Yo, z 0 , y cuyo espesor x 0 es mucho menor que las otras dimensiones
Yo y z0 , y que la iluminación es incidente a lo largo de la dirección x, como se ilustra en
la figura 10.11. Las dos superficies grandes de la muestra se han preparado en la misma
forma para producir la misma velocidad de recombinación superficial s en ambos lados. Si
el coeficiente de absorción es relativamente pequeño, se puede considerar que la intensidad de la luz es más o menos uniforme en todo el cristal. Esto llevará a una
velocidad de generación de portadores en exceso g, que es constante y proporcional
a la intensidad de la luz. En una muestra larga y delgada del tipo que se ilustra, la
concentración de portadores en exceso varía esencialmente sólo en la dirección x, lo
cual permite utilizar la fórmula unidimensional de la ecuación de continuidad. Puesto
15 El coeficiente de reflexión Ro casi siempre está muy cerca de la unidad en el caso del
germanio y el silicio, incluso en muestras cuyas superficies están muy raspadas. Sin embargo, en
muchos casos el efecto de una velocidad de recombinación de lOS cm/seg correspondiente a
R 0 = 0.99, se podrá distinguir apenas de la condición en que s = c/L. y R =O.
380 Exceso de portadores en semiconductores
Iluminación
jjJ 1
~z/
í0T''
============~:::::JI \Con~uctor de
t:'
,, 1 1 1 '""''""
Iluminación
Figura 10.11.
Geometría del experimento de fotoconductividad que se analizó en la sección 10.6.
que no existen campos en la dirección x y, dado que en la condición de estado
estacionario o(f>p )fot = O, la ecuación ( 10.2-26) toma la fonna
(10.6-1)
en donde g' es constante. Al escribir la ecuación de esta forma, se está suponiendo que se
trata de un material extrínseco tipo n y que f>p es pequeña en todas partes en comparación con la densidad de portadores mayoritarios.
La solución de esta ecuación se puede expresar como la solución general de la
ecuación homogénea (10.3-3) más una solución particular de (10.6-l). Es evidente
que f>p =g'L~/Dp =g'rp es justamente una solución particular de (10.6-1) y que la
solución general de (10.6-1) se puede escribir como sigue
X
X
LP
LP
bp(x) =A cosh- + B senh- + g'rP.
(10.6-2)
Debido a la geometría simétrica de la muestra que se ilustra en la figura 10.11,
f>p(x) debe ser una función par de x, en donde B =O y (10.6-2) se convierte en
bp(x) =A cosh ~ + g'rr
(10.6-3)
Lp
Si a esta ecuación se aplica la condición superficial de frontera (10.5-16) en
cualquier superficie ( x =
±;o) se puede evaluar la constante y se obtiene
A
A=
-sg'rP
x0
D
x0
2LP
2LP
s cosh -
+ ..J!. senh LP
(10.6-4)
Fotoconductividad de estado estacionario
y
op(x) = g'tp 1 [
l
scosh L
.
Xp
x0
DP
x0
s cosh- +- senh2LP LP
2LP
381
(10.6-5)
El perftl de concentración op(x) se ilustra en la figura 10.12(a) para diferentes
valores de s.
Sp(x)
Lp
Lp
2
(a)
Figura 10.12.
(b)
(<t) Perfiles de concentración dentro de la muestra ilustrada en la f~gura 10.11
para s =O, s =oo y varios valores intermedios de s. (b) Respuesta de fotoconductividad OC/C 0 en función del espesor x 0 graficada para varios valores de s.
El cambio en la conductancia debido a la presencia de portadores en exceso
será proporcional al número total de portadores en exceso que están presentes en la
muestra. Si se usa oP para representar el número total de huecos en exceso y oN
para la cantidad total de electrones en exceso, entonces,
f
xo/2
oP = oN = y 0 z 0
(10.6-6)
op(x) dx,
-xo/2
en donde y 0 z 0 es el área superficial de la cara iluminada de la muestra. Si se
emplea (10.6-5) para representar op(x) en (10.6-6), la integral se puede evaluar
fácilmente de tal modo que dé
oP = oN = 2yozog'tp [ Xo-
l
sLPsenh 2L
Xo
D p
•
Xo
P
Xo
s cosh- + - senh2LP LP
2LP
(10.6-7)
El elemento diferencial de conductancia entre los electrodos extremos asociados
con. una hoja delgada del material, con un espesor dx, está dado por
382
Exceso de portadores en semiconductores
de = u(x) da = z0 u(x) dx .
Yo
Yo
(10.6-8)
u(x) = u 0 + bu(x) = u 0 + e¡J.Pbp(x)(b + 1),
(10.6-9)
de= Zo [u0 + e¡J.p(b + 1)<5p(x)] dx.
Vo
(10.6-10)
Sin embargo,
de donde,
Al integrar esta ecuación entre los límites x = ± x 0 /2 se obtiene
Z
X
Z
e=~ U o + ~ e¡J.p(b + 1)
Yo
Yo
fxo/2
bp(x) dx.
(10.6-11)
-xo/2
No obstante, el primer término anterior es la conductancia de equilibrio
área/longitud) en tanto que en el segundo, la integral se puede expresar en
función de óP mediante (10.6-6). Haciendo esta substitución en (10.6-11) se puede
escribir como
(= a0 •
e= eo + epp(b ~ l)bP = Co + i)C.
Yo
(10.6-12)
Entonces, el cambio relativo de conductancia se puede expresar como óCfe0 •
en donde e0 = uozoxo/Yo, en donde,
be e¡J.p(b + l)(jP
-=
u0 V
(10.6-12)
en donde óP está dada por ( 10.6-7) v V = x 0 y 0 z 0 es el volumen de la muestra. En
la tigura 10.12(b) se ilustra la fotoconductancia óC/e0 graficada en tunción del
espesor de la muestra para diferentes valores de s. Por supuesto, para s =O, la
cantidad óP y, por ende, óe es independiente del espesor de la muestra x 0 . Para
s >O, la fotoconductancia es muy pequeña en muestras delgadas, ya que en este
caso, los portadores se pueden difundir con gran rapidez hasta la superficie y recom·
binarse allí. Para muestras más gruesas, los portadores del interior llegan a la superficie sólo después de una gran difusión y la recombinación superficial tiene mucho
menos efecto en la conductancia general. En el límite x 0 --+ oo el efecto de la superficie se vuelve insignificante. Es evidente que si las dimensiones de la muestra, Dp, la
velocidad de generación g' y una de las cantidades (s, Lp) son factores conocidos, s
o Lp, cualquiera que se desconozca, se puede medir en este experimento. Si se usan
dos muestras diferentes, idénticas en todo excepto el espesor, se pueden determinar
tl'•itO s como LP. La principal dificultad en el uso del efecto de fotoconductividad
..te estado estacionario, como técnica para determinar s o Lp, consiste en conocer la
velocidad absoluta de generación g', la cual es difícil determinar en cualquier experimento. Esta dificultad se elimina si, por el contrario, se mide la fotoconductividad
transitoria. En la siguiente sección se hace un análisis de este efecto.
Fotoconductividad transitoria
10.7
383
FOTOCONDUCTNIDAD TRANSITORIA; TIEMPO DE VIDA
DE LOS PORTADORES EXCEDENTES
En esta sección se estudiará el decaimiento transitorio de la fotoconductividad
producida por una radiación penetrante en la muestra, exactamente como la que se
vio en la sección anterior. Se supondrá que la fuente de luz ha generado una
densidad de portadores p 1 (>p 0 ) que es uniforme en todos los puntos dentro de la
muestra en el tiempo t = O, instante en que la radiación de excitación se corta
bruscamente. Entonces, ( 10.2-26) describe el decaimiento subsecuente de la distribución de portadores en exceso hasta el estado de equilibrio, descrito por (10.2-26)
que, para este caso toma forma
o2 (bp) bp(x,t) o(bp)
D -------P
ox 2
rp
ot .
(10.7-1)
Las condiciones de frontera 16 superficiales son
o(bp))
-DP ( = sbp(x 0 /2,t)
OX xo/2
y
a(op))
DP (- OX
= sbp( -x 0 /2,t),
(10. 7-2)
-xo/2
además también se requiere que,
bp(x,O) = p 1 = const
(10. 7-3)
lim bp(x,t) =O.
(10.7-4)
bp(x,t) = e-' 1'Pu(x,t)
(10.7-5)
y
Al hacer la substitución
la ecuación (10.7-1) se puede transformar en una ecuación diferencial para u(x, t) de
la forma
(10. 7-6)
en tanto que las condiciones de frontera se transforman en
- DP(:~)
X
= su(x 0 /2,t);
xo/2
DP(~u)
uX
=su( -x /2,t)
0
-xo/2
(10.7-7)
y
u(x,O) = p 1 = const
(- X 0
/2 < X < X 0 /2).
(10. 7-8)
16 Aunque para llegar a la forma (1 0.5-16) se supuso una condición de estado estacionario
en la condición de frontera, es evidente que esta condición de frontera se puede usar también en
situaciones dependientes del tiempo, a condición de que la concentración de portadores de carga
en la superficie no cambie mucho en el tiempo requerido para que se establezca el flujo de
equilibrio entre la superficie y el volumen. Siempre se supondrá que esta condición se satisface.
384 Exceso de portadores er¡ semiconductores
A continuación se buscarán soluciones producto de la forma
u(x,t) = X(x)T(t).
{10.7-9)
Al substituir esta forma para la solución en {10.7-6) se observa que
1
d2X
1
dT
- - - -2 = - - - -- = -a 2 = const.
X(x) dx
DPT(t) dt
(10.7-10)
Los dos lados de la ecuación anterior deben ser iguales a una constante, pcr
separado, ya que sólo en esta forma puede una sola ecuación de x y una sola
ecuación de t ser iguales para todos los valores posibles de x y t. La constante se
escribe como -a:2 , de manera que, para cualquier a: real, será negativa; esto es
necesario (como se comprobará en breve) para tener la seguridad de que (10.7-4) quede
satisfecha. Para la dependencia del tiempo de la ecuación anterior, es obvio que
(10.7-11)
de donde
{10.7-12)
Para la dependencia espacial, se tiene
(10.7-13)
por lo cual
X(x) = A cos ax + B sen ax.
(10.7-14)
Por la simetría del problema, está claro que la dependencia espacial de la
concentración de portadores en exceso debe ser siempre una función par de x. Sin
embargo, una función sinusoidal o cualquier superposición de funciones sinusoidales,
es invariablemente impar en tanto que un coseno o cualquier superposición de cosenos es par. Evidentemente, este requisito físico se puede satisfacer sólo mediante una
función coseno o por una superposición de funciones coseno. Por tanto B debe
hacerse igual a cero en (10.7-14). De acuerdo con (10.7-9), (10.7-12) y (10.7-14), es
obvio que una solución apropiada debe tener la forma
u(x,t) =X(x)T(t) = Ae-tz 2 Dpt cos ax.
{10.7-15)
Esta solución por sí sola satisface la ecuación diferencial (10.7-6); pero no
satisface las condiciones de frontera (10.7-7) y (10.7-8). No obstante, se puede
desarrollar _una superposición lineal de soluciones de esta forma tales que
(10.7-16)
n
n
que sigue satisfaciendo la ecuacton diferencial, y se está en libertad de seleccionar
los valores An y an de tal modo que la superposición satisfaga las condiciones de fron-
Fotoconductividad transitoria
385
tera. En cada ténnino de la suma de (10.7-16), se requiere que se satisfaga la condición
de frontera superficial
(10.7-17)
entonces, por supuesto, las condiciones de frontera superficiales (1 O. 7-7) quedarán
satisfechas automáticamente por dicha superposición. 1 7 Substituyendo una solución de
la forma (10.7-15) en lugar de un en (10.7-17), se encuentra que para satisfacer
(10.7-17), se debe tener
(10.7-18)
de donde, cxn debe escogerse en tal forma que se satisfaga la ecuación
ctn CXnXo
- - = rxnDp
- - = (J.nXo
- - (2D 1sx 0 )
2
S
2
(10.7-19)
P
Las raíces de esta ecuación se pueden obtener numérica o gráficamente como la
intersección de las curvas f(cxx 0 )=ctn(+cxxo) y f(cxxo)=(fcxxoX2Dp/sxo), como se
oiJustra en la figura 10.13.
Ahora se tratará de satisfacer la condición de frontera (10.7-8). Se intentará
lograrlo seleccionando valores de An de tal suerte que, en t =O, la suma de todos
los valores de Un(X, O) se sumen para formar una representación tipo Fourier del
perfil de concentración inicial requerido. Para lograr esto, supóngase que u(x, O) es
una función par arbitraria 18 f(x), de tal modo que
00
u(x,O) = L A" cos cx"x = f(x).
(10.7-20)
n=O
f (ax 0 1
,. a 1x0
-2-
Figura 10.13.
Diagrama que ilustra la determinación de las raíces de (10.7-19) mediante la
solución gráfica de la ecuación trascendental.
17 Obsérvese que si u(x, t) es una función par de x, si se da una de las condiciones de frontera,
(10.7-7), se da la otra.
18 Si f(x) no fuera par, sería necesario admitir soluciones de la forma Bnexp(- ai,Dpt)
sen a,.x en la superposición, junto con la función coseno que se está usando.
386
Exceso de portadores en semiconductores
Si los dos lados de esta ecuación se multiplican por cos OtmX y se integran
sobre e! intervalo ( -x0 /2 < x < x 0 /2), el resultado es
Lf
n
xo/2
An COS OCnX COS OCmX dx =
-xo/2
fxo/2
j(x) COS OCmX dx.
(10.7-21)
-xo/2
Si el conjunto de funciones cos OtnX es ortogonal en el intervalo (- x o /2 < x <
x 0 /2), todas las integrales del lado izqUierdo de esta ecuación se desvanecen excepto
aquella para la que n = m, que se evalúa con facilidad. En estas circunstancias, al
resolver para A m, se puede demostrar que
(10. 7-22)
Esto deja ver que, puesto que se trata de un caso especial del problema de
Sturm-Liouville, las funciones {cos ocna} deben formar un conjunto ortogonal. 19 En
cualquier caso, no es difícil demostrar directamente que, a condición de que los
valores de Otn se escojan de tal manera que satisfagan ( 10.7 -19), las funciones
{cos ocna} son ortogonales. Los detalles de esta demostración quedan como ejercicio
para el lector.
Para el caso presente, se debe escoger f(x) = p 1 =constante y, con esta selección, la integral de (10.7-22) se puede evaluar fácilmente y se obtiene
OCnXo
4p 1 sen - 2-
A
=----n
OCnXo +Sen OCnXo
(10.7-23)
de donde,
f(x) = p 1 = 4p 1
(10.7-24)
Ahora se puede encontrar u(x, t) substituyendo el valor anterior para An en
(10.7-16) y luego se puede obtener óp(x, t) a partir de (10.7-5). El resultado final es
(10.7-25)
Cuando s--* O, la pendiente de la línea recta que aparece en la figura 10.13 se
hace extremadamente grande y los valores propios {ocna} tienden a (O, 2rr, 4rr, 6rr •••
Para este conjunto de valores, sen (Otna/2) =O para todos los valores de Otn y todos
los términos de la suma de (10.7-25) se desvanecen con la excepción del primero.
En el caso del primer término, tanto el numerador como el denominador desaparecen dando origen a una forma indeterminada. Utilizando la regla de L'Hopital se
puede demostrar que
r
19 R. V. Churchill, Fourier Series and Boundary Value Problems. Nueva York: McGrawHill (1941), páginas 46-5 2.
Fotoconductividad transitoria
1
ct 0 x 0
sen - 2-
lim
ct x
2cos - 02-0
aoxo~O IXoXo +Sen IXoXo
=
387
lim
aoxo~O 1 + COS IXoXo
1
(10.7-26)
= -,
4
por lo cual,
(10.7-27)
(s = 0).
En la figura 10.14(a) se muestra el perftl de concentración para este caso,
graficado para varios valores de t. Es obvio que la concentración sigue siendo la
misma en cualquier tiempo dado, en todos los puntos de la muestra.
Si s-+ oo, la pendiente de la línea re.:ta de la figura 10.13 tiende a cero y los
valores propios {1X"a} tienden a (7T,37T,S7T,77T, ... ) en el límite. En este caso, (10.7-25)
se convierte en
(2n + 1)rrx
oo
bp(x,t) = 4p 1 e-' 1'P
L
( -1)" cos
x0
(2n + 1)1!
n=O
[ (2 n + 1)2 rr zv Pt ]
exp • (10.7-28)
2
Xo
que es una serie ordinaria de Fourier. En este caso, cuando x = ± x 0 /2, op es cero
ya que cos (n + )11 = O. El perfil de concentración para este caso aparece graficado
en la figura 10.14(c). Para valores intermedios de s, los valores {a"} deben determinarse numérica o gráficamente y cuando se grafican los resultados, deben producir
perftles de concentración como los que se presentan en la figura 10.14(b).
La fotoconductancia real se puede obtener a partir de op(x,t) por medio de
(10.6-12) y (10.6-6), de acuerdo con lo cual,
+
bC(t) ef.J.p(b + 1)
fxo/ 2
-- =
V
· y0 z 0
bp(x,t) dx,
Co
-~
2
(10.7-29)
-xo/2
1=0
1 =O
1=0
,,
t,
t,
/z
lz
13
13
/4
14
o
S=O
(a)
Figura 10.14.
ao
~
2
xo
-2
o
S>O
(b)
xo
2
Xo
-2
o
S=oo
Xo
2
(e)
Perfiles de concentración dentro de la muestra para diferentes valores de t, (a)
pata s =O, (b) para s>O, (e) paras= o..>. En todos los casos O< t 1 < tz <r3 <14·
388 Exceso de portadores en semiconductores
o bien utilizando (10.7-25) y evaluando la integral
Esta expreswn es una suma de los términos, cada uno de los cuales tiene su
propia amplitud característica y cada uno de los cuales decae exponencialmente con
respecto al tiempo con una constante de tiempo distinta. Esto se puede escribir en
la forma
(lO. 7-31)
en donde Cm es la amplitud del mésimo modo de decaimiento 20 definido por
(10.7-30) y en donde cada constante de tiempo exponencial se puede expresar como
(10.7-321
Puesto que ao es el miembro más pequeño del conjunto{IX.}, la constante de
tiempo T 0 debe ser mayor que cualquiera de las otras; es más, la forma del factor
de amplitud Cm que multiplica a cada término es tal que las amplitudes de los
términos más altos son más pequeñas que la del primero. m resultado es que los
modos de orden más alto desaparecen con mayor rapidez que el de orden cero y.
después de un tiempo lo suficientemente largo, el decaimiento se puede representar
como una simple exponencial con la única constante de decaimiento del modo
principal r 0 , como se ilustra en la figura 10.15. Evidentemente, si el logaritmo de la
respuesta fotoconductiva se grafica en función del tiempo, se obtiene una línea recta
después que los efectos de los términos de modo más alto de (10.7-30) han desaparecido. La pendiente de esta línea es 1/r 0 , en donde
In
.!f.
Co
.. 1
Figura 10.15.
Logaritmo de la respuesta fotoconductiva transitoria en
·ión del tiempo.
20 El subíndice m se adopta aquí para evitar cualquier confusión posible con el tiempo de
vida del electrón, T n·
Fotoconductividad transitoria
389
(10.7-33)
Existen dos términos en el lado derecho de esta ecuación; el primero de ellos
representa al efecto de la recombinación volumétrica sobre la constante de tiempo
del modo principal observado, y el segundo, el efecto de la recombinación superficial. El tiempo de vida observado r 0 es más breve que el tiempo de vida volumétrico real r P a menos que la velocidad de recombinación superficial sea. cero •. en
cuyo caso, como ya se indicó antes, a 0 = O. Aunque por lo general es nnpoSible
reducir s a cero, de un modo experimental, se puede producir el mismo efecto,
como se señala en la figura 10.13, acomodando las condiciones del experimento de
tal modo que 2Dp/sx 0 sea mucho menor que la unidad. Esto se puede lograr
utilizando una muestra muy gruesa. En estas condiciones, los portadores generados
en el interior deben difundirse una distancia mayor hasta la superficie, cuyo papel es
mucho menos importante que en una muestra delgada, y el tiempo de vida observado r 0 se aproxima al tiempo de vida volumétrico rea! r P.
Si se conocen los tiempos de vida volumétrico real r P y el de vida observado,
la velocidad de recombinación en la superficie se puede evaluar resolviendo (1 O. 7-33)
para a 0 , insertando el valor obtenido en (10.7-19) y despejando s. El resultado es
(10.7-34)
Esta fórmula también se puede usar para obtener el tiempo de vida volumétrico real, si se conocen el tiempo de vida observado y la velocidad de recombinación superficial.
Si se desconocen inicialmente tanto r P como s, se pueden determinar trabajando primero con una muestra gruesa cuya superficie se trata en tal forma que se
minimice la recombinación superficial; el decaimiento fotoconductivo transitorio asociado con este tipo de muestra se aproximará a rP. A continuación, la muestra
gruesa se puede cortar en otras más delgadas y las superficies de éstas se deben
tratar a fin de obtener las condiciones apropiadas para medir la velocidad de recombinación superficial. La constante de decaimiento r 0 se mide entonces, y s se saca
directamente de ( 10.7-34) empleando el valor de r P obtenido previamente. Otra
posibilidad es cortar dos muestras de diferentes espesores de un material con un
tiempo de vida uniforme. Las superficies de las dos muestras se tratan de tal modo
que se obtengan las condiciones en las que se desea hacer la medición de s, y se
determine el tiempo de vida observado relacionado con cada muestra. Después, la
ecuación (10.7-34) se puede escribir para cada muestra y las dos ecuaciones se
resuelven numéricamente para las dos cantidades desconocidas r P y s. Un tercer
método consiste en utilizar sólo una muestra y ajustar los valores de r P y s en
( 10.7-30) de tal manera que se reproduzca no sólo la constante de tiempo del modo
principal observado r 0 (que, después de todo se puede obtener en otras combinaciones diferentes de r P y s), sino también el patrón de decaimiento inicial del modo
más alto que se observó. Aunque el análisis matemático requerido es complejo, este
método tiene la ventaja de que emplea una sola muestra y con esto se minimizan las
dificultades que producen las heterogeneidades en el tiempo de vida volumétrico y
las velocidades de recombinación superficial.
390 Exceso de portadores en semiconductores
10.8
MECANISMOS DE RECOMBINACION; LA TEORIA
DE RECOMBINACION DE SHOCKLEY-READ
En esta sección se investigarán brevemente los aspectos físicos de la recombinación electrón-hueco. Es importante comprender los procesos físicos asociados con !a
recombinación directa de electrón-hueco, así como en la recombinación por atrapamiento, aunque se ha descubierto que esta última es el mecanismo dominante en
la mayoría de las situaciones relacionadas con semiconductores covalentes o intermetálicos lii- V.
En la recombinación directa, un electrón de la banda de conducción y un
hueco de la de valencia se recombinan sin la participación de ningún estado intermedio. Si las bandas de conducción y valencia tienen separación mínima de energía
en k = O, entonces es posible que se produzcan transiciones verticales en las que un
electrón cercano a la parte superior de la banda de valencia puede recombinarse con
un hueco que está cerca de la base de la banda de conducción. Puesto que en d~cha
transición se debe conservar la cantidad de movimiento, sólo los electrones y los
huecos cuyos vectores k satisfacen la relación
(10.8-1)
pueden interactuar de esta manera. En el proceso se emite 21 un fotón cuya frecuencia w está dada por
(10.8-21
En la figura 10.16(a) se ilustra este proceso de transición directa. La absorción de
un fotón acompañada de la producción de un par electrón-hueco, se puede llevar a
cabo mediante un proceso que es precisamente la inversa de éste. En substancias
tales como el germanio y el silicio, en donde el mínimo de la banda de conducción
ocurre a un valor de la cantidad de movimiento del cristal k 0 que no es cero, la
recombinación de un electrón en el mínimo de la banda de conducción y un hueco
en la parte superior de la banda de valencia, requiere (además de la producción de
un fotón) la emisión de un fonón con una constante de propagación k'= k 0 o la
absorción de un fonón ya presente con una constante de propagación k' = -k 0 , para
que pueda conservarse la cantidad de movimiento del cristal. Este es el proceso que
se conoce con el nombre de transición indirecta. La energía que hubiera portado el
fotón en una transición directa, es ahora el fonón el que la lleva (o la proporciona).
La frecuencia de la radiación asociada con este tipo de transiciones está dada por
(10.8-31
en donde e' (k0 ) es la energía asociada con un fonón cuyo número de onda es k 0 •
según se obtuvo de la relación de dispersión w(k) para las vibraciones de red, como
sigue,
s'(k 0 ) = hw(k 0 ).
(10.8-4)
21 En (10.8-1), la cantidad de movimiento que se lleva el fotón emitido se ha desechado
Esto se justifica debido a que la longitud de onda del electrón (para una energía promedio kn.
como lo señala la expresión (8.4-1), es mucho menor que la longitud de onda del fotón para
w ~ .t.E/h. Por supuesto, las cantidades de movimiento están asociadas con la longitud de onda
respectiva por medio de la relación de De Broglie, (4.9-7).
Mecanismos de recombinación; la teoría de Shockley-Read
391
-k
-k
(a)
Figura 10.16.
(b)
Recombinación electrón-hueco a través de (a} una transición directa y (b} una
transición indirecta.
Aunque la energía e'(k0 ), es pequeña en comparac10n con la energía de la
banda prohibida, !!.e, es perceptible a través de su influencia en la forma de la curva
de absorción, en función de la longitud de onda cerca del borde de absorción.
También en este caso, la absorción de un fonón para producir un par electrón-hueco
se puede considerar como la inversa de este proceso. En realidad, puesto que el
fonón emitido o absorbido puede pertenecer a la rama acústica o a la óptica y
también puede ser de una vibración transversal o longitudinal, existen cuatro fonones
separados que pueden participar en dicho proceso, cada uno de los cuales poset> una
frecuencia diferente y, por ende, una energía e' distinta para k= k 0 . Los efectos de
los cuatro fonones se pueden observar en los espectros de absorción de esta naturaleza del semiconductor, cerca del borde fundamental de absorción. Por supuesto, las
transiciones directas también se pueden producir en materiales en donde el mínimo
de la banda de conducción no está en k = O; pero sí es apreciable la diferencia de
energía en el borde de la banda de conducción, entre el punto de energía mínima y
k = O, la población de electrones para energías correspondientes a k = O será normalmente tan pequeña que tales transiciones son muy poco frecuentes. Del mismo
modo, las transiciones directas de absorción requerirán energías del fotón incidente
que sean mucho mayores que las que se necesitan para promover las transiciones
indirectas. En condiciones normales, las transiciones indirectas son predominantes en
todo los semiconductores elementales covalentes y los semiconductores de compuesto
de los grupos III y V con la sola excepción de InSb, en el que el mínimo y el
máximo de las bandas de conducción y valencia, están en k = O.
En cualquier caso, se puede calcular la velocidad a la que se producen las
transiciones del espectro óptico de absorción observado del material22 y, por tanto,
inferir la velocidad de recombinación y el tiempo de vida de los portadores en
22 En el estado estacionario, las velocidades de generación y recombinación de los pares
electrón-hueco deben ser iguales; por esta razón, el cálculo de la velocidad de generación deberá
dar también la velocidad de recombinación. Sin embargo, para los pares electrón-hueco producidos por una excitación óptica directa, la velocidad de generación para cualquier longitud de
onda de fotón incidente debe ser proporcional al coeficiente de absorción para dicha longitud
de onda. La curva de absorción óptica y la velocidad de recombinación originadas en procesos
de recombinación directa, entonces están íntimamente relacionadas.
392
Exceso de portadores en semiconductores
exceso, basándose en el espectro de absorción. Van Roosbroeck y Shockley23 fueron
los primeros en efectuar este cálculo y encontraron que, por ejemplo, en el germanio, el tiempo de vida de los portadores en exceso a la temperatura ambiente, debe
ser aproximadamente 0.75 seg, independienten1ente de la densidad de impurezas donadoras y receptoras. Las evidencias experimentales contradijeron este resultado; los
tiempos de vida observados de los portadores en exceso raramente excedieron 1o- 3
seg, y se encontró que eran muy sensibles a la concentración de impurezas don'ldoras o receptoras. También quedó bien establecido en la práctica, que los tiempos
de vida de los portadores en exceso en el germanio y el silicio se podían reducir
drásticamente introduciendo ciertas impurezas, por ejemplo, el cobre, en concentraciones muy pequeñas y mediante la introducción de ciertas imperfecciones estructurales, por ejemplo, dislocaciones. Además, el cálculo de Van Roosbroeck-Shockley
predijo la dependencia del tiempo de vida de los portadores en exceso en función de
la temperatura, lo cual no se observó experimentalmente. Se demostró que en casi
todos los materiales, los tiempos de vida de los portadores en exceso no se veían
limitados por las transiciones radiactivas del tipo que se vio antes, sino más bien por
algún otro proceso íntimamente relacionado con la presencia de ciertos tipos especiales de átomos de impurezas e imperfecciones estructurales en pequeñas concentraciones. Estos resultados hicieron que se estudiara la recombinación por el atrapamiento de electrones y huecos a través de niveles de energía localizados que se
ubican en la parte profunda dentro de la banda de energía prohibida y que se pensó
estaban asociados con ciertas impurezas y defectos estructurales "de atraparniento ··.
Shockley y Read 24 fueron los primeros en investigar este mecanismo.
La teoría Shockley-Read de la recombinación incluye un estudio de las estadísticas de ocupación de dichos niveles de atrapamiento. Aquí se verá detalladamente
el comportamiento de un nivel de energía a una energía er dentro de la región de
energía prohibida, que es neutra cuando está vacía y que puede ocuparla cualquier
electrón, adquiriendo con ello una carga negativa. Estas trampas pueden promover la
recombinación electrón-hueco, capturando electrones de la banda de conducción y
transfiriéndolos subsecuentemente a la de valencia, siempre que aparezca un hueco
cerca de la trampa para recombinarse con el electrón atrapado. El efecto neto es
desaparecer el par electrón-hueco con lo que el nivel de atrapamiento vuelve finalmente a su estado original. Puesto que el centro de atrapamiento está casi siempre
acoplado de un modo firme a la red, la energía y la cantidad de movimiento que pertenecieron inicialmente al electrón y al hueco pueden convertirse en vibraciones de red. En
este proceso se emite muy poca o ninguna energía electromagnética. Existen cuatro pro-
::T T _l_ T
Ev
(o)
Figura 10.17.
23
24
( b)
+
+
(e)
(d)
Cuatro procesos fundamentales comprendidos en la recombinación por medio de
trampas; (a) la capt,ua de un electrón de conducción hecha por una trampa
vacía, (b) la emisión de un electrón desde la trampa hasta la banda de conducción, (e) la captura de un hueco de la banda de valencia efectuada por una
trampa que contiene un electrón y (d) la promoción de un electrón de valenc~a
a una trampa inicialmente vacía.
W. van Roosbroeck y W. Shockley, Phys. Rev., 94, 1558 (1954).
W. Shockley y W. T. Read, Jr., Phys. Rev.• 87, 835 (1952).
Mecanismos de recombinación; la teoría de Shockley-Read
393
cesos básicos comprendidos en la recombinación electrón-hueco a través de los centros de
atrapamiento, como se ilustra en la figura 10.17: (a) la captura de un electrón de la banda
de conducción que realiza una trampa vacía inicialmente neutra, (b) la inversa de (a),
incluyendo la emisión de un electrón que ocupaba en un principio un nivel de atrapamiento, a la banda de conducción, (e) la captura de un hueco en la banda de valencia realizada por una trampa que contiene un electrón y (d) la inversa de (e)_ en donde se
promueve un electrón de valencia hacia una trampa inicialmente vacía (esto también
puede considerarse como la emisión de un hueco desde la trampa hasta la banda de
valencia).
En estas circunstancias, la velocidad a la que los electrones de la banda de
conducción son capturados por las trampas, es claramente proporcional al número de
electrones de la banda de conducción y a la cantidad de trampas vacías disponibles
para recibirlos. Esto se puede escribir como sigue
(10.8-5)
en donde Cn es una constante y Nt representa la concentración total de centros de
atrapamiento en el cristal. Del mismo modo, la velocidad a la que los electrones se
emiten desde trampas llenas hasta la banda de conducción, será proporcional al
número de trampas llenas y, por tanto, se puede expresar como
(10.8-6)
en donde En es otra constante de proporcionalidad. De acuerdo con el principio del
balance detallado, en el estado de equilibrio estas dos velocidades deben ser iguales,
de donde,
(10.8-7)
Al substituir en esta expresión el valor explícito de la función de Fermi fo de
(5.5-20), se obtiene la relación muy simple
(10.8-8)
Si se substituye el valor dado por (9.3-6) para n 0 , (10.8-8) se puede escribir,
finalmente, como
(10.8-9)
en donde
(10.8-10)
Al escribir (10.8-9) y (10.8-10), se está suponiendo que la distribución de
electrones en la banda de conducción es de tipo maxwelliano. La cantidad n 1 es la
concentración de electrones que estaría presente en la banda de conducción, si el
nivel de Fermi coincidiera con el nivel de atrapamiento €t. La velocidad neta a la
que se capturan los electrones de la banda de conducción es sólo la diferencia entre
(10.8-5) y (10.8-6) que, usando (10.8-9) para expresar En en función de Cn, es
(10.8-11)
394
Exceso de portadores en semiconductores
Así también, la velocidad a la que se capturan los huecos de la banda de
valencia debe ser proporcional a la concentración de huecos y al número de trampas que
pueden recibir huecos (y, por ende, la cantidad que está ocupada por electrones)
entonces
(10.8-12)
La velocidad a la que los huecos se emiten a la banda de valencia desde los
centros de atrapamiento [proceso ( d) de la figura 10.17] es proporcional a la cantidad de trampas ocupadas por huecos (es decir, vacías), de acuerdo con lo cual
(10.8-13)
Igual que antes, en el estado de equilibrio, Rcp debe ser igual a Rep y
razonar1do de un modo análogo a como se hizo al derivar (10.8-9), se puede demostrar que
(10.8-14)
en donde,
(10.8-15)
Nuevamente, p 1 puede considerarse como la concentración de huecos que se
encontraría en la banda de valencia si el nivel de Fermi se localizara en la energía
del nivel de atrapamiento. La velocidad neta a la que los huecos se capturan desde
la banda de valencia se puede expresar como
(10.8-16)
Cuando hay centros de atrapamiento presentes, ya no es posible normalmente
suponer que 8n = 8p, a pesar de que se mantiene la neutralidad eléctrica general.
debido a que algunos electrones, que de otra manera estarían presentes en la banda
de conducción como parte de 8n, ahora pueden estar inmovilizados en las trampas.
incapaces de funcionar como electrones de conducción. Esta situación origina ciertas
dificultades cuando la densidad de los centros de atrapamiento es grande, y Shockley
y Read analizaron esta situación detalladamente. No obstante, si NP es muy pequeño, la aproximación 8n = 8p sigue siendo aceptable. 25 Se supondrá que este es el
caso, y en la mayoría de las condiciones de interés práctico en semiconductores
covalentes este requisito se satisface. En una muestra en la que los portadores en
exceso se recombinan en estas condiciones, se debe tener Rp = Rn, ya que cada
recombinación de electrón va acompañada de la recombinación de un hueco. La
velocidad común de recombinación se relaciona con eJ tiempo de vida r por medio de
(10.8-17)
Si se iguala (10.8-11) a (10.8-16) y se resuelve para f(e 1 ), se obtiene
(10.8-18)
25 Shockley y Read demostraron que 8n ~8p siempre que cualquiera de las cuatro cantidades, no, Po, n¡ y p¡ sea grande en comparación con N.
Mecanismos de recombinación; la teoría de Shockley-Read
395
Al substituir este valor ya sea en (10.8-11) o en (10.8-16) y observando que
niPI = nl, es evidente que
(10.8-19)
Si ahora se escriben = n 0 + 8p, p =Po + 8p, la ecuación anterior se puede exp1
en la forma
1
N,(Po + no + ~P)
1
-(no+ n¡ + ~p) +e (Po+ PI+ ~p)
1
ep
~ar
(10.8-20)
n
En el límite en que n 0 ~8p, p 0 , ni, PI es evidente que (10.8-20) se reduce a
1
= tpo =e N .
t
p
(10.8-21)
t
El tiempo de vida de los huecos en una muestra tipo n fuertemente extrínseca
que tiene una concentración de centros de atrapamiento específica, es justamente el
recíproco de epNt· De igual manera, en el límite en que Po ~ 8p, n0 , nI, pI,
(10.8-20) se reduce a
1
t
(10.8-22)
= tno =en N t
comprobando que en una muestra tipo p fuertemente extrínseca, el tiempo de vida
del electrón es el recíproco de CnNt. Por tanto, (10.8-20) se puede escribir como
sigue
Po+ no+ ~p
(10.8-23)
en donde (rpo, Tno) representa el tiempo de vida del exceso (huecos electrones) en
un material fuertemente extrínseco (tipo n o p) que tiene las características de
atrapamiento particulares que se están tomando en cuenta. El tiempo de vida para
materiales intermedios entre estos dos extremos está dado por (1 0.8-23). Para valores
pequeños de 8p (10.8-23) puede escribirse como
_
(no + n¡) +tno (Po +PI) .
t-tpo
Po+ no
Po+ no
(10.8-24)
De acuerdo con esta ecuación, el tiempo de vida se puede graficar en función
del nivel de Fermi y, por tanto, como una función de n 0 y p 0 • Se ha encontrado
que el tiempo de vida es un máximo cuando el nivel de Fermi se encuentra en
algún punto dentro de la banda prohibida, cuya ubicación exacta depende de los
valores de Tpo, Tno y ni, como se muestra en la figura 10.18. Si Tno y Tpo son
iguales, el máximo se producirá en la condición intrínseca.
La variación del tiempo de vida con el nivel de inyección 8p se puede estudiar
resolviendo (10.8-23) para r, escribiendo el resultado en la forma
396
Exceso de portadores en semiconductores
lu
J
Tpo
Ev
E¡
Et
Ee
Ef-
Figura 10.18.
La dependencia del tiempo de vida en función de la energía de Fermi, como lo
predice la teoría Shockley-Read.
(10.8-25)
en donde
(10.8-26)
De acuerdo con esto, se observa que si lip es lo suficientemente pequeña, el
tiempo de vida tendrá el valor T 0 independiente de lip. Para valores más grandes de
lip, el tiempo de vida depende de lip y puede aumentar o disminuir con valores
crecientes de lip dependiendo de los valores relativos de T po. T n 0 , n 0 y n 1. Para
valores grandes de lip, se puede ver que (10.8-25) da
(10.8-27)
Si T _ es diferente de To (como sucede casi siempre), existe una vanac10n
monotónica del tiempo de vida entre los límites T 0 y T _ conforme aumenta lip.
Es difícil establecer comparaciones precisas y significativas entre la teoría de
Shockley- Read y el experimento, debido a la dificultad que representa obtener
muestras con concentraciones controladas con precisión de un solo tipo de centros
de atrapamiento y también debido al número de parámetros desconocidos cuyo
valor se debe determinar (o ajustar para que sean apropiados) de los datos experimentales. 26 Sin embargo, la teoría parece coincidir con todos los resultados experimentales a los que puede esperarse sean aplicables hasta la fecha. 27 Explica las
variaciones notables observadas del tiempo de vida de los portadores en función de
la densidad de los donadores y los receptores, el nivel de inyección, la concentración
de los centros de atrapamiento y la temperatura. También puede ampliarse para
26 La dificultad consiste no tanto en ajustar los datos experimentales, sino en que se
cuenta con muchos parámetros ajustables que los datos pueden explicar mediante muchos conjuntos posibles de valores para estos parámetros.
27 Véase, por ejemplo, J. A. Burton y colaboradores, J. Phys. Chem., 57, 853 (1964).
Mecanismos de recombinación; kl teoría de Shockley-Read
397
In 8C
Co
Fase normal
Atrapamiento lento
_,
Figura 10.19.
Respuec
.otoconductiva transitoria de una muestra que contiene gran número
de "centros de atrapamiento lento".
ofrecer una teoría de la recombinación superficial basada en los niveles de atrapamiento asociados con la superficie; pero teniendo propiedades similares a las de los
centros volumétricos que se vieron hasta ahora en lo que respecta a las estadísticas
de captura y emisión.
Desde el punto de vista físico, los centros volumétricos de atrapamiento de los
cristales semiconductores se producen a menudo debido a la presencia de ciertas
'"impurezas de atrapamiento". En semiconductores covalentes, tales como el silicio y
el germanio, estas impurezas de atrapamiento con frecuencia son dobles receptores
divalentes, por ejemplo, Cu y Ni, que proporcionan un nivel receptor ordinario muy
cercano a la banda de valencia- y un segundo nivel profundo dentro de la región
prohibida que se ioniza con mucha menos fa, tlidad y que funciona como un nivel
de atrapamiento. Los niveles donador y receptor originados por la presencia de impurezas de substitución III y V se ionizan casi por completo a todas las temperaturas,
excepto las muy bajas y, por ende, usualmente no desempeñan un papel importante
en los procesos de recombinación. 28 La presencia de imperfecciones estructurales,
sobre todo dislocaciones tipo de borde, han demostrado que también producen niveles receptores de atrapamiento dentro de la región prohibida que en muchos casos proporcionan una contribución importante a la recombinación electrón-hueco.
A veces sucede que en una misma muestra estan presentes dos tipos distintos
de centros de atrapamiento. Por lo general, uno de éstos es el centro normal de
recombinación, como se vio antes; sin embargo, el segundo conjunto de centros de
atrapamiento con frecuencia se asocia con una probabilidad de captura de huecos
muy reducida cuando está lleno de electrones. Esto conduce a un valor muy grande de
r P 0 para esos niveles. Aunque naturalmente se de be repetir el análisis de Schockley ·
Read, tomando en cuenta desde el principio los dos conjuntos de niveles de atrapa·
miento, para describir los detalles de la situación resultante, se ve fácilmente de un
modo intuitivo que lo que debe suceder en principio en una medición de fotoconductividad transitoria como la que se vio en la sección 1O. 7, es que algunos electrones se recombinan a través de los niveles normales de recombinación, en tanto que
otros caen dentro del segundo grupo de trampas. No obstante, en muy poco tiempo,
el proceso de recombinación normal termina con todo el exceso de electrones, excepto con los que quedaron en el segundo grupo lento de trampas que, a continuación, capturan con lentitud el exceso restante de huecos. El decaimiento de fotocon28
Excepto, por supuesto, en lo que pueden influir en la posición del nivel de Fermi.
398
Exceso de portadores en semiconductores
ductividad resultante tiene dos secciones exponenciales separadas, con diferentes
constantes de tiempo, como se puede ver en la figura 10.19. Existe una fase de
recombinación inicial "normal" y una gran "cola de atrapamiento" debida a las
trampas lentas. A veces se presenta una confusión en lo que respecta a la termin~
logia relacionada con este efecto, en el sentido de que la parte inicial "normal" del
decaimiento se cita a menudo como "recombinación" y el decaimiento final lento se
describe como "de atrapamiento". En realidad, las dos fases del proceso están gober·
nadas por el fenómeno de atrapamiento y es más exacto citar al primero com:
debido al atrapamiento normal y el segundo a efectos del atrapamiento lento.
EJERCICIOS
l. Principiando con la ecuación de Boltzmann y suponiendo que se aplica la aproximacié>:t
del tiempo de relajación, demuestre que en un sistema de estado estacionario que contien:
partículas libres en el que existe un gradiente de concentración en la dirección z, se establece w:
flujo de difusión - D(fm/6x). Demuestre que el coeficiente de difusión D es igual a 'llc/3 en donlk
'A es la trayectoria libre media y
es la velocidad térmica media. Puede suponerse que b.
trayectoria libre media A es independiente de la velocidad y que el sistema obedece a la estadir
tica de Maxwell-Boltzmann en equilibrio. Nota: suponga que la función de distribución /(r, v) ;.e
puede escribir en la forma n(r).f(v); esto es razonable si la desviación del estado de equilibrio 1!-'
es muy marcada.
2. Los resultados derivados de los cálculos del problema 1 se aplicaron en el texto a
sistemas de estado no estacionario al igual que a sistemas que conservan dicho estado. Explique
(cualitativamente) en qué circunstancias es permisible esta aplicación.
3. Demuestre que si f(x, t) satisface la ecuación diferencial
e
n a'J- [- g[
ax' T -a(
entonces, .f(~. t)(~ = x - IJEot, en donde E o =constante) debe ser la solución de
az¡
a¡
f
D ax' - ¡LEo ax - ~ =
a¡
a, .
4. Se crea una distribución de portadores en exceso de estado estacionario en una muestn
extrínseca tipo n, por medio de una fuente plana de generación en el origen. La difuSIÓ•
resultante y el arrastre de la distribución de los portadores se puede considerar de tipo unidr
mensional a lo largo de la dirección x; la extensión de la muestra en la dirección x es esencialmente infinita. Se tiene también un campo eléctrico constante E 0 en la dirección +x. u
densidad de portadores en exceso se mide determinando la corriente inversa de saturación en dOi
puntas de prueba en lugares diferentes, x =a y x = b(b >a). Se desea calcular la longitud de
difusión Lp a partir de la relación de estas dos densidades medidas de los portadores en exceso.
Demuestre que
J (
d
eE d)
0
In Ko In Ko + kT
en donde Ko =8p(a)/8p(b) y d =b- a.
5. Principiando con la solución (10.3-32) de la ecuacton de continuidad y definiendo el
tiempo de tránsito como el lapso en el que el trazo del osciloscopio llega a un máximo, derive
los resultados indicados en (10.4-3) y (10.4-4).
6. Estudie un semiconductor uniforme semiinfinito cuya superficie coincide con el plano
yz. El material posee un tiempo de vida volumétrico de portadores en exceso T y existe una
velocidad de recombinación superficial s asociada con la superficie. También se tiene una velocidad de generación volumétrica uniforme y constante de portadores en exceso g' en todos los
puntos de la muestra. Suponiendo que se ha llegado a un estado estacionario, calcule la densidad
de portadores en exceso 8p(x) en todos los puntos dentro de la muestra.
Lecturas recomendadas 399
7. De acuerdo con los resultados del problema 6, demuestre que, a condición de que
D/L <;¡¡; /2 (D =coeficiente de difusión, L =(DT) 1 /2 =longitud de difusión) no se registra una
gran diferencia en la concentración de portadores dentro del volumen o en el flujo difusivo de
portadores hacia la superficie, ya sea que s se considere como C/2 o infinito. Demuestre que esta
condición se puede representar también en la forma L ~-p
8. Demuestre explícitamente que el conjunto de funciones :cos a.a} con an según la
define (10.7-19), es ortogonal. Encuentre la constante de normalización ya derivada (10.7-22).
9. La constante de decaimiento fotoconductiva observada, relacionada con una muestra
muy gruesa de germanio tipo n(/)0 = 45 cm 2 /seg, f.4, = 1800 cm2 /V- seg) en 500 ¡Jseg. La muestra
se corta en capas de 0.1 cm de espesor, las superficies se atacan químicamente y luego se observa que
la constante de decaimiento fotoconductiva es 300 ¡Jseg. ¿Cuál es la velocidad de recombinación superficial asociada con las superficies atacadas químicamente de las muestras delgadas?
10. De acuerdo con los resultados de la teoría de Schockley-Read para un material con
centros de atrapamiento para los que T no = T po demuestre que el máximo tiempo de vida
posible se produce cuando e¡ está en el punto intrínseco y que, en estas circunstancias, el
tiempo de vida está dado por
.
[
e-e,]
T=T•o 1 +cosh~
en donde €¡ es la posición del nivel de Fermi para la condición intrínseca.
11. Explique la variación del tiempo de vida e-n función del nivel de inyección Dp para un
material en el que TpO = T no y en donde €t = €v +~. de acuerdo con la teoría Shockley-Read
12. De acuerdo con los resultados y las técnicas desarrolladas en la sección 10.5, demuestre que la constante numérica a de las ecuaciones (10.5-8) y (10.5-9) debe tener el valor 3/2.
13. A veces se indica que, puesto que el flujo en equilibrio de partículas a través de un
plano, en una distribución de Boltzmann, es pC/4, la máxima velocidad de recombinación superficial que puede obtenerse (asociada con una superficie de un coeficiente de reflexión igual a
cero) debe ser s =C/4. La expresión (10.5-15) contradice esta conclusión y predice que el
máximo valor que se puede obtener para s es c/2. Señale el error físico de este argumento Y
demuestre que el valor C/2 dado por (10.5-15) es el realmente esperado desde el punto de vista
físico.
14. Considete una barra de germanio extrínseco tipo n con una sección transversal constante, que se extiende a lo largo del eje x. Se hace fluir una corriente constante en la dirección
x positiva conectando una batería a los extremos de la muestra. Se crea una densidad uniforme
de pares electrón-hueco en exceso en t =O, dentro de la región 1
2 • Esta distribución
de portadores en exceso sufre un arrastre con una velocidad J.LpE 0 en la dirección positiva de x,
de acuerdo con los resultados de la sección 10.2. Utilice sólo argumentos físicos para explicar
por qué la dist•ihución de portadores en exceso se desplaza a la derecha a lo largo del eje + x, a
pesar de que los electrones en exceso dentro de la distribución deben estarse moviendo hacia la
izquierda dentro del campo aplicado. Haga un diagrama que demuestre (esquemáticamente) el
campo interno y la densidad de carga espacial que lo produce. Puede suponer que el tiempo de
vida volumétrico de portadores en exceso es infinito, que la velocidad de recombinación superficial es cero y que la densidad de portadores en exceso es pequeña en comparación con la
densidad de portadores mayoritarios en equilibrio. Nota: principie observando que, debido a la
constancia de la densidad de corriente a lo largo de la muestra y la modulación de la conductividad
por los portadores en exceso, el campo eléctrico debe ser más pequeño dentro del pulso de portadores
en exceso que fuera de él.
x <x <x
LECTURAS RECOMENDADAS
A. Many y R. Bray, "Lifetime of Excess Carriers in Semiconductors," in Progress in Semiconductors, Heywood and Co., Londres (1958), Vol 3, pp. 117-151.
Allen Nussbaum, Semiconductor Device Physics, Prentice-Hall, Inc., Englewood Cliffs, N.J.
(1962).
W. Shockley, Electr0'1S and Hales in Semiconductors, D. Van Nostrand Company, Inc., Nueva
York (1950)
R. A. Smith, Semiconductors, Cambridge University Press, Londres (1961).
E. Spenke, Electronic Semiconductors, McGraw-Hill Book Co., Inc., Nueva York (1958).
CAPITUW
11
Tecnología de materiales y medición
de propiedades volumétricas
11.1
PREPARACION DE LOS MATERIALES SEMICONDUCTORES
DE ALTO GRADO DE PUREZA
En los capítulos anteriores se dijo muy poco respecto a las técnicas químicas y
metalúrgicas relacionadas con la preparación de las substancias semiconductoras de
alto grado de pureza. De igual manera, aunque ya se examinaron con cierto detalle
las propiedades eléctricas de los semiconductores, casi no se han analizado las técnicas experimentales que se utilizan para medir dichas propiedades. En este capítulo
se intentará remediar estas deficiencias aunque, puesto que el propósito principal es
comprender la física de los semic~mductores, será necesario limitarse a un estudio
cualitativo, o cuando mucho, semicuantitativo de los aspectos químicos y metalúrgicos
de la tecnología de materiales.
Se ha demostrado que gran número de substancias presentan las propiedades
características asociadas con los semiconductores, los elementos covalentes tales como
el germanio y el silicio son los más conocidos, los que se comprenden más a fondo
y los que se utilizan más profusamente en la tecnología de dispositivos. Porque entre
todas las substancias semiconductoras, éstas son las que se preparan con mayor
facilidad en forma de cristales únicos de ultra alta pureza, libres de dislocaciones,
vacantes de red y otras imperfecciones estructurales. Los otros semiconductores cavalentes pertenecientes al grupo IV de la tabla periódica, el diamante y el estaño a
(gris), son muy difíciles de obtener en forma de cristales únicos grandes de alta
pureza y, por tanto, no se han estudiado tan minuciosamente desde el punto de
vista fundamental, ni se han utilizado en absoluto en la tecnología de dispositivos
electrónicos.
Los compuestos intermetálicos que se forman entre los elementos del grupo Ili
y el grupo V de la tabla pt:riódica, tales como InSb, GaAs, AIP, etc., cristalizan con
la estructura de la zincblenda y forman una serie de materiales semiconductores
cuyas propiedades físicas son muy semejantes, en muchos aspectos a las de los
elementos covalentes del grupo IV. No obstante, estos semiconductores III-V tienen
una naturaleza ligeramente fónica, lo que explica la mayoría de las diferencias en las
propiedades de los compuestos Ili-V y las de los semiconductores covalentes del
grupo IV. La masa efectiva de los electrones de conducción en los compuestos lli-V
por lo general es muy pequeña en comparación con la masa gravitacional m0 , en
tanto que la masa efectiva de huecos no es muy diferente de la gravitacional del
electrón. Por esta razón, de acuerdo con (9.7-7) y (9.11-19), la movilidad de elec·
trones en muestras puras de estos compuestos será muy alta, como también lo será
la relación de movilidad b. En el InSb, en donde este fenómeno es más pronun
401
402
Tecnología de materiales y medición de propiedades volumétricas
ciado, se observan valores de movilidad electrónica que sobrepasan a 50,000
cm2 /V-seg y relaciones de movilidad de casi 100, a la temperatura ambiente. Desafortunadamente, debido a la probabilidad relativamente alta de recombinación radiactiva y a la dificultad de producir cristales de tales substancias que estén libres de
impurezas de atrapamiento e imperfecciones estructurales, los tiempos de vida de los
portadores en exceso en estos materiales son muy cortos (I0- 7 seg o menos) y los
efectos de los portadores en exceso se pueden observar con extrema dificultad. Las
bandas de energía prohibidas asociadas con los diferentes compuestos intermetálicos
III-V aumentan al reducirse las masas atómicas de los elementos constituyentes, en la
misma forma en que las bandas de energía prohibida de los semiconductores del
grupo IV aumentan al ir de Sn a pasando por Ge y Si hasta el diamante. En
consecuencia, InSb, al igual que Sn a, tiene una banda de energía prohibida muy
pequeña, en tanto que InAs, GaSb, GaAs, GaP y AlP tienen, sucesivamente, mayores
anchuras en esa banda. En general, cualquier compuesto III-V tendrá cierta semejanza con el semiconductor del grupo IV ubicado en la tabla periódica a la mitad de
la línea que une a los dos constit¡¡yentes del compuesto III-V. Las propiedades
características de los compuestos III-V fueron analizadas por Seraphin 1 empleando
un ingenioso modelo unidimensional (similar al que se usó en el cálculo de KronigPenney) que permite una solución exacta a la ecuación de Schrodinger. A pesar de
las desventajas asociadas con los tiempos de vida muy reducidos de los portadores ~
las dificultades de la preparación de cristales únicos de alta pureza, los compuestos
semiconductores III-V se han usado en gran variedad de aplicaciones técnicas, sobre
todo cuando la alta movilidad electrónica constituye una ventaja.
Además de estas substancias, el carburo de ~Ilicio (SiC), ciertos compuestos
11-VI tales como CdS, CdSe, CdTe, ZnS, PbS, PbSe, PbTe, ciertos óxidos metálicos ~
aun varias substancias orgánicas cristalinas tales como el antraceno, son semiconductores bien conocidos. Sin embargo, con la excepción del carburo de silicio y.
quizás el sulfuro de cadmio, la importancia tecnológica de estos mllteriales ha sido
muy pequeña, por lo que este estudio se referirá principalmente a los elementos cavalentes del grupo IV y a los compuestos intermetálicos III-V.
El material inicial para la preparación de germanio de alta pureza es dióxido
de germanio químicamente puro que se obtiene como un subproducto de la fundición y la refinación del zinc. Este material, que se presenta casi siempre en 1::.
forma de un polvo blanco finamente dividido, se coloca en crisoles de grafito de alta
pureza y se reduce a germanio calentándolo entre 600 y 900°C en una corriente de
hidrógeno. La reacción se desarrolla de acuerdo con la ecuación
Después de varias horas, el germanio se obtiene en la forma de un polvo negro
finamente dividido que se funde en una barra larga y angosta de germanio policristalino, elevando la temperatura por encima del punto de fusión, que es 936°C. Por le
general, se incluye un molde o canal con este fin, en la base del crisol de reducción.
El lingote resultante tiene el aspecto metálico plateado que es característico del
germanio. El lingote reduciclo se purifica más todavía mt:!diante la refinación por
zonas. En este proceso, la barra reducida se coloca en un "bote" largo y angosto
hecho de cuarzo o grafito y se desliza a través del horno en forma de tubo en el
que se han creado varias zonas calientes angostas para fundir una parte angosta del
lingote. Cuando se usan botes de cuarzo, estas zonas calientes se pueden crear por
medio de anillos de grafito calentados por inducción de radiofrecuencia o por co1 B. Seraphin, Z.
Naturforsch, 9a, 5 (1 954).
Preparación de los materiales semiconductores
403
Bobinas de
,..-inducción de rf"'-....
00000
\
00000
00000
00000
1 ub o externo
del horno
Figura 11.1.
Zonas fundidas
Diagrama esquemático del proceso de refinación por zonas para purificar materiales semiconductores.
rriente directa; cuando se usan botes de grafito, una parte del mismo bote puede
actuar como susceptor cuando pasa por una bobina angosta de radiofrecuencia. En
cualquier caso, el efecto es fundir una porción del lingote y pasar la zona fundida
continuamente a lo largo de la barra, de un extremo al otro, conforme el lingote se
desplaza por la zona caliente. La atmósfera de hidrógeno se usa para evitar la
oxidación del germanio a altas temperaturas. En la figura 11.1 se ilustra un diagrama
de este proceso.
De acuerdo con la ley de distribución de Nernst,Z en el estado de equilibrio
térmico, un soluto diluido se distribuye entre dos fases disolventes, de manera que la
razón de la concentración del soluto en las dos fases es una constante independiente
de las concentraciones del soluto. Si por el momento se considera que las dos fases
están en equilibrio teniendo una cantidad de soluto en exceso sobre la cantidad que
se puede disolver en equilibrio, y si en ambas fases se forman soluciones ideales, es
obvio que la razón constante de las concentraciones debe ser la razón de las solubilidades en equilibrio del soluto en las dos fases disolventes. En el caso del proceso de
refinación por zonas, se puede considerar que existe un estado de equilibrio aproximadamente3 entre el germanio sólido y líquido, que se pueden tomar como dos
fases disolventes, y las impurezas del sistemas actúan (o al menos eso se espera)
como solutos ideales. A continuación, cada soluto se distribuye asimismo entre las
fases sólida y líquida en la razón entre su solubilidad en el sólido y su solubilidad
en el líquido. Esta razón se cita frecuentemente como el valor de equilibrio K para
esa impureza específica. Puesto que la mayoría de los elementos de impureza son
mucho más solubles en la fase líquida que en la sólida, los valores de equilibrio K
para casi todas las impurezas son mucho menores que la unidad. En estas circunstancias, conforme la zona líquida pasa lentamente por la barra sólida, la mayoría de
los átomos de impureza en el fundido se ven rechazados por el sólido en la interfaz,
en donde la región fundida se solidifica para formar nuevamente una barra sólida.
Cuando una sola zona fundida pasa por un lingote largo, los átomos de impureza
tienden a recogerse en el líquido y finalmente se precipitan sólo en el mismo
extremo del lingote cuando la última parte de la zona fundida se solidifica finalmente. Este proceso de segregación se puede acentuar más todavía repitiendo el
proceso y terminando por pasar muchas zonas fundidas por el lingote. En el límite
2 Véase, por ejemplo, G. N. Lewis y M. R:mdall, Thermodynamics, Nueva York: McGrawHill, 1923, página 234.
3 Por supuesto, estrictamente hablando, el equilibrio se mantiene sólo en un sistema a
temperatura constante, en el que la interfaz sólido-líquido sería la estacionaria. La descripción
anterior no es válida cuando las velocidades de interfaz y los gradientes de temperatura se hacen
demasiado grandes.
404
Tecnología de materiales y medición de propiedades volumétricas
Concentración
Concentración
¡K-
~=K
C
Cs
t-----~Cs
t-------lCs
-4--------~---------------.x
-4----------~------------.x
líquido
Sólido
Interfaz
(o) Velocidad baja de interfaz
Figura 11.2.
-K*
C¡o ------::"!----
Czor------
Sólido
Cz
líquido
( b) Velocidad alta de interfaz
Concentración de impurezas en las fases sólida y líquida cerca de una interfaz
SÓlido-lÍquida dentro de un aparato de refinación por zonas, (a) a una velocidad
baja de interfaz y (b) a una velocidad más alta de interfaz.
de un número infinito de pasos de zona, se logra un perfil restrictivo de concentración y la purificación más allá de esta etapa no se puede lograr de modo directo.
Sin embargo, si se desea una segregación de impurezas subsecuente, el lingote se
puede sacar del horno, se le quita la porción extrema (que ahora contiene casi todas
las impurezas de la muestra) y la sección restante vuelve a someterse a otra refinación por zonas. En cualquier caso, al concluir con el proceso de refinación por
zonas, la sección extrema del lingote debe eliminarse.
Mientras que para velocidades de interfaz muy lentas la razón de la concentración de impure7as en el sólido a la del líquido es la razón de las solubilidades en
equilibrio, para mayores velocidades de interfaz, los átomos de impureza que rechaza
el sólido en enfriamiento se concentran cerca de la interfaz más rápidamente de lo
que se pueden eliminar por difusión hacia el interior de la zona fundida, como se
ilustra en la figura 11.2. La concentración real de impurezas c1 cerca de la interfaz.
por tanto es mayor que el valor de equilibrio c10 • El resultado es que se incorporan
más átomos de impureza al sólido que en el caso de la velocidad baja, en donde se
puede mantener una concentración constante a lo largo de la zona líquida por
medio de la difusión. El efecto es el mismo que si el valor de equilibrio K se
substituyera con un valor efectivo K*, en donde
e,
K*= K·--.
(11.1-1)
ero
Puesto que la razón c1/c10 se verá afectada por la velocidad de interfaz, y el
coeficiente de difusión de los átomos de impureza en el líquido, K* debe depender
también de estos factores. No obstante, es evidente que si K< 1, entonces K* debe
ser mayor que K. Por lo común, se considera ventajoso trabajar en condiciones tales
que K* sea apreciablemeHte diferente de K, y en estas circunstancias casi siempre es
necesario determinar K* por experimentación.
Se puede demostrar fácilmente 4 que la distribución de impurezas en un lingote
inicialmente uniforme después de pasar por una zona de longitud 1, es
(11.1-2)
4 W. G. Pfann, J. Metals, 4, 747 (1952).
Preparación de los materiales semiconductores
405
en donde eso es la densidad inicial de impurezas y x la distancia a lo largo de la
barra. También se puede demostrar que la distribución limitante a la que se aproxima después de un gran número de pasadas es
(11.1-3)
en donde,
A = _c.;;,0=-B_L_
e8 I. - 1
(11.1-4)
K*=_!!!__
eBL - 1
(11.1-5)
y
En este caso, L es la longitud total del lingote. Para mayores datos sobre el
proceso de refinación por zonas, el lector debe consultar el artículo de Pfann4 0
una monografía reciente de Hannai. s Es evidente que el proceso de la retinacion por
zonas se puede aplicar no sólo al germanio, sino también a una gran variedad de
otros materiales. En la tabla 11.1 se da una lista de los valores de equilibrio K para
unpurezas que se encuentran comúnmente en el germanio y el silicio. Debe observarse que el boro es la única impureza común cuyo valor de equilibrio K en el
germanio es mayor que la unidad, es decir, que el líquido la rechaza hacia el sólido.
Esta peculiaridad da como resultado la segregación del boro en el extremo de la
cabeza del lingote más que en su cola.
La preparación de silicio altamente puro principia casi siempre con la reducción del tetracloruro de silicio (SiCl4 ) o el triclorosilano (SiHCh) por medio del
hidrógeno a aproximadamente 11 00°C. La reacción se desarrolla de acuerdo con la
ecuación
SiHC1 3 + H 2 -+ St + 3HCI.
TABLA 11.1
Coeficiente de segregación de Ge y Si6 •7
Impureza
K(Ge)
K(Si)
p
0.12
0.04
0.003
20.
0.1
0.1
0.001
0.04
0.07
0.002
0.68
0.0016
0.004
0.0003
As
Sb
8
Al
Ga
In
s N. B. Hannay, Proceedinxs of the Jnternational School o( Physics, "Enrü:o Fermi". Curso 22
{Semiconductores). Nueva York, Academic Press, 1963. págs. 341-435.
6 R. N. Hall, J. Chem. Phys., 51, 836 {1953).
7 J. A. Burton, Physica, 20, 845 {1954).
406
Tecnología de materiales y medición de propiedades volumétricas
Silicio
sólido
Zona
fundida
Figura 11.3.
generador de rf
Representación esquemática del proceso de zona flotante para la purificación d.:-:
silicio.
Todos los reactivos se encuentran en la fase gaseosa a la temperatura a la que
el proceso se lleva a cabo, con la excepción del silicio, que se precipita en un
substrato apropiado. Este substrato puede ser una muestra de un cristal de silicio de
alta pureza, en cuyo caso, la estructura reticular fundamental del substrato se continúa en la capa precipitada y, entonces, el proce3o de crecimiento se denommJ.
epitaxial. Otra posibilidad es que el substrato sea una varilla delgada de silicio policristalino que produce un lingote cilíndrico apropiado para la refinación por zonas..
La refinación por zonas del silicio es similar en principio, al proceso usadc
para el germanio, excepto por la complicación de que el silicio fundido se humedece, reacciona y se contamina prácticamente con cualquier substancia conocida que
pueda utilizarse como crisol. Por tanto, es necesario emplear una técnica que nü
requiera un crisol y la más común es el proceso denominado zona flotante. En este
proceso, una varilla cilíndrica de silicio se sujeta verticalmente por ambos extremos ~
se calienta mediante una bobina de inducción de radiofrecuencia acoplada directamente al mismo silicio. Se puede fundir una región angosta del lingote y la tensiór:
superficial del silicio fundido basta para evitar que la zona fundida se derrumbe y se
pierda. A continuación, la zona puede pasarse a lo largo del lingote para segregar
impurezas hacia un extr~mo, y el proceso se puede repetir cuantas veces sea necesario para alcanzar el grado de pureza requerido. En la figura 11.3 se ilustra este
proceso. Se puede reducir el contenido de impurezas eléctricamente activas tanto er:
el germanio como en el silicio hasta una parte en 10 11 Esto es suficiente pan
producir germanio que es intrínseco a la temperatura ambiente; pero no lo suficientemente bueno para obtener silicio intrínseco (sería necesario otro factor de
10-100 para lograr esto). El silicio y el germanio con refinación por zonas tiene~
la suficiente pureza para servir como material inicial para una gran variedad de
dispositivos semiconductores.
La preparación de especímenes de alta pureza de los compuestos intermetálicos
lli-V se logra casi siempre fundiendo cantidades estequiométricas de los constituyentes elementales sumamente purificados, en tubos de cuarzo sellados, para prevenir la
pérdida de los volátiles por evaporación. Los lingotes obtenidos se pueden purificar a
menudo de un modo notable mediante la refinación por zonas; pero también en este
caso, la muestra debe confinarse a un tubo sellado. En general, los esfuerzos para
purificar los compuestos Ill-V por el procedimiento de refinación por zonas u otras
técnicas, no han tenido el éxito logrado con materiales del grupo IV.
Crecimiento de muestras monocristalinas
11.2
407
CRECIMIENTO DE MUESTRAS MONOCRISTALINAS
En general, el material producido mediante el proceso de refinación por zonas
es policristalino, a pesar de que es muy puro. Lo que normalmente se desea para las
investigaciones experimentales o los fines tecnológicos, son muestras semiconductoras
de un monocristal que puedan "impuríficarse" intencionalmente con algún elemento
de impureza dado, con el fin de producir un material con un tipo de conductividad
y una resistividad eléctrica específicas. Existen varías formas de hacer crecer monocristales y cada una posee ciertas ventajas para aplicaciones particulares.
Los monocrístales de germanio se hacen crecer por un procedimiento en el que
uno de los extremos de un lingote refinado por zonas se pone en contacto con una
semilla monocristalína, dentro de un bote apropiado. A continuación se forma una
zona fundida entre el cristal semilla y el lingote policrístalino, y se pasa lentamente
hacía abajo del lingote, de tal manera que el recrecimiento se inicia en la semilla y
continúa su estructura cristalina a lo largo del lingote. Sí se escoge la orientación
adecuada de la semilla monocristalína, se puede obtener cualquier orientación cristalina deseada dentro del lingote final,' e incorporando pequeñas cantidades de elementos de impureza a la zona fundida, pueden elaborarse cristales tipo p o n con
cualquier contenido de impureza deseado. Se debe permitir un margen apropiado
para la segregación de impurezas en la interfaz de crecimiento cuando se calcula la
cantidad de impurezas requerida. Puesto que las cantidades necesarias de impurezas
que se deben agregar son casi siempre microscópicas, se acostumbra producir una
aleación de impurificación de germanio puro al que se ha agregado quizá 0.1 ó 0.01
por ciento de la impureza deseada para introducir esta aleación de impurezas al
fundido, en lugar de intentar impurificado de un modo directo. Este proceso es
capaz de producir cristales grandes de germanio con una perfección estructural muy
elevada y se puede usar también con ciertos compuestos intermetálicos, sobre todo
el lnSb; pero no se puede emplear para producir monocristales de silicio, ya que
Salida del cristal
-1
Horno de cuarzo
Soporte --r-E----1
Semilla
Atmósfera inerte
o vacío
--"""""~
Figura 11.4.
Cristal
Representación esquemática del proceso de Czochralski para h·¡cer crecer monocristales
a partir de una fase fundida.
408
Tecnología de materiales y medición de propiedades volumétricas
éste se humedece o reacciona con todos los materiales que pueden utilizarse para
fabricar el bote. Sin embargo, se pueden obtener monocristales de silicio de alta
calidad utilizando una modificación adecuada del proceso de zona flotante.
Otro método que se usa con mucha frecuencia para el crecimiento de monocristales, es la llamada técnica de Czochralski, en el que una semilla monocristalina
con la orientación deseada se sumerge en un fundido preparado a partir de un
material refinado por zonas y con una impurificación apropiada. El suministro de
calor al fundido se reduce y el cristal semilla se extrae lentamente haciéndolo girar
al mismo tiempo, como se indica en la figura 11.4. El diámetro del cristal óbtenido
puede controlarse regulando la velocidad de extracción y el suministro de potencia al
fundido. Un crisol de grafito puede ser satisfactorio para hacer crecer cristales de
germanio; pero se requiere un recubrimiento de cuarzo para el silicio. Aunque el
silicio fundido se humedece y reacciona con el cuarzo, el recubrimiento es atacado
con mucha lentitud y el crecimiento del cristal no se perturba gravemente. Parte del
oxígeno del recubrimiento de cuarzo se puede introducir a los cristales de silicio
obtenidos por esta técnica; pero no es una impureza eléctricamente activa y no
afecta seriamente la calidad del cristal para la mayoría de los fines experimentales o
técnicos. La técnica de Czochralski también se puede usar para hacer crecer monocristales de los compuestos intermetálicos 111-V; pero para estas substancias se requiere casi siempre un sistema cerrado para minimizar las pérdidas de los compuestos
volátiles. La extracción del cristal y la rotación con frecuencia se logran por medio
del sistema sobre armaduras ferromagnéticas del interior.
La posibilidad de hacer crecer epitaxialrnente regiones monocristalinas de silicio
ya se mencionó en conexión con la preparación de dicho elemento mediante la
reducción de fase de vapor de los cloruros. Este proceso es valioso, sobre todo para
hacer crecer regiones planas paralelas de tipos opuestos de conductividad o condensidades de impureza abruptamente variables debido a que estas impurezas se pueden
incorporar (por ejemplo, como, PC1 3 o BC13 gaseosos) en la corriente de gas de
entrada. También se han desarrrollado procesos para adaptar esta técnica al uso del
germanio.
Además, se ha usado el crecimiento dendrítico del cristal para producir cristales apropiados para utilizarlos en la tecnología de dispositivos semiconductores. El
crecimiento dendrítico se produce cuando un cristal semilla se inserta en un fundidc
superenfriado. En estas condiciones se inicia un crecimiento rápido semiforme CU) a
velocidad se determina de la razón a la que se puede alejar el calor latente de fusión
en la interfaz de solidificación. Si el cristal en crecimiento se estira hacia arrriba con
gran rapidez sac:\ndolo del fundido, se puede formar una tira dendrítica de semiconductor. Las v'elocidades de crecimiento del orden de 5cm/seg son típicas (er.
comparación con 1o- 3 cm/seg del proceso de Czochralski en el que el fundido nc
está superenfriado). La anchura y el espesor del cristal dendrítico se pueden controlar dentro de ciertos límites, variando el superenfriamiento del fundido y la velocidad con que se extrae la tira del fundido. También es muy posible, en el caso de:
germanio, producir tiras dendríticas de 1 a 5 mm de ancho y de 0.1 a 0.5 mm de
grueso. La longitud está limitada sólo por los arreglos que se puedan hacer pan
extraer la dendrita. Las superficies de los cristales dendríticos son ópticamente planas
y, si se toman ciertas precauciones en su crecimiento, pueden ser fundamentalmente
perfectos desde el punto de vista estructural. La ventaja más evidente del procese
dendrítico es que produce cristales que se pueden emplear directamente como material inicial para dispositivos semiconductores, sin necesidad de recurrir a operacione1
de corte, pulido, grabado o ataque con ácidos que, de otra manera, son necesariu.
El espesor de las tiras dendríticamente crecidas se puede controlar de tal modo qut
sea muy uniforme, lo cual tiene gran importancia en muchos procesos de fabricación
de dispositivos. Se pueden producír con facilidad cristales dendríticos muy buenos de
Medición de la resistividad volumétrica
409
germanio, silicio e InSb, y también se ha logrado el crecimiento de dendritas de
otros compuestos intermetálicos III-V; pero con mayor dificultad y con resultados
algo deficientes.
11.3
MEDICION DE LA RESISTMDAD VOLUMETRICA
La medición de la resistividad es la más fundamental de las mediciones de
rutina que se hacen en los cristales semiconductores. Básicamente, cualquier medición
se hace pasando por la muestra una cantidad de corriente conocida con precisión, y
midiendo la caída de voltaje entre dos puntos separados por una distancia conocida.
Sin embargo, existen algunas técnicas específicas que tienen la suficiente importancia
que justifique un estudio más amplio.
Una forma muy exacta de medir la resistividad de un espécimen de semiconductor bastante homogéneo es obtener un potencial transversal de la muestra, haciendo una serie de mediciones potenciométricas de la caída de voltaje entre un
contacto fijo y una punta de prueba móvil, conforme este último se desplaza a lo
largo de la muestra en pequeños incrementos, casi siempre de 0.5 mm ó 1.0 mm.
En la fJgUra 11.5 se muestra un diagrama de esta medición. Si la distancia entre las
puntas de prueba se incrementa de x a x + Ax, la resistencia t:.R del elemento
pequeño de la muestra que queda entre .X y x + !:u, se suma a la resistencia R de la
porción comprendida entre O y x. Entonces, si la corriente que fluye por la muestra es
10 y si se observa un cambio AV en el potencial entre la punta fija y la móvil que acompaña al cambio en el espaciamiento de la punta /:u, por definición de la resistividad,
(11.3-1)
en donde A es el área transversal (constante) de la muestra. Al resolver para p, es
evidente que
AL\ V
p=--
lol\x
(11.3-2)
representa la resistividad del material que queda entre x y x + Ax. Si se hace una
serie completa de mediciones que incluyen incrementos constantes en el espaciamien-
Al potenciómetro (- l
Micrómetro para
,...L_
r-.-.,.-,¡vuw11l\ proporcionar el
__L_L:.::.:..::::__:=::::.:_:_:.:..:::.::::::~=L!-c.....I4Mt.IJJI movimiento
Base
Figura 11.5.
calibrado
de la muestra
Diagrama del aparato para determinar la resistividad volumétrica por el método del
potencial transversal.
410
Tecnología de materiales y medición de propiedades volumétricas
to de la punta, se puede llegar a una determinación experimental de la resistividad
en función de la distancia a lo largo de la muestra. Esta gráfica a menudo se
denomina perfil de resistividad de la muestra. Debe hacerse notar que, puesto que se
usa un potenciómetro para medir el potencial entre la punta fija y la móvil, no
fluye ninguna corriente entre estos electrodos.
Otra forma muy sencilla, pero menos exacta de medir la resistividad, que con
frecuencia se puede emplear para controlar las especificaciones del material en procesos de elaboración de dispositivos, es mediante la técnica de las cuatro puntas. En
este método, se tienen cuatro puntas de prueba equidistantes que se sitúan sobre la
muestra, como se ilustra en la figura 11.6. El par de puntas que queda al exterior
se usa para hacer pasar por la muestra una corriente uniforme y el par del interior
sirve como probadores de potencial entre los cuales se puede medir potenciométricamente una caída de voltaje. Si se usan los métodos normales de la electrostática y la
teoría de la corriente uniforme, se puede encontrar la distribución de potencial
resultante y, a partir de esta solución, se puede demostrar que la diferencia de
potencial entre las puntas internas debe estar dada por
1
V=2nua
(11.3-3)
en donde 1 es la corriente uniforme que fluye por las puntas probadoras externas y
a el espaciamiento entre las puntas adyacentes. Por tanto, la resistividad de la muestra es
1 2naV
p=-=--.
(1
1
(11.3-4)
Los detalles de la derivación de (11.3-3) quedan asignados como tarea para el
lector. Al obtener esta ecuación se supone una muestra semiinfinita y, por tanto.
estrictamente hablando, (11.3-3) no es válida para muestras de extensión finita. Sin
embargo, si todas las dimensiones de la muestra son grandes en comparación con el
espaciamiento de las puntas, a, el error que representa el uso de (11.3-3) o (11.3-41
será muy pequeño. En estos dos métodos mencionados, las condiciones del experimento deben ser tales que se eviten por completo los efectos originados por la
inyección de portadores minoritarios en los contactos de la corriente. Esto se logra
con mayor facilidad puliendo o usando cualquier otro abrasivo en las superficies de
la muestra para que los portadores inyectados en exceso se recombinen rápidamente
Muestra
Figura 11.6.
Diagrama esquemático del aparato de cuatro puntas para medir la resistividad.
Medición del contenido de impurezas
411
cerca de los contactos de la corriente y manteniendo la corriente uniforme lo suficientemente baja para .:vitar cualquier modulación significativa de la conductividad
mediante los portadores inyectados.
Al hacer las mediciones de resistividad a temperaturas bajas es necesario confinar
la muestra dentro de un crióstato al vacío 1 para evitar la condensación de la humedad atmosférica ambiental en sus superficies. En estas circunstancias, la resistividad
se mide casi siempre de un modo potenciométrico, determinando la caída de voltaje
entre dos contactos fijos a una distancia conocida de separación cuanrlo se pasa una
corriente uniforme a lo largo de la muestra. A continuación la resistividad procede
de (11.3-2) siendo .!lV la caída de voltaje medida y .!lx la distancia entre los
contactos. Todos los métodos analizados aquí se aplican principalmente a muestras
de suficiente homogeneidad; para especímenes en los que las fluctuaciones de resistividad son grandes en distancias pequeñas, se requiere usar técnicas especiales.
11.4
MEDICION DEL CONTENIDO DE IMPUREZAS Y LA MOVILIDAD
MEDIANTE EL EFECTO DE HALL
La teoría del efecto de Hall se estudió en los capítulos 7 y 9, y aquí sólo se
verá un estudio breve de las técnicas experimentales. En los extremos de la muestra
se establecen contactos de corriente grandes, en tanto que se aplican a los lados
pequeñas puntas de prueba o contactos soldados hacia la mitad de la trayectoria de
la corriente, para la medición de potencial. Con frecuencia las técnicas de soldadura
ultrasónica son muy útiles para establecer estos contactos, así como los que se
utilizan para otros fines experimentales. El voltaje de Hall se debe medir potenciométricament~> para satisfacer la condición de que la componente y de la corriente
sea cero. Por lo general, las superficies de la muestra se pulen y se usan valores
mínimos de corriente de muestra casi siempre, para evitar, lo más posible, la inyección de un exceso de portadores a la misma.
Si los contactos de potencial no están perfectamente alineados para que coincidan con los extremos opuestos de la misma línea equipotencial en ausencia del
campo magnético estático, además del voltaje de Hall se deberá medir una caída
óhmica de voltaje proporcional a la corriente uniforme de la muestra. Esta situación
se ilustra en la figura 11.7. El efecto de esta caída óhmica espuria se puede eliminar
haciendo cuatro mediciones por separado; primero con el campo magnético y la
comente uniforme en dirección positiva, luego con el campo magnético positivo y la
Terminal de voltaje
1
---1
1
Error de alineación
Io-
Figura 11.7.
Geometría de las muestras usadas para las mediciones del efecto de Hall, mostrando el origen de las caídas óhmicas de voltaje debidas a una alineación deficiente
de los con tactos.
412
Tecnología de materiales y medición de propiedades volumétricas
corriente unifonne inversa, a continuación con el campo magnético y la corriente
inversos y, por último invirtiendo el campo y con la corriente positiva. Por tanto, el
voltaje de Hall obtenido es
(11.4-1)
en donde las cantidades entre paréntesis describen la condición de la corriente y el
campo pertenecientes a la medición del potencial. Es evidente que la caída óhmica
se elimina mediante este procedimiento, ya que el voltaje de Hall cambia de signo
tanto con la corriente como con el campo invertidos, en tanto que la caída óhmica
cambia de signos sólo cuando la corriente se invierte. Puesto que el análisis de las
mediciones de Hall es muy difícil para muestras intrínsecas o casi intrínsecas, cuando se trata de muestras que no son extrínsecas a la temperatura ambiente a menudo
se prefiere efectuar las mediciones a temperaturas bajas a las que los especímenes
son definitivamente extrínsecos. Esto se aplica sobre todo cuando el objetivo primordial es evaluar la densidad neta de átomos de impureza de las muestras. En estas
circunstancias se requiere usar un crióstato al vacío. También se necesita utilizar
valores de campo magnético estático suficientemente bajos para que w 0 T~ 1, en
donde w 0 es la frecuencia de ciclotrón eE0 /m*c, para que sea válido el análisis de
la sección 9.8. La densidad de portadores de la muestra se puede calcular a partir
del voltaje de Hall de acuerdo con los métodos que ya se desarrollaron y describieron en las secciones 7.6 y 9.8. La movilidad de Hall puede obtenerse combinando
los resultados de Hall y la resistividad; este procedimiento se delineó ya en la
sección 9.8.
11.5
MEDICION DEL TIEMPO DE VIDA
DE LOS PORTADORES EXCEDENTES
La medición del tiempo de vida de los portadores en exceso se logra casi
siempre observando el decaimiento de la fotoconductividad transitoria. La teoría de
esta medición se vio detalladamente en la sección 10.7 y no es necesario que se
agregue nada aquí, excepto una breve descripción del aparato.
Se puede utilizar un tubo de arco de gas de xenón a alta presión (como por
ejemplo, el Edgerton, Genneshausen y Grier XP-12) para excitar la fotoconductividad
de la muestra. Este tubo produce una iluminación muy intensa y repentina que dura
aproximadamente 10- 6 seg. El bulbo o tubo puede usarse en combinación con un
sistema óptico para concentrar en la muestra la mayor cantidad de luz posible. Un
arreglo muy aceptable es montar el tubo de "flash" en uno de los focos de un
Reflector
4000V~~~~~---,
Fuente de
alimentación
de alto
voltaje
Batería de barrido
1111~~+---o
Figura 11.8.
~
Osciloscopio
t----..._--11---o
Representación esquemática para la determinación de los tiempos de vida de los
portadores en exceso a través de las mediciones de fotoconductividad transitoria.
Dislocaciones y otras imperfecciones
413
reflector elipsoidal y la muestra en el otro. El bulbo de "flash" es similar a los que
se utilizan como fuentes lumínicas fotográficas. Se puede operar como un oscilador
de relajación de funcionamiento libre en un circuito como el que aparece en la
figura 11.8, con el fm de obtener "flashes" repetitivos. El decaimiento de la fotoconductividad se observa en un osciloscopio de banda ancha y los tiempos de vida
se obtienen de las curvas de decaimiento observadas aplicando los métodos que se
vieron en la sección 1O. 7 Este método se re!ftringe a tiempos de vida superiores a
w- 6 segundos, ya que la iluminación del bulbo de "flash" no se corta abruptamente, sino que se pierde con cierta constante de tiempo de este orden de magnitud. Se han desarrollado fuentes especiales de chispa que se pueden emplear para
resolver tiempos de vida algo más cortos.
11.6
DISWCACIONES Y OTRAS IMPERFECCIONES
Las dislocaciones son defectos reticulares en cristales que se pueden comprender en función de un deslizamiento interno parcial. Existen dos tipos básicos de
estructuras con dislocación, las de tipo de borde y las de tipo de tornillo. En la
figura 11.9 se muestra el tipo de dislocación de borde. Se puede considerar que este
tipo de dislocación es el resultado de un deslizamiento interno parcial en el plano
ABCD a lo largo de la dirección BC. En la ilustración, la magnitud del deslizamiento
es una distancia interatómica. Se puede pensar que el cristal resultante contiene un
medio plano extra de átomos (ABEF en el diagrama) y está claramente en un estado
de esfuerzo mecánico en la región del borde de dislocación AB tal, que el material
está en tensión por encima del borde de dislocación y en compresión por debajo
de éste.
La dislocación tipo tornillo se ilustra esquemáticamente en la figura 11.1 O. En
esta estructura con dislocación, el deslizamiento se ha desarrrollado paralelamente a
la línea de dislocación, que es normal a la superficie superior del cristal, más que
E
e - Vector de deslizamiento
F
,'
,
Figura 11.9.
..1/
A
Diagrama esquemático de un cristal que contiene una di~locación tipo borde. La
dislocación se puede considerar como producida por un deslizamiento que representa un espaciamiento de red en la dirección BC. Puede pensarse que el cristal
contiene el "plano adicional" de átomos, ABEF.
414
Tecnología de materiales y medición de propiedades volumétricas
Vector de
deslizamiento
Figura 11.10.
Representación esquemática de una dislocación tipo tornillo.
perpendicular a la línea de dislocación, como sucede en el caso de la dislocaciór:
tipo borde. En realidad, las dislocaciones de borde y tomillo pueden considerarse
como diferentes aspectos del mismo fenómeno de deslizamiento interno, como se
indica en la figura 11.11, que es una vista del cristal que aparece en la figura 11.9
con una región de deslizamiento interno de distinta forma. En este caso, la mismé
línea de dislocación (representada siempre por el símbolo 1) es normal al vector de
deslizamiento en la cara frontal del cristal, como en una dislocación de borde, ~
paralela al vector de deslizamiento en un lado, como en la dislocación de tornillo.
Quizá sea más exacto decir que la dislocación posee una orientación de borde en e:
frente y una orientación de tornillo lateral, aunque no se usará aquí rigurosamente
esta terminología.
Las dislocaciones se forman en las etapas iniciales del crecimiento del cristal ~
son responsables de muchas propiedades que se observan en los cristales. En realidad.
fTornillo
/Vector de
¡..___,,__. deslizamiento
Figura 11.11.
Cristal que contiene una región de deslizamiento que origina una dislocación que
tiene, en parte, una orientación de tornillo y, en otra, una orientación de tipo
borde.
Dislocaciones y otras imperfecciones
415
la mayoría de las características observadas del crecimiento del cristal a partir de un
fundente líquido de una solución supersaturada o de una fase de vapor, están gobernadas por las dislocaciones en los cristales de crecimiento más que por cualquier otra
propiedad de la red cristalina perfecta propiamente dicha. La razón de esto es que
los átomos de las fases líquida o de vapor están enlazados a una cara creciente del
cristal con mayor fuerza en un "escalón" en el que termina una capa incompleta de
átomos, que en un sitio aislado en la cara del crecimiento. Esto es cierto porque en
el escalón, un átomo que entra puede unirse a dos átomos de la red cristalina más
bien que a uno sólo. En la figura 11.10 se ilustra esta situación. Por tanto, el
crecimiento procederá con mucha mayor rapidez (o con la misma rapidez a un nivel
mucho más bajo de saturación o subenfriamiento en la fase líquida o sólida) en una
cara de escalón que en una superficie plana completa y estructuralmente perfecta. La
formación de un escalón en un cristal estructuralmente perfecto mediante la coalescencia de varios átomos aishdo~ que se depositan de un modo aleatorio de la fase
líquida o de vapor, es no obstante un suceso de muy escasa probabilidad, ya que
tales átomos no están fuertemente unidos a la cara del cristal y, por lo general, no
se unen a él el tiempo suficiente para enlazarse y formar un escalón de crecimiento;
por lo contrario, casi siempre se sueltan por agitación térmica antes de que esto
pueda ocurrir. Cuando se forma un escalón de esta manera, se extenderá con gran
rapidez a través de la cara del cristal mediante la adición de átomos en los bordes,
en donde se unen con gran fuerza hasta que se haya agregado una nueva capa
atómica. Entonces, el crecimiento posterior procede sólo con gran dificultad, ya que
ahora se debe formar un nuevo escalón sobre la capa añadida.
Sin embargo, la situación es totalmente diferente si el cristal contiene una
dislocación de tornillo, como se ilustra en la figura 11.1 O. La dislocación de tornillo
proporciona un escalón autoconstruido que no se puede eliminar nunca de la cara de
crecimiento mediante la adición subsecuente de átomos. Cuando los átomos se agregan a una velocidad constante al escalón asociado con una dislocación tipo tornillo,
como la que s~ ilustra en la figura, todas las partes del escalón obtienen la misma
veloddad de crecimiento lineal constante. Esto produce una velocidad angular de
crecimiento respecto del centro, que es mayor cerca de la dislocación que lejos de
ésta, y el escalón tiende a tomar una forma espiral arrollándose alrededor de la
dislocación central. Estas configuraciones espirales escalonadas se observan con frecuencia en cristales en crecimiento y proporcionan una evidencia directa de que éste
constituye un mecanismo importante de crecimiento. 8 Sólo estos pequeños núcleos
cristalinos formadQs en un fundido ligeramente subenfriado o en una solución supersaturada, que contienen dislocaciones, son capaces de crecer a un tamaño macroscópico antes de separarse por agitación térmica. Los procedimientos de crecimiento
que se pueden observar en muestras cristalinas ordinarias son procesos que se asocian
con la presencia de dislocaciones de tornillo.
Cuando se aplican esfuerzos a cristales que contienen dislocaciones, se puede
mover la dislocación dentro de ellos. Por ejemplo, si se aplica un esfuerzo cortante
proveniente de una fuerza dirigida hacia la izquierda y aplicada a la parte superior
de la muestra, y una fuerza a la derecha en la parte inferior, en el cristal de la
figura 11.9, la línea de dislocación AB puede desplazarse hacia la izquierda a través
del cristal. Aunque un estudio completo de la mecánica de las dislocaciones está
fuera del alcance de este estudio, casi todas las propiedades mecánicas de cristales
macroscópicos, incluyendo los módulos elásticos, la deformación plástica y por deslizamiento, el endurecimiento con aleaciones y tratamientos térmicos, las propiedades
8 Por supuesto, para ser observables incluso al microscopio electrónico, el vector de deslizamiento de la dislocación de tornillo asociada con estas "espirales de crecimiento" deben extenderse muchas veces sobre la dimensión de la célula unitaria.
416
Tecnología de materiales y medición de propiedades volumétricas
Figura 11.12.
Resolución de un desajuste atómico de una frontera de grano con ángulo
pequeño, mediante la formación de una hilera de dislocaciones tipo borde.
de templado y endurecimiento por trabajo, se pueden explicar en función del movimiento de las dislocaciones y la interacción de éstas mismas, así como con los
átomos de impureza.9 • 10
La formación de fronteras de grano y las regiones de material estructuralmente
imperfecto, asociadas con las fronteras de grano, se pueden estudiar también de
acuerdo con las dislocaciones. En particular, el desajuste entre los planos cristalinos
que se producen en una frontera de grano de ángulo pequeño se puede resolver a
través de la formación de una hilera de dislocaciones tipo borde en dicha frontera, 11
como se ilustra en la figura 11.12. Este tipo de frontera de cristal se denomina a
veces frontera lineal de Burgers.
La presencia de dislocaciones tipo borde en cristales semiconductores se detecta
fácilmente con ataques químicos en la superficie cristalina utilizando ciertos reactivos. Puesto que la red cristalina alrededor de la dislocación ya se encuentra en un
estado de deformación, se requiere menos energía para romper la red en ese punto
que en cualquier otra parte. Como resultado de esto, el ácido ataca la superficie
cristalina con mayor rapidez cerca de las dislocaciones formando pozos claramente
visibles al microscopio que marcan la intersección de las dislocaciones de borde con
la superficie del cristal. En la figura J 1.13 se muestra una fotografía con pozos
atacados con ácido en las dislocaciones asociadas con una frontera de grano de
ángulo pequeño en el germanio. Estas fotografías proporcionan una verificación experimental sorprendente de la representación de una frontera de ángulo pequeño que
se muestra en la figura 11.12, ya que el ángulo de desajuste entre las dos secciones
del cristal se puede calcular a partir del espaciamiento entre los pozos y determinarse experimentalmente a través de mediciones de difracción de rayos X. Por tanto,
9 W. T Read, Dislocations in Crystals, Nueva York: McGraw-Hill, 1953.
10 A. H. Cottrell, Dislocations and Plastic Flow in Crystals. Nueva York:
11 J. M. Burgers. Proc. Phys. Soc. (Londres) 52, 23 (1940).
Oxford, 1953.
Dislocaciones y otras imperfecciones
Figura 11.13.
417
Dislocaciones tipo borde en una frontera de grano con un ángulo pequeño en un
cristal de germanio, tal como las descubren un ataque químico. La amplificación
es aproximadamente 600X ..[Fotografía del autor.]
los dos valores obtenidos concuerdan invariablemente de un modo muy aceptable. 12
En la figura 11.13 se pueden observar también algunos pozos atacados con ácidos
que se originaron por la presencia de dislocaciones aleatorias. En cristales de silicio
se pueden observar directamente las líneas de dislocación mediante la difusión de
cobre en la muestra, y luego observando microscópicamente el interior del cristal
utilizando luz infrarroja de una longitud de onda que sobrepase apenas el borde de
absorción. 13 Se emplea un bulbo convertido de imagen para hacer que el ojo pueda
captar la imagen infrarroja. El cobre, que es opaco a la radiación infrarroja, se
precipita a lo largo de las líneas de dislocación formando trazos oscuros que mar·
can el curso de dichas líneas.
La presencia de dislocaciones en cristales semiconductores también da origen a
ciertos efectos eléctricos. Por ejemplo, en el caso del germanio, parece que las
dislocaciones tipo borde introducen niveles receptores que se localizan a una gran
profundidad, aproximadamente 0.2 eV de energía por debajo del borde de la banda
de conducción. 14 • 15 Además algunas investigaciones independientes han demostrado
que las dislocaciones tipo borde actúan como centros de recombinación en el germanio, y de hecho, el tiempo de vida de los portadores en exceso en germanio de
alta pureza casi siempre tiene un límite marcado por la dislocación.16, 17 La situa-
12 F. L.
Vogel y colaboradores, Phys Rev., 90. 489 (1953).
13 W. C. Dash, J. Appl. Phys., 27, 1193 (1956).
14 G. L. Pearson, W. T. Read y F. J. Morin, Phys. Rev., 93, 666 (1954).
15 W. T. Read, Phil. Mag.,
45, 775 (1954).
16 J. P. McKelvey, Phys. Rev., 106, 910 (1957).
17 G. K. Wertheim y G. L. Pearson, Phys. Rev., 107, 694 (1957).
418
Tecnología de materiales y medición de propiedades volumétricas
Figura 11.14.
•
• • • • •• •
• • • • • •
• • • • • •
• • • • •
• • • • • •
• • • • • •
• • • • • •
• • • • •
• • • • • •
• • • • • •
• • • • • •
• • • • • •
(a)
( b)
Defecto (a) de Frenkel y (b) de Schottky en una red cristalina.
c1on en el silicio y otros semiconductores no se ha investigado con la misma minuciosidad debido a las dificultades técnicas; pero se supone que el caso es similar.
Otro ejemplo importante de una imperfección estructural es la vacante de red.
Existen dos tipos básicos de vacantes de red denominados defectos de Frenkel y
defectos de Schottky, como se ilustra en la figura 11.14. En la formación de un
defecto de Frenke1, un átomo de la red cristalina se desplaza a una posición intersticial dejando una vacante de red tras él, en tanto que para formarse un defecto de
Schottky, uno de los átomos de la región cercana a la superficie se pasa a un sitio
de la superficie dejando tras sí una vacante móvil que luego puede difundirse hacia
el interior del cristal. Existe una energía de activación asociada con la formación de
cualquier defecto de esta índole y, dado que la energía térmica disponible para
contrarrestar la barrera de activación es mayor a alta temperatura, la concentración
de equilibrio de las vacantes aumenta con ésta. Se cree que los defectos de Schottky
predominan en el germanio y en el silicio. Si el cristal se enfría repentinamente
desde una temperatura alta, se puede "congelar" en el interior una concentración de
vacantes por encima de la concentración de equilibrio a temperatura ~biente. El
papel de las vacantes de red en la difusión de átomos de impurezas de substitución.
desde la superficie hasta el interior de la red cristalina, tiene gran importancia. La
presencia de vacantes de red permite que los átomos de la estructura reticular (al
igual que los de impureza) emigren de un sitio de la red dentro del cristal a otro, y
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
• • o • • •
• • • • • •
• • • • • •
• •
• • •
• • • • • •
• • •(a)• • •
( b)
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
•
o
o
o
o
o
•
o
o
• • o
• • o • • •
• •
• • • • • •
• • • • • •
(e)
o
• • • • •
• • • • • •
( d)
o
o
o
o
o
oooeoo
• •
• • •
•
•
o
•
•
•
• • • • • •
(e)
Figura 11.15.
Interdifusión en una interfaz entre dos substancias diferentes, originada por el
movimiento de una vacante de red. Etapas sucesivas en el proceso de difusión.
de (a) a (e).
Dislocaciones y otras imperfecciones
419
con esto se efectúa el transporte por difusion de átomos de impureza superficiales
hacia el interior. Este proceso se ilustra en la figura 11.15. La mayoría de las
características importantes de la difusión de impurezas de substitución en cristales
semiconductores, incluyendo la magnitud de los coeficientes de difusión y su dependencia en relación a la temperatura, concuerdan con el mecanismo de las vacantes.
EJERCICIOS
l. Derive las ecuaciones (11.1-2) a (1 1.1-5) a partir de las consideraciones fundamentales.
2. Se desea hacer crecer un monocristal de germanio tipo p con una resistividad de 2 a 5
ohms-cm mediante la técnica de Czochralski. Como material inicial se utilizarán 500 g de
germanio intrínseco refinado por zonas. ¿Qué cantidad de aleación de impurificación compuesta
de germanio que contiene 0.1 por ciento de galio atómico debe agregarse al fundente para que
la resistividad a la temperatura ambiente de la parte del cristal que crece iniciahnente sea 5
ohms-cm? Se puede suponer que el coeficiente de segregación apropiado es el de equilibrio que
se da en la tabla 11.1. ¿Cómo variará la resistividad del cristal así obtenida en función de su
longitud?
3. Use la teoría electrostática y de corriente uniforme, suponiendo una muestra
semünfinita homogénea e isotrópica, para derivar la ecuación (11.3-3) para el aparato de rt>sistividad
de cuatro puntas. Demuestre explícitamente que la solución satisface todas las condiciones necesarias
de frontera. Nota: Principie tomando en cuenta el campo electrostático creado por una carga
positiva puntual y una carga negativa puntual en el espacio libre.
4. Una frontera lineal de Burgers en un cristal cúbico simple crea una línea de pozos
atacados con ácido, con un espaciamiento de 2 X 10-4 cm, cuando el cristal se ataca químicamente. Suponiendo que la constante de red del cristal es 4 X 10-8 cm, encuentre el ángulo de
desajuste entre las secciones del cristal en los lados opuestos de la frontera lineal.
5. Una punta metálica de prueba establece contacto con un cristal semiconductor semünfinito de una conductividad constante a. Se hace pasar una corriente constante conocida, / 0 , por la
punta hacia el semiconductor. Suponiendo que la interfaz entre la punta de prueba y el semiconductor es una semiesfera de radio a que se extiende dentro del semiconductor, en donde el
centro queda en el plano de la superficie del semiconductor y que no se inyecta un exceso de
portadores a través de la punta, calcule la impedancia (resistencia de dispersión) del contacto.
LECTURAS RECOMENDADAS
W. Bardsley, "The Electrical Effects of Dislocations in Semiconductors," en Progress in Semiconductors, Vol. 4, Heywood and Co., Londres (1960), p. 155.
A. H. Cottrell, Dislocations and Plastic Flow in Crystals, Oxford University Press, Nueva York
(1953).
l. G. Cressel y J. A. Powell, "The Production of High Quality Germanium Single Crystals," en
Progress in Semiconductors, Vol. 2, Heywood and Co., Londres (1957), p. 137.
P. Haasen y A. Seeger, "Plastische Verformung von Halbleitern und ihr Einfluss auf die Elektrische Eigenschaften," en Halbleiterprobleme, Vol. 4, Friedrich Vieweg and Sohn, Braunschweig (1958), p. 68.
N. B. Hannay, "Semiconductor Chemistry," en Proceedings of the lnternational School of Physics, "Enrico Fermi" Course 22 (Semiconductors, Academic Press, Inc., Nueva York
(1963), p. 341.
w. G. Pfann, "Techniques of Zone Melting and Crystal Growing," en Salid State Physics, Advances in Research and Applications, Vol. 4, Academic Press, lnc., Nueva York (1957),
p. 423.
W. G. Pfann, Zone Melting, John Wiley & Sons, Nueva York (1958).
W. T. Read, Dislocations in Crystals, McGraw-Hill Book Co., Inc., Nueva York (1953).
W. Schockley, J. Holloman, R. Maurer y F. Seitz (editores), lmperfections in Nearly Perfect
Crystals, John Wiley & Sons, Nueva York (1952).
R. K. Willardson y H. L. Goering (editores), Compound Semiconductors, Vol. 1, Reinhold Publishing Corporation, Nueva York (1962).
Teoría de las uniones p-n de
los semiconductores
12.1
LA UNION p-n
En capítulos anteriores se trató exclusivamente de los semiconductores que se
suponían uniformes u homogéneos en cuanto a la densidad de átomos de impureza
contenidos en su interior. Ahora se centrará la atención en el estudio de substancias
dentro de las cuales la densidad de impureza puede variar de un punto a otro y, en
particular, en muestras que contienen una región extrínseca tipo n y una región
extrfuseca tipo p separadas por una zona de transición relativamente angosta. Esta
región angosta de transición se denomina unión p-n y con ella se asocian propiedades físicas sorprendentes que, aunque tienen interés específico desde un punto de
vista puramente fundamental, poseen una importancia primordial, ya que constituyen
la base de operación de la mayoría de los dispositivos electrónicos semiconductores.
A continuación se estudiará un cristal semiconductor que contiene una unión
p-n. La transii:ión entre las regiones tipo p y n puede ser abrupta, en cuyo caso se
encuentra unl!. región que contiene una concentración neta más o menos constante
de impurezas donadoras junto a otra que posee una concentración neta más o menos
constante de receptoras. Por otro lado, la unión puede ser graduada, en cuyo caso,
N d y Na son funciones de la distancia a la unión en dirección de la normal, donde
Nd decrece gradualmente empezando con un valor grande y Na aumenta en la
misma forma a partir de un valor pequeño, conforme se acerca a la unión desde el
lado tipo n; las dos cantidades se igualan en la unión y Na sobrepasa a Nd en el
extremo de la unión dentro de la región p. Estos dos casos se ilustrat'l en la
figura 12.1. En este estudio, el mayor énfasis se dará a las uniones abruptas, ya que
son mucho más sencillas de analizar matemáticamente, puesto que ilustran la mayoría de las características importantes relacionadas con el comportamiento de las
uniones p-n en general y, ya que, para la mayoría de dispositivos más importantes,
la representación aproximada de la unión abrupta es aceptable. No obstante, debe
hacerse notar que en muchos casos la uniones p-n de las estructuras de dispositivos
semiconductores (sobre todo las que se producen una conductividad tipo n o p en
un substrato de conductividad opuesta) son uniones graduadas. Se intentará señalar
cualitativamente por lo menos, las diferencias existentes entre las conducta física de
las uniones abruptas y graduadas, siempre que se presente la ocasión.
421
422
Teoría de las uniones p-n de los semiconductores
----------~~------------ --x
tipo-n
Figura 12.1.
tip01J
tipo-p
ti po-n
Unión
Unión
(a)
(b)
Concentraciones de átomos de impureza en la cercanía de (a) una unión p-n
abrupta y (b) una unión p-n graduaL
Supóngase que de alguna manera se forma instantáneamente una unión abrupta
p-n juntando una muestra uniforme tipo p con otra tipo n 1 para formar un solo
cristal. En el instante de formación existe una concentración uniforme nno de electrones libres móviles y Pn 0 de huecos libres móvibles en el lado n, extendiéndose
hasta la unión, y en el lado p, una concentración uniforme Ppo de huecos móviles y
npo de electrones libres que se extiende también hasta la unión. Estas concentraciones están relacionadas con las densidades netas de donadores y receptores Nd y
Na por medio de {9.5-23) y {9.5-24), en tanto que en ambos lados las densidades de
electrones y huecos satisfacen la relación
(12.1-1)
Puesto que la concentración nn 0 de electrones del lado n es mucho mayor
que la concentración de electrones npo del lado p, en el instante de formación
existe un gradiente enorme en la concentración de electrones en la unión entre
ambas regiones. La misma situación existe con respecto a la concentración de huecos en la misma unión. Los grandes gradientes iniciales de concentración establecen corrientes de difusión que hacen que los electrones de la región n y los huecos
de la región p fluyan descendiendo por los gradientes de concentración respectivos
hasta la región de conductividad de tipo opuesto y dejando a la región cercana a la
unión, vacía de portadores mayoritarios. No obstante, este flujo de difusión inicial
no puede continuar indefinidamente, debido a que en las regiones cercanas a la
unión hay deficiencia de portadores mayoritarios, las cargas de los iones fijos donadores y receptores cercanos a la unión ya no están balanceadas por las cargas de los
portadores libres móviles que estaban allí inicialmente, de modo que se establece un
campo eléctrico. La dirección de este campo eléctrico es tal que se opone al flujo
de los electrones que salen de la región n y al flujo de los huecos que salen de la
región p, y la magnitud de campo se desarrolla hasta el punto en que su efecto
contrarresta exactamente la tendencia de los portadores mayoritarios a difundirse.
descendiendo por la "pendiente" de concentración hacia la región de conductividad
1 La formación de una unión de esta manera es sólo un experimento imaginario y no
puede efectuarse en la práctica. La estructura de la unión p-n debe existir como un monocristal
casi perfecto y sólo se puede obtener impurificando debidamente el fundente "contraimpurif¡.
cándolo" (o agregándole impurezas de otro tipo), conforme va creciendo el cristal o bien.
utilizando alguna difusión especial o proceso de aleación con que se logre prácticamente el
mismo resultado.
La unión p-n
tipo-p
Unión
tipo-n
1
+e e +e+ e 1 e e
e +e +e e+ 1
e
~ +
+ e
1 Carga
+ 'é +e e+ e 1-espac!al
e+
l negativa
e
+ + e
e
EB
EB
1
1
EB
1
EB
EBI
IEB
Carga __j
espacial
positiva
1
EB
e
e
+
IEB
1
+ e+e++e e le ee
e+
e
+¡e
e
e + + e e ¡e
+ + e
e+ +
e
e
ee +
ee 1
e
+
¡e
++ee+e
e
+
1
e
<i> Iones fijos de impurezas donadoras
e Iones fijos de impurezas receptoras
Figura 12.2.
EB
EB
ee 1
e
+ + + ¡e
e
EB
EB 1
e e e e
~1
e
1 EB
' EB
Cam~o ehfctrico
e+e+e; e le
EBI
e+
e+
+
1
e
e+
e
+ e
EB
EB
1
+ + + e +e 1 e e
+e
+
423
1
-
EB
EB ¡-EB
1
1
EB
JEB-
EB
J
- Electrones libres
+ Huecos libres
Diagrama que ilustra la formación de las capas de carga espacial y el campo
eléctrico interno mediante la difusión de portadores mayoritarios cerca de una
unión hacia la región con un tipo de conductividad opuesta.
opuesta. Entones se establece una condición de equilibrio dinámico en la que la
región cercana a la unión queda vacía de portadores mayoritarios y en la que
forman fuertes capas de carga espacial que contienen campos eléctricos altos cerca
de la unión. Esta situación se ilustra en la figura 12.2 y, de acuerdo con ella, es
evidente que la configuración de carga espacial es una caplt dipolar eléctrica con
iones donadores no compensados en el lado n y iones receptores no compensados en
el lado p, proporcionando los componentes de carga positiva y negativa respectivamente.
Uno de los resultados más conocidos de la electrostática es que se produce una
diferencia de potencial entre los dos límites extremos de una capa dipolar eléctrica,
que se relaciona con la intensidad (momento dipolar por unidad de área) de la capa
mediante
(12.1-2)
en donde r/> 1 y r/> 2 son los potenciales de borde y .d es la intensidad de la capa
dipolar. Por supuesto, más allá de las regiones de la carga espacial no existe una
densidad de carga y, por tanto, el potencial electrostático es constante. De acuerdo
con (12.1-2), la energía potencial de un electrón "en reposo" situado en la base de
la banda de conducción es 41Te .d menor en un lado de la unión que en el otro. Se
puede formular el mismo enunciado para un hueco "en reposo" que esté en la parte
superior de la banda de valencia. Sin embargo, puesto que el estado del sistema es
de equilibrio térmico, la energía de Fermi e¡ debe ser la misma en todo el sistema.
Estas consideraciones permiten describir las bandas de energía abrupta tal como se
424
Teoría de las uniones p-n de los semiconductores
fEnergfa potencial de electrones
;;;__+___
••p _ _ _ _ _ _ _ _
1
1
----------------t-..
•,
1
-
1
1
1
1-
',
...
--
-- - ~
-----
t:n
•,-x
1
++ +++++++ +++ + +
0._--~------,------+ ++ +
+ + + +1 + +
-e </>(X)
+
+
+ 1
---------:---+
+ :
1
+
+
+
+ •••
--r--sc- +sc+-
•rp +++
~-+-1
tip01)
(Densidad de receptores N0 )
Figpra 12.3.
Unión
ti po-n
(Densidad de donadores Nd)
Diagrama de la energía potencial en el que se muestra la configuración de bandas
de energía cerca de la unión p-n en ausencia de un voltaje aplicado.
ilustra en la figura 12.3. Evidentemente, existe un "potencial de contacto interno··
e(cp 2 - cp 1 ) = ecp0 desarrollado entre las dos regiones. En esta misma figura se pueden ver
claramente las tendencias de oposición de los gradientes de concentración y los campos
eléctricos; los electrones <k: la banda de conducción del lado n se difundirían obvia·
mente descendiendo por el gradiente de concentración lado p, si no fuera por la
"pendiente" del potencial eléctrico que deben vencer para lograrlo.
12.2
EL POTENCIAL DE CONTACTO INTERNO DE EQUILIBRIO
El valor del potencial de contacto interno cf>o se determina fácilmente a partir
de los valores de la densidad de electrones (o huecos) en equilibrio a ambos lados
de la unión, lejos de las regiones de carga espacial. De acuerdo con (9.3-6), se puede
escribir
(12.2-1)
para la densidad de electrones en el lado n y, para la densidad del lado p,
(12.2-2)
De ~stas ecuaciones se pueden despejar €en y ecp y la diferencia de energía
potencial interna ecp 0 , que, como se puede ver claramente en la figura 12.3 no es
más que la diferencia entre las dos, por lo cual está dada por
n.o
el/> 0 = ecp - ec• = kT ln-.
npo
(12.2-3)
Esto se puede escribir de un modo diferente utilizando (12.1-1) para expresar
npo en función de Ppo, como
,~,
_ kT 1 n.oPpo
'I'O-
e
n
2
11¡
·
(21.2-4)
El potencial de contacto interno de equilibrio
425
Si todos los donadores y receptores de las regiones n y p están ionizados,
como lo estarán a todas las temperaturas, excepto las muy bajas, y si las dos
regiones p y n son fuertemente extrínsecas, entonces, de acuerdo con (9.5-25) y
(9.5-26) nno ~Na y Ppo ~Na, por lo cual, (12.2-24) se convierte en
( 12.2-5)
La aplicabilidad de estas fórmulas está evidentemente limitada a situaciones en
que las estadísticas de Boltzmann se pueden utilizar para describir la distribución de
equilibrio de los portadores, tanto en la región p, como en la n.
A continuación se examinará lo que sucede cuando se aplica un voltaje externo
a la muestra que contiene una unión p-n. Es obvio que, puesto que las regiones de
carga espacial a ambos lados de la unión tienen una deficiencia de portadores, estas
regiones poseen una resistividad mucho mayor que cualquier otra parte del cristal.
Esto significa que cuando se aplica una fuente de voltaje externo a la muestra en
que se tiene una región p-n, como sucede en la figura 12.4, casi toda la caída de
voltaje se producirá en estas regiones. Prácticamente en todas las condiciones, excepto aquellas en las que se aplica un voltaje grande con la "polaridad en directo" que
se indica en la figura 12.4(a), las caídas de voltaje en las regiones uniformes n y p
que quedan fuera de las capas de cargas espacial cerca de la unión, son despreciables
en comparación con la caída que se registra en la región de la unión misma. Si la
unión p-n se usa como rectificador, se obtiene una condición de baja impedancia
cuando la región n se conecta a la terminal negativa y la región p a la positiva de la
fuente externa de voltaje, como se señala en la figura 12.4(a). Esta polaridad se
conoce como estado de polarización directa. Se acostumbra considerar que el signo del
potencial externamente aplicado en este caso es positivo. En la figura 12.3 se ve
claramente, que cuando se aplica el voltaje externo en esta forma, el efecto es
reducir la altura de la barrera de potencia. como se muestra en la figura 12.4(a). Si
la caída de voltaje en las regiones volumétricas n y p que quedan fuera de la capa de
carga espacial es despreciable en comparación con la que se produce en la unión, la
altura de la barrera intensa será e(!/Jo - V0 ) en donde V0 es el voltaje externo. Si se
invierte la polaridad de la fuente de potencial externo (en cuyo casos su signo se oonside·
rará negativo), se observa claramente en la figura 12.3, que la altura de la barrera de po-
~
y~
V0
(Positivo)
e (1(>0 -1{¡)
- -~,
----!----
~
V0 (Negativo)
.
eof>o
-~ ----1---
"'-. Con el potencial
'------ aplicado
''
' ... _
L
--"'10.
............_____
'Aplicando
potencial
____¡~ ___ )~""-----
Aplica~d1o
f
~
eof>
t-
potenc1a
Sin aplicar
potencial
(O)
Figura 12.4.
(b)
Diagrama de la energía potencial que presenta el efecto de (a) un voltaje de
polarización directa y (b) de polarización inversa en la configuración de bandas de
energía en una unión p-n.
426
Teoría de las uniones p-n de los semiconductores
tencial interno se ha incrementado como se ilustra en la figura 12.4(b ). Si la caída entre
las regiones n y p que quedan fuera de la unión se desecha en comparación con la caída en
las regiones de carga espacial de la unión, también es obvio que la altura de la barrera se
puede representar como e(tf>o - ~0 ) en donde Voz es ahora una cantidad negativa. En
estas circunstancias, como se verá detalladamente más adelante, la estructura presenta
una independencia muy alta y se dice que el voltaje aplicado es una polarizadór:
inversa.
12.3
POTENCIALES Y CAMPOS EN LAS CERCANIAS
DE UNA UNION p-n
Ahora se verá el modelo general de una unión p-n como la que se ilustra en la
figura 12.5. Como se ha representado en esta figura, existe un voltaje aplicado V 0
(negativo en el dibujo) al igual que un potencial interno t/> 0 . En estas circunstancias.
se tendrán flujos de corrientes eléctricas y el estado del sistema ya no será de
equilibrio térmico. Por esta razón, no se puede definir ya un nivel único de Fenm
para todo el cristal. Sin embargo, se supondrá que lejos de la unión prevalecen las
condiciones de equilibrio y que las densidades de huecos y electrones en esos puntos
se pueden describir mediante las distribuciones de Fermi relacionándolas con los dos
niveles de Fermi E¡no y E¡po· Por supuesto, si no se aplica un voltaje, el sistema
estará en equilibrio y E¡no y E¡po serán equivalentes; pero como están las cosas, es
obvio, de acllerdo con la figura, que deben diferir en eV0 • Cuando se aplica un
voltaje a la unión, resulta que, como se demostrará sin lugar a dudas más adelante.
la concentración de portadores minoritarios en las regiones n y p contiguas a las
capas de carga espacial se ven seriamente perturbadas en sus valores de equilibrio, en
tanto que la concentración de portadores mayoritarios se ven muy afectados en lo
-e4>(x)
<cp-----------~
Densidad de donadores Nd (xl
T
.,P(x)
'fpo -......._:---------"""T"--t---;-+T---f'"'-f~p
' ',
-l,
-+-~-+-~-.l-- ---x
..... ,
' ',
v:_o_:-:lla=-----~'cl-~=---t--------'--'-'..::.-:::.
' ' [ .... - ---e. . .
• ,. (x)
1
Densidad de receptores N.lxl
tipo-p
Figura 12.5.
"-+--------- ...
1
¡---se
'
x=-x 0 _
+se-¡
un¡ón
x=O
tipo-n
Diagrama que ilustra los detalles de los potenciales en las bandas de energía y los
niveles casi Fermi de una unión p-n en presencia de un voltaje aplicado.
Potenciales y campos en las cercanías de una unión p-n
427
que respecta a sus concentraciones de equilibrio. La razón se puede entender al
estudiar la figura 12.5, en donde se muestra una unión con polarización inversa. La
barrera alta de potencial evita que los electrones del lado n y los huecos del lado p
se "derramen sobre" la unión hacia el lado opuesto; por otro lado, la presencia de
la barrera favorece a los portadores minoritarios (huecos en el lado n y electrones en
el lado p) para que se deslicen bajando por la pendiente de potencial hacia el lado
opuesto de la unión, en donde se convierten en portadores mayoritarios. Esto reduce notablemente la concentración de portadores minoritarios cerca de la unión.
Cuando se aplica una polarización directa, la altura de la barrera se reduce y los
electrones de la región n, y los huecos de la región p se derraman sobre la unión
convirtiéndose en portadores minoritarios en el lado opuesto. Sin embargo, también
en este caso la concentración relativa de los portadores minoritarios se ve mucho
más afectada que la concentración de portadores mayoritarios. 2
El resultado es que, cerca de la región de la unión, mientras que las poblaciones de electrones y huecos se caracterizan independientemente por distribuciones
de Fermi, existen dos diferentes "niveles efectivos de Fermi" o "niveles quasi Fermi",
uno para la población de electrones y otro para la de huecos. Estos niveles casi
de Fermi se representan como e¡n para los electrones y e¡p (para los huecos) en
la figura 12.5. Lejos de la unión, en la región n, la concentración de equilibrio
de los huecos recibe poca influencia por el efecto de los huecos cercanos a la unión
y que se deslizan por la "pendiente" de potencial hasta la región p y, por tanto,
los niveles efectivos de Fermi para electrones y huecos son casi iguales. Sin embargo, conforme se acerca a la unión, la concentración local de los huecos desciende
por debajo del valor de equilibrio como resultado de este efecto, en tanto que la
concentración de electrones raramente se ve afectada. Entonces, como se indica
en la figura 12.5 el nivel efectivo de Fermi de los electrones permanece igual en
tanto que el nivel efectivo de Fermi para los huecos se eleva a partir de equilibrio, correspondiente a una concentración más pequeña de huecos en la región n
cerca de la ur.ión. Se produce un efecto similar invirtiendo los papeles de los niveles
casi de Fermi de electrones y huecos en la región p, al otro lado de la unión. El
comportamiento de los niveles casi de Fermi de huecos y electrones debe ser algo
semejante a lo que se indica en la figura.
En conexión con los cálculos acostumbrados casi siempre se supone que el
nivel casi Fermi de los portadores minoritarios ha llegado al valor de equilibrio
asociado con la misma especie de portadores que son los mayoritarios en la región
volumétrica al otro lado de la unión. Entonces, en la figura 12.5, el valor de e¡p en
A casi siempre se supone igual al valor de equilibrio en el extremo izquierdo, y el
valor de e¡n en B se supone idéntico al de la extrema derecha. Esto significa
sencillamente que los portadores de la misma especie en las orillas opuestas de la
región de carga espacial de la unión poseen la misma distribución de energía, en
virtud de la eficiencia de los procesos de colisión que se producen en dicha región.
Esta suposición lleva a una condición de frontera en las concentraciones de portadores de la unión que serán de gran utilidad en el siguiente capítulo. Puesto que,
por ejemplo, para los electrones, la distancia entre la banda de conducción y el nivel
efectivo de Fermi para electrones en el lado n es en e(cp 0 - V0 ), menor que la
distancia correspondiente en el lado p como se ilustra en la figura 12.5, entonces, la
2 El requisito de neutralidad eléctrica en el material lejos de la unión, origina también una
alteración en la densidad de los portadores mayoritarios. Sin embargo, puesto que la densidad de
portadores mayoritarios en equilibrio es mucho mayor que la densidad de portadores minoritarios
en equilibrio, la adición de un número dado de electrones y huecos puede dar como resultado
un incremento en la densidad de portadores minoritarios de muchos órdenes, al tiempo que
aumenta la densidad de portadores mayoritarios en sólo un pequeño porcentaje.
428
Teoría de las uniones p-n de los semiconductores
razón entre la concentración de electrones en el borde de la región de carga espacial
en el lado n, y la que prevalece en el borde de la región de carga espacial en el
lado p, debe estar dada por
- _n.:.:."(.:. _X_:o.:. _+_:_)_ _
np( -x 0 _) -e
e(</>o- Vo)/kT
(12.3-1)
'
en donde las coordenadas x 0 + y - x 0 _ se refieren a la ubicación de los bordes de
la región de carga espacial en los lados n y p de la unión, respectivamente. Siguiendo un razonamiento similar, las concentraciones de huecos a ambos lados debe estar
relacionada por
Pi -Xo_) =
e•<<l>o-Vo)/kT
(12.3-2)
P.(xo +)
Al escribir estas ecuaciones, se supone que la aproximación de Boltzmann es
válida.
El potencial y el campo eléctrico en las regiones de carga espacial se puede
encontrar a partir de la ecuación de Poisson. En el caso en donde la densidad de
carga varía sólo en la dirección x, la ecuación de Poisson se puede escribir como
d 2 </J
-
dx
2
4np(x)
4ne
K
K
= - - - = - - (p- 11 + Nlx)- N.(x)).
(12.3-3)
Para mayor facilidad, se escogerá el origen que se indica en la figura 12.5 tal
que en ese punto el potencial sea cero. 3 Además, la función de potencial ¡j>(x), que
contiene una constante arbitraria adicional, se definirá en relación con los bordes de
la banda de conducción y valencia de tal modo que tenga la posición del nivel
intrínseco de Fermi con respecro a ellos. En estas circunstancias se puede escribir
(1 2.3-4)
y
(12.3-5}
De igual manera, ec(x) y ev(x) se relacionan con if>(x) por medio de
(1 2.3-6)
y
(12.3-7)
Al substituir estos valores en la ecuación de Poisson (1 2.3-3), se obtiene
2 </J
d_
4ne
= _ _ (U e-<•t.-<v;+e<t><xl)!kT _U e-<-e<t>(x)+<,,-, .,¡¡kr
dx2
1
K
v
+ Nix)- N.(x)).
e
( 12.3-8)
3 Por ahora se supone que las densidades de donadores y receptores son funciones de la
distancia aunque la figura 12.5 se ha dibujado, para mayor simplicidad, como si fueran constantes.
Modelo matemático simplificado de la unión p-n abrupta
429
En casi todas las circunstancias, la solución de esta ecuación constituye un
problema complejo y difícil. Este estudio se limitará a examinar varios casos particulares que pueden comprenderse en términos relativamente sencillos. Por ejemplo, sea
un sistema en el que el voltaje aplicado es cero. En este caso, e¡n = e¡p = e¡, y
(haciendo referencia a la figura 12.5) es evidente que,
(12.3-9)
de donde, (12.3-8) se puede expresar como
d 2</J = 4nen¡ (ee<P<-<l!H _ e-etP<x)fkT _ Nd(x) + Na{x))
dx 2
"
11¡
n¡
4nen¡ (
e</J(x) Nk'C)- Na("<))
= - - 2senh - - .
"
/..T
( 12.3-10)
11¡
Esta es la ecuación diferencial fundamental que debe resolverse para obtener el
potencial tj>(x ). Para una unión abrupta se tiene que
N.(x) = N.= const}
Nd(x) =O
(x <0)
(12.3-11)
N.(x) =O
}
Nix) = Nd = const
(x >O)
(12.3-12)
y
en cuyo caso, (12.3-1 O) da dos ecuaciones, una para el potencial cp_ (x) en la región
(x < 0), de la forma
. h erp- N •)
-dx2
- =4nen¡
-K - ( 2 Sll1
--+kT
n¡
d 2 </J _
(x < O)
(12.3-13)
y otra para el potencial tP+(x) en la región (x > 0), que se puede escribir como sigue
d) . (x > O)
dz</J + = 4nen¡ (2 senh e</J + - N
dx 2
K
kT
n¡
(12.3-14)
Estas ecuaciones se deben resolver para tP+(x) y tf>_(x) utilizando condiciones
de frontera apropiadas, que se verán en la siguiente sección. Desafortunadamente,
estas ecuaciones tampoco se pueden resolver con precisión por medios analíticos, de
manera que se deben introducir métodos numéricos o métodos físicos aproximados.
A continuación se analizará un modelo simplificado que se basa en las ecuaciones
precedentes y que admite una solución matemática exacta incluso cuando se tiene
un voltaje externo y que representa muy aproximadamente a la unión p-n abrupta
en casi todas las circunstancias de importada práctica.
12.4
MODELO MATEMATICO SIMPLIFICADO
DE LA UNION p-n ABRUPTA
En ciertas condiciones, se puede obtener una solución aproximada para una
unión p-n abrupta. Obsérvese que de acuerdo con (12.3-4) y (12.3-6), la concentra-
430
Teoría de las uniones p-n de los semiconductores
p(x)
eNd 1------r:-,...,
\
\
~------~-~x~o~------1--------~~'------~--.x
''\
Xo+
1
1
1
\
1
1
'
-eN0
1
j---sc -1----+sc
tipo-p
Unión
Densidad de receptores N.= const.
Figura 12.6.
-.j
tipo-n
Densidad de donadores Nd =const.
Densidad real de carga (curva punteada) y la densidad de carga supuesta en el
modelo aproximado de la sección 12.4 (curva continua) correspondientes a una
unión abrupta p-n para la que <Po ~kT/e.
cton de portadores varía exponencialmente en función de rp, de modo que la densidad de portadores disminuirá a un valor despreciable en comparación con el nivel
volumétrico existente lejos de la unión, conforme la energía potencial del borde de
la banda -erp varía por unos cuantos múltiplos de kT. Si la caída total de potencial
en la unión, rp 0 - V0 , es mucho mayor que kT, habrá una variación de la energía
potencial de varias veces kT que se logrará en una distancia relativamente pequeña
en comparación con la extensión lineal total de la región de carga espacial de la
unión. En estas circunstancias, la densidad de carga llega rápidamente a un valor
constante -eNa conforme se penetra a la región de carga espacial desde la región p.
y un valor constante eNd conforme se penetra a la región de carga espacial desde el
lado n, como lo indican las curvas punteadas de la figura 12.6.
En esta situación, un método bastante aproximado consiste en representar la
densidad de carga espacial mediante un valor positivo constante eNd, tratándose de
la parte del lado n que se encuentra entre la unión y el borde de la capa espacial
en este lado -y no más allá-, y representarla mediante un valor negativo constante
-eNa en el lado p de la unión hasta el borde de la región de carga espacial, y no
más allá de este punto. De acuerdo con esta aproximación, la densidad de carga se
representa mediante la línea continua de la figura 12.6. Por fortuna, la mayoría de
las uniones abruptas p-n que tienen un interés práctico satisfacen la condición
e(cfJo - Vo)~ kT en la que esta representación aproximada de la situación real es
aceptable.
Si el potencial electrostático se denota por rp+(x) para x >O, y por rp_(x) para
el potencial en la región x <O, y si se asignan los valores x 0 + y -x 0 _ a las
coordenadas de los bordes de las regiones de carga espacial en los lados n y p
respectivamente, la ecuación de Poisson toma la forma
(O<x<xo+),
(12.4-1)
(-x 0 _<x<0)
(12.4-2)
Modelo matemático simplificado de la unión p-n abrupta
431
y
(x > x 0 + ; x < -x 0 _).
(12.4-3)
Si se supone que todo el voltaje aplicado a la muestra aparece como una caída
potencial en la región de la unión, entonces, en las regiones que quedan más allá de
las fronteras de las capas de carga espacial el potencial debe ser constante, por lo
cual,
cp+(x) = <f>+(x 0 +) = const
(12.4-4)
<f>_(x) = <f>_( -x 0 _) = const
(12.4-5)
Evidentemeate, estas soluciones satisfacen (12.4-3). Puesto que la caída total
de potencial en la región de la unión es rp 0 - V 0 , se debe tener también que
(12.4-6)
Además, se puede demostrar fácilmente, de acuerdo con el teorema de flujo
eléctrico de Gauss, que el campo eléctrico debe ser continuo en todas partes excepto
en una superficie que tiene una verdadera distribución de carga superficial. Se recomienda al lector que efectúe la comprobación de este postulado como ejercicio. Esto
significa que en la unión,
-E+(O) = ( -d<f>+) = (d<f>_)
= -E_(O) = -E0
dx 0
dx 0
(12.4-7)
en donde E+(x) y E_(x) representan los campos en las regiones (x >O) y (x <O) y
E 0 es el valor común en el origen.
Las ecuaciones (1 2.4- 1) y (1 2.4-2) se pueden integrar para obtener
y
d<f>_ 4neNa
- = - - x + B = -E_(x)
dx
K
(O<x<x 0 +)
(12.4-8)
(-x 0 _<x<O)
(12.4-9)
en donde A y B son constantes arbitrarias. De acuerdo con (12.4-4) y (12.4-5), más
allá de los límites Xo+ y x 0 _ de la región de carga espacial, el campo es cero y,
puesto que el campo debe ser continuo en todas partes, (1 2.4-8) debe dar drp+fdx = O
en Xo+ y (12.4-9) debe dar drp_jdx =O en x = -x 0 _, por lo cual,
4neNd
A = - - x0 +
y
4neNa
B=--Xo-
K
(12.4-10)
K
Y (1 2.4-8) y (1 2.4-9) se convierten en
d<f>_
dx
4neNa
- - = - - (x 0 +- x) = -E+(x)
K
(0<x<x 0 +)
(12.4-1 J)
432
Teoría de las uniones p-n de los semiconductores
y
d4J_
-
dx
4rreNa
= - - (.x + x 0 _) = -E_(x)
(-x 0 _<x<0)
(12.4-12)
K
mientxas que, por supuesto,
(x > x 0 +; x < -x 0 _).
(12.4-13)
Si en (12.4-11) y (12.4-12), x se iguala a cero, entonces, haciendo referencia a
(12.4-7), es evidente que
4neN.x 0 _
(12.4-14)
K
y, por tanto, que
(12.4-15)
De acuerdo (12.4-15), la razón de las anchuras de las dos capas de carga
espacial es la inversa de la razón de las densidades de impureza respectivas. Esto
implica que el número total de cargas positivas y negativas en cada capa es la
misma.
Al integrar una vez más (12.4-11) y (12.4-12), el potencial se obtiene como
(O<x<xo+)
(12.4-16)
(-x 0 _<x<O)
(12.4-17)
y
2neN.
2
4J_(x) = - - (x + x 0 _) +D.
K
El punto cero del potencial se puede escoger arbitrariamente; para mayor facilidad se seleccionará de tal modo que cf>+(O) = cf>_(O) =O. Si se substituye esto una
vez en (12.4-16) y (12.4-17), se pueden evaluar tanto C, como D. Combinando estos
resultados con (12.4-4) y (12.4-5) se ve claramente que el potencial debe tener la
forma
(0 <X< Xo+)
( 12.4-18)
2neN.
4J_(x) = - - [(x + x 0 _) 2 -
x~_J
K
(-x 0 _<x<O)
(12.4-19)
= 'l'_.. (- Xo- ) = _ 2rreN.x~- .
K
(x < -x 0 _)
Modelo 111/ltemiÍtico simplificaclo de 14 unión p-n abrupta
433
Ahora, las expresiones para el campo y el potencial han quedado completas,
excepto que las distancias Xo+ y x 0 _ no se han especificado todavía. Para obtener
los valores de estas cantidades, los valores de cf>+(x 0 +) y cf>_(-x 0 _) dados por
(12.4-18) y (12.4-19) se pueden substituir en la condición de frontera (12.4-6), de
donde,
(12.4-20)
En esta ecuación, x 0 _ puede expresarse en función de x 0 + mediante (12.4-15),
y la expresión resultante se puede resolver para x 0 +, lo cual da
K((j> 0 - Vo)
Xo+ =
2ne
Na
Ni N d + N a)
(12.4-21)
De acuerdo con (12.4-15), x 0 _ se puede obtener en la forma
(12.4-22)
Entonces, la anchura total combinada de las regiones de carga espacial es
Xo = Xo+ + Xo- =
J
K( 4>o - V0) (
2ne
1
1)
Nd + Na
(12.4-23)
y el campo E 0 en la unión, de acuerdo con (12.4-14), se puede expresar como sigue
Eo = J8ne(4>o - V0 )
K
(..!.. + ..!..)
Nd
Na
1
= 2(4> 0 - V0 )
Xo
(12.4-24)
Se debe hacer notar que x 0 +, x 0 _ y E 0 , están relacionadas con las densidades
de impurificación Nd y Na de un modo directo, como se demostró antes, y también
a través de cf>o, que es una función de Nd y Na tal y como lo expresa (12.2-5),
aunque la variación logarítmica de cf>o en función de Nd y Na es mucho más lenta
que la variación directa.
En la figura 12.7 se presentan las gráficas de la densidad de carga espacial, el
campo eléctrico y las variaciones del potencial electrostático tal y como los presenta
la teoría anterior, para una polarización cero, una polarización directa (V0 >O) y
una polarización inversa (V0 < 0).
De acuerdo con esta figura o con las ecuaciones anteriores, es obvio que
(a) La capa de carga espacial tiene mayor extensión en regiones tipo p o n
levemente impurificadas, que en regiones con impurificación mayor. Para
una unión dada, la capa de carga espacial se extiende más dentro de la
región en la que la impurificación es menos fuerte.
(b) El valor máximo de campo E 0 es muy alto en las uniones en donde las
regiones p y n están fuertemente impurificadas, y mucho más pequeño en
las uniones en donde una o ambas regiones están levemente impurificadas.
(e) En condiciones de polarización inversa, las regiones de carga esp1cial se
extienden hacia afuera dentro del cristal; la extensión cf;- las !..egion~~..!!,e _
434
Teoría de las uniones p-n de los semiconductores
P(x)
E(x)
V¡¡=O
t
eNd 1----rL,------,
V.> O
o
1
_j
l
V.o< O -!11
1
!
-x
/
\
!
!
L--- -L-t-~-==l- eNo
\
1
/
\
\
1
/
/
\Ea
\
-
V¡¡<O /
\ Ea
( b)
4> ( x)
'
\
/
\.-/
\
1
(a)
/ -x
/
/
/
/
Eo
V¡¡< O
------ ...... ...
''
''
--"------v;>_o______\ ,
\
\
\~
\
\
\
. -------
\
\
\
\
\
\
(e)
Figura 12.7.
' ' ...
' ... ...
Representación esquemática de (a) densidad de carga, (b) el campo eléctrico y (e)
el potencial en las cercanías de una unión abrupta p-n en presencia de varios
voltajes aplicados, según se calcularon de acuerdo con los métodos de la sección
12.4.
carga espacial puede hacerse muy grande en uniones en donde la región n
o la p esté ligeramente impurificada. Para - V 0 ~ 1/Jo (una gran polarización
inversa), la extensión de las regiones de carga espacial es proporcional a
(-V0 ) 1 12 , de acuerdo con (12.4-21) y (12.4-22).
(d) En condiciones de polarización inversa, el campo máximo E 0 se hace muy
grande; a una gran polarización inversa, es proporcional a (- V0 ) 1 12 •
Estas conclusiones, aunque se han verificado para un modelo específico de
unión abrupta, son bastante gen~rales y aceptables para todas las uniones p-n de
semiconductores, ya sean abruptas o graduales (aunque para uniones graduales, la
dependencia de raíz cuadrada que se menciona en (e) y (d) ya no es cuantitativamente correcta).
Las relaciones derivadas en las páginas anteriores son bastante exactas para las
condiciones de polarización inversa; pero no debe esperarse que se apliquen perfectamente a polarizaciones directas elevadas. En este último caso, se tiene grandes flujos
de corrientes y existen caídas de voltaje apreciables en las regiones volumétricas
fuera de las capas de carga espacial de la unión, que hacen que la caída de voltaje
Capacitancia de unión; determinación del potencial interno
435
4> (x)
Figura 12.8.
Representación aproximada del potencial cerca de una unión abrupta p-n en
condiciones de intensa polarización directa.
de dicha umon sea diferente del voltaje externamente aplicado. Entonces, el potencial adquiere una forma semejante a la que se ilustra en la figura 12.8. En la
tabla 12.1 se dan algunos valores numéricos para las propiedades de las capas de
carga espacial asociados con uniones p-n típicas del germanio.
12.5
CAPACITANCIA DE UNION; DETERMINACION
DEL POTENCIAL INTERNO
Los resultados de la sección anterior sugieren claramente que una unión p-n se
comporta en muchas formas de un modo semejante a un capacitar de placas paralelas. Se tienen dos capas de carga espacial que contienen cantidades iguales y opuestas de carga, y la cantidad de carga perteneciente a las capas aumenta conforme se
incrementa el voltaje inverso. La carga asociada con un área unitaria de la región de
carga espacial positiva en el lado n de la unión, es claramente el producto de la
densidad de carga eNd y el volumen x 0 + de la región de carga espacial correspondiente a una unidad de área de la unión. La carga por unidad de área de capa de
carga espacial negativa en el lado p, se puede calcular en la misma forma. En ambos
casos, se ve claramente con la ayuda de (12.4-21) o (12.4-22), que la carga por
unidad de área de unión es
(12.5-1)
Un pequeño incremento del voltaje aplicado LlV0 se verá acompañado por un
cambio LlQ en la carga almacenada. Si la capacitancia diferencial por unidad de área
asociada con la unión a este valor de voltaje aplicado se define como klQ/dV0 1,
entonces, de acuerdo con la ecuación anterior, es obvio que
(12.5-2)
436
Teoría de las uniones p-n de los semiconductores
De acuerdo con esto, se puede llegar a la conclusión de que las uniones en las
que tanto la región p como, la región n están fuertemente impurificadas, tendrán
una capacitancia muy alta, en tanto que si la región n o la p o bien, ambas, están
levemente impurificadas, la capacitancia será mucho menor. Para voltajes de polarización inversa que sobrepasan notablemente el potencial de contacto interno <Po, se
encontrará, de acuerdo con (12.5-2), que e varía casi proporcionalmente a
(- V0 ) 1 12 • En efecto, esta variación de capacitancia es característica de las uniones
abruptas que se encuentran en dispositivos fabricados por medio de procesos de
aleación. Las uniones graduales o no abruptas tales como las que se encuentran en
muchos dispositivos elaborados mediante la difusión de impurezas tipo n en un
cristal tipo p, o viceversa, presentan una capacitancia que varía con el voltaje inverso de
un modo más lento que aquélla. Por ejemplo la capacitancia de una unión linealmente gradual con polarización inversa, varía con el voltaje como (- V 0 )- 1 13 •
Para rectificadores de unión abrupta, las mediciones de capacitancia proporcionan
una forma sencilla para determinar el potencial de contacto interno <Po. Con este fin.
la ecuación (12.5-2) se puede reordenar en la siguiente forma
(12.5-3)
La capacitancia ppr unidad de área e se puede medir experimentalmente y se
hace una gráfica de tje2 en función del voltaje inverso -V0 , como se ilustra en la
figura 12.9. De acuerdo con (12.5-3), esta gráfica debe ser una recta. La intersección
de esta gráfica en el eje V0 extrapolado de los datos medidos, proporciona el valor
de <Po tal y como se indica. De acuerdo con la pendiente de esta línea determinada
de un modo experimental, se puede evaluar la cantidad _VdNaf(Nd +Na); si un lado
de la unión tiene una impurificación mucho más fuerte que el otro,4 esta cantidad
es aproximadamente igual a la concentración de impurezas en el lado cuya impurificación es más leve. La concentración de impurezas en el lado más fuertemente
impurificado se puede obtener una vez que se conocen <Po y la otra concentración
Figura 12.9.
Una gráfica de 1/C 2 en función del voltaje de polarización, que ilustra la determinación del potencial de contacto interno y las concentraciones de impurezas receptoras
y donadoras a partir de las mediciones de capacitancia.
4 Este es casi siempre el caso en uniones producidas mediante procesos de aleación, como
se verá más adelante.
TABLA 12.1.
Propiedades de uniones abruptas p-n en el
germanio (K = 16)
N.
N.
e/> o
Vo
Xo+
Xo-
Xo
Eo
e
(cm-')
(cm- 3 )
(V)
(V)
(¡.L)
(¡.L)
(¡.L)
(kv/cm)
(f.Lffcm 2 )
10'4
10 14
0.0702
-50
-500
0.788
3.08
6.69
21.0
66.5
0.788
3.08
6.69
21.0
66.5
1.58
6.15
13.4
42.1
133.0
0.891
3.48
7.57
23.8
75.2
0.00898
0.00229
0.00105
0.000336
0.000106
o
o
o
o
o
0.405
0.163
0.0606
0.0217
0.0076
0.405
0.163
0.0606
0.0217
0.0076
0.810
0.326
0.121
0.0433
0.0151
4.58
21.5
68.6
245.2
855.5
0.0175
0.0434
0.117
0.327
0.Y37
o
2.31
4.80
9.68
29.8
94.1
0.00023
0.00048
0.00097
0.00298
0.00941
2.31
4.80
9.68
29.8
94.1
2.61
5.42
10.95
33.7
106.4
0.00613
0.00295
0.00146
0.000475
0.000151
o
-1
-5
10'5
10'6
1017
10' 8
10' 9
10'5
10'6
10 17
10 18
10'9
0.1854
0.3005
0.4156
0.5308
0.6459
10'4
10'8
0.3005
-1
-5
-50
-500
438
Teoría de las uniones p-n de los semiconductores
de impureza a partir de (12.2-5). Se puede emplear un procedimiento similar para
determinar Na y Na, incluso si las densidades de impurezas en ambos lados de la
unión son comparables, aunque los aspectos matemáticos son un poco más complejos. Los detalles de este procedimiento se asignan como ejercicio para el lector. En
la tabla 12.1 se muestran algunos datos numéricos de la capacitancia de estructuras de
unión típicas.
EJERCICIOS
l. Demuestre que existe una discontinuidad en el potencial electrostático de una magnitud
47T A en donde .::l es el momento dipolar por unidad de área, en los lados opuestos de una capa
dipolar eléctrica.
2. Se intenta medir el potencial de contacto interno de una unión p-n conectando un
voltímetro de alta impedancia con conductores de cobre, a contactos que se encuentran en los
lados opuestos del cristal que contiene una unión. El voltímetro indica una lectura de cero. Un
potenciómetro substituye al medidor, pero la lectura sigue siendo cero. Explique físicamente la
falla de estos dos métodos y analice los potenciales de contacto entre el cobre y las regiones
tipo n y tipo p.
3. Utilice el teorema del flujo eléctrico de Gauss para demostrar que el campo eléctrico
debe ser continuo en todas partes excepto en una superficie que tiene una distribución de carga.
4. Explique físicamente por qué el ancho de la región de carga espacial de una unión
abrupta p-n es proporcional a la raíz cuadrada más que a la primera potencia de la caída de
potencial de la unión 1/>o- V0 •
5. Encuentre expresiones aproximadas para los potenciales, los campos y el ancho de las
capas de carga espacial asociadas con una unión linealmente gradual en la que
Nd = O, N. = - cxx
(x < 0)
N. = O, Nd = cxx
(x >0)
donde a es una constante. Suponga que la caída total de potencial en la región de carga espacial
es 1/Jo- Vo y que 1/Jo- Vo ~kT. Nota: use una extensión de los métodos expuestos en la
sección 12.4.
6. Encuentre la capacitancia diferencial por unidad de área asociada con la unión linealmente gradual del ejercicio 5.
7. Demuestre la forma en que el potencial de contacto interno y Na y Na se pueden
obtener a partir de una gráfica de datos experimentales como la que se muestra en la f¡gura 12.9. Derive fórmulas explícitas para Na y Na en función de la pendiente de la gráfica
experimental y el potencial interno 1/>o.
LECTURAS RECOMENDADAS
J. D. Jackson, Classical Electrodynamics, John Wiley & Sons, Nueva York (1962), capítulo l.
Allen Nussbaum, Semiconductor Device Physics, Prentice-Hall, Inc., Englewood Cliffs N. J.
(1962), capítulo 4.
W. Shockley, Electrons and Holes in Semiconductors, D. van Nostrand Co., Inc., Nueva York
(1950).
R. A. Smith, Semiconduc10rs, Cambridge University Press, Londres (1961),
E. Spenke, Electronic Semiconductors, McGraw-Hill Book Co., lnc., Nueva York (1958).
CAPITUW
13
Rectificadores de unión p-n
•
y
transiStores
.
13.1
TEORIA DEL RECTIFICADOR DE UNION p-n
En el capítulo anterior se examinó la naturaleza física de una unión semiconductora p-n. También se analizaron cuantitativamente ciertas manifestaciones físicas
de la estructura de la unión, tales como la carga espacial, los campos eléctricos, los
potenciales y la capacitancia, basándose en un simple modelo de unión abrupta. En
esta sección se verá el flujo de corriente asociado con la unión en condiciones de
desequilibrio y la característica de corriente-voltaje de un simple rectificador de
unión p-n.
El modelo de unión que se adoptará se ilustra en estado de equilibrio en la
figura 13 .1. Se supone que las regiones tipo p y n son homogéneas y se P.xtienden
al infinito en las direcciones + x y - x. En el estado de equilibrio habrá cierto
número de electrones presentes como portadores mayoritarios en el lado n, que
tienen la suficiente energía para saltar la barrera de potencial y difundirse en el lado
p de la unión. En la región p, estos electrones constituyen portadores minoritarios y
f-ec#>
+ + + +
+ ++
+
+
+
+
Jp,-
Figura 13.1.
-=
Vo= O
--x
+
Carga espacial
tipo-p
-- - - -- --
+
+
+
+
-Jp,
+
+
~e
.,
••
ti po-n
Diagrama de potencial de una unión p-n en condición de equilibrio, en donde
se muestran las distribuciones de portadores de carga y los flujos de generación y
recom binación.
440 Rectificadores de unión p-n y transistores
pueden, después de cierto tiempo, desaparecer mediante su recombinación con huecos. Por tanto, en equilibrio se tiene una corriente de electrones de la región n,
pasando sobre la unión, hasta la región p, en donde se pierden por recombinación.
Este flujo electrónico de equilibrio se citará como flujo de recombinación lnr· Sin
embargo, se obvio que en la condición de equilibrio no puede haber un flujo neto
de corriente; es más, de acuerdo con el principio del balance detallado, en estado de
equilibrio, cualquier proceso microscópico de transporte y su inversa deben proceder
a la misma velocidad. La inversa de este proceso en particular es la generación de
pares electrón- hueco en el lado p de la unión, y la difusión subsecuente de electrones a través de la unión hacia el lado n, en donde se convierten en portadores
mayoritarios. Este proceso inverso conduce a una corriente electrónica que fluye de
la región p a la región n y que se denominará corriente de generación. En estado de
equilibrio, el flujo de partículas resultante Jng debe ser exactamente igual a -Jnr·
Estas mismas observaciones se aplican a los huecos por igual; existe un flujo de
recombianción Jpr que se origina cuando los huecos de la región p se desplazan
sobre la barrera hasta la región n, en donde se recombinan con electrones. Esto va
acompañado por un flujo de generación Jpg que se crea mediante la generación
térmica de pares en la región n, seguida de la difusión de huecos térmicamente
generados a través de la unión. En estado de equilibrio se debe tener J ng = - J nr·
Por tanto, en estado de equilibrio los flujos totales de huecos y electrones a través
de la unión son igual a cero.
La base para la acción de una unión p-n como rectificador es como sigue.
En condiciones de polarización inversa, la altura de la barrera de potencial en la
unión aumenta en una cantidad igual a -e V 0 , en donde V 0 es el voltaje aplicado.
En estas condiciones, es difícil para los portadores vencer la barrera por difusión y,
por ende, J nr y J pr se hacen muy pequeños; sin embargo, los flujos J ng y J pg
dependen sólo de la velocidad de generación térmica de pares electrón-hueco en las
regiones volumétricas respectivas y, en consecuencia, no se ven reducidos. Por tanto,
conforme se incrementa el voltaje de polarización, la densidad de corriente a través
-eq,
-eq,
_ tipo-n
V0 <O
+++++++
++++++
+
+
+ +
+
+
+
-x
+
+
tipo-p
+
~-----.,.+ <V
Unión
(a)
Figura 13.2.
+
+
-Jpg
Jp,---·
tipo-p
+
+
-Jpg
Unión
tipo-n
( b)
Diagrama de potencial de una unión p-n (a) con polarización inversa, (b) con
polarización directa, en donde se señala cómo se modifican los flujos de generación y recombinación.
Teoría del rectificador de unión p-n
441
de la unión tiende a un valor pequefio constante -e(Jpg- lng), denominado co"iente de saturación, que está limitada por el número de pares térmicamente generados
que se crean en las regiones volumétricas cerca de la unión. Esta corriente depende
sólo de parámetros del material y la temperatura, y no puede aumentar notablemente, no importa el alto valor que puede adquirir el voltaje. Esta situación física se
ilustJ;a esquemáticamente en la figura 13.2(a). Cuando se aplica un voltaje de polarización directo, la altura de la barrera de potencial se reduce y es muy fácil para los
electrones mayoritarios del lado n y los huecos mayoritarios del lado p, difundirse
sobre la barrera hacia los lados opuestos respectivos en donde pueden convertirse en
portadores minoritarios y, finalmente, recombinarse. En este caso, las corrientes de
recombinación Jpr y lnr pueden hacerse muy grandes en comparación con sus valores de equilibrio. No obstante, las corrientes de generación lng y Jpg permanecen
iguales, ya que están limitadas por la velocidad de generación térmica. El resultado
es un gran flujo de corriente, como se ilustra en la figura 13 .2(b ). La estructura de
la unión presenta una impedancia muy elevada en la dirección de polarización inversa y una impedancia muy pequefia en la dirección de polarización directa, por lo
que se comporta como un rectificador. En la figura 13.3 se muestra la relación
corriente-voltaje. En la condición de polarización inversa se originan flujos de corriente de saturación consistentes en portadores minoritarios generados de un modo
térmico en las regiones volumétricas que quedan fuera, pero son adyacentes, a las
capas de carga espacial de la unión y que la barrera de potencial de la unión se
encarga de recoger. En la condición de polarización directa, la corriente se compone
en su mayor parte de portadores mayoritarios que se difunden sobre la barrera
reducida para convertirse en portadores minoritarios en la región de conductividad
opuesta, al otro lado de la unión; en efecto, la unión inyecta un gran número de
portadores minoritarios hacia las regiones volumétricas adjuntas a ambos lados.
Puesto que el número de electrones que poseen la energía suficiente para
sobrepasar la barrera de potencial de la unión es proporcional a e-e(v>o- Vo)fkT =
(const)eeVofkT (suponiendo que la estadística de Maxwell-Boltzmann es válida), es
de esperarse que Jnr y Jpr sean proporcionales a eeVofkT. Sin embargo, para V0 =O,
Jpr =Jpg Y Jnr =1n 1p de donde, se tiene que
y
J pr = J pg e•VofkT
(13.1-1)
J nr = J ng e•VofkT •
(13.1-2)
l
Figura 13.3.
Relación corriente-voltaje de una unión p-n, con la región de ruptura inversa.
442
Rectificadores de unión p-n y transistores
Entonces, de acuerdo con la figura 13.2,
(13.1-3}
y
(13.1-4¡
La relación entre el voltaje aplicado y la densidad de corriente eléctrica 1
estará dada por
(13.1-5)
en donde la densidad de corriente de saturación 10 es la suma de las densidades de
corriente de generación
(13.1-6}
La relación que existe entre la corriente y el voltaje que aparece en la figura 13.3 es una gráfica de la ecuación (13.1-5) antes mencionada. A continuación se
procederá a sacar el resultado (13.1-5) por medio de un método de cálculo más
riguroso que cuenta con dos ventajas: la primera, que proporciona una expresión
más explícita de la corriente de saturación y, segunda, que forma la base para la
técnica de cálculo que se puede aplicar a dispositivos de unión más complicados.
El procedimiento que se seguirá consiste en resolver la ecuación de continuidad
para los portadores en exceso, tanto en la región n, como en la p, y aplicar las
condiciones apropiadas de frontera a la unión y a todas las demás partes del sistema.
Con este fin se supondrá que la unión es planar y que el plano de unión se
extiende esencialmente al infinito en las direcciones y y z, de tal manera que sólo se
requiere tomar en cuenta las variaciones de concentración de portadores y el flujo de
corriente a lo largo de la dirección x. También se supondrá que se ha llegado a un
estado estacionario y que todo el voltaje aplicado al sistema aparece en la región de
carga espacial asociada con la unión. Las caídas de voltaje y los campos eléctricos en
el material que se encuentra fuera de la región de la unión son, por tanto, despreciables y el transporte en dichas regiones es puramente difusivo. En estas condiciones.
las ecuaciones de continuidad para los electrones de la región p y los huecos de la
región n, tienen la forma
(región-p, x < -x 0 _)
(13.1-7)
(región-n, x > x 0 +)
(13.1-8)
y
en donde,
y
(13.1-9)
Como de costumbre, sólo se tratan explícitamente las ecuaciones de continuidad para portadores minoritarios en cada región; pero se debe recordar que existe un
exceso de concentración de electrones en todas partes, dentro de la región n, que es
igual a la concentración local de huecos en exceso, y una concentración de huecos
Teoría del rectificador de unión p-n 443
en exceso en toda la región p, que es igual a la concentración local de electrones en
exceso, con el fin de que se satisfaga el requisito de neutralidad eléctrica. La fuente
última de estos portadores mayoritarios excedentes la constituyen los contactos
extremos del dispositivo (que están alejados de la unión en el modelo más o menos
idealizado que está considerando). En cierto modo, la inyección de una distribución de portadores minoritarios da como resultado la formación inmediata de una
distribución adjunta de portadores mayoritarios que vacía el resto del dispositivo de
este tipo de portadores, creando instantáneamente un campo que atrae a los portadores mayoritarios neutralizantes hacia adentro, desde el contacto extremo. En la
condición de estado estacionario se mantiene una neutralidad aproximada en todas
partes excepto dentro de la región de carga espacial de la unión.
Las condiciones de frontera que van a usarse indican lejos de la unión que la
densidad de portadores minoritarios excedentes debe tender a cero, de donde,
para
X=
-oo ,
(13.1-10)
para
X=
+oo
(13.1-11)
y
Pn- Pno =O
en tanto que las condiciones de frontera (12.3-1) y (12.3-2) desarrolladas en el
capítulo anterior deben satisfacerse en la unión. El uso de estas condiciones de
frontera simplifica el análisis, si se supone que la densidad de portadores en exceso
es mucho más pequeña en todas partes que la densidad de portadores mayoritarios
en equilibrio. Es evidente que esta condición se satisfará siempre en el dispositivo a
todos los voltajes de polarización directa, excepto los muy grandes. Si se hace esta
suposición, ent;:mces, en (12.3-1) nn(Xo+) puede igualarse a nno• mientras que en
(12.3-2), Pp( -x0 _) puede considerarse 1 igual a Ppo. Entonces, estas condiciones de
frontera toman la forma
np{ -Xo-) = e-e(+o-Vo)/kT
nno
(13.1-12)
y
e -e(+o-Vo)/kT.
(13.1-13)
Las soluciones generales de las ecuaciones de continuidad (13.1-7) y (13.1-8) se
pueden expresar como
(región-p)
(13.1-14)
(región-n)
(13.1-15)
y
en donde A, B, C y D son constantes arbitrarias. Se puede ver claramente que, para
satisfacer las condiciones de frontera (13.1-10) y (13.1-11), es necesario determinar
que B = C =O. Así también, puesto que cuando el voltaje aplicado V0 es cero,
1
De otra manera, sería necesario escribir nn(Xo+)=nno+fpn(Xo+>-Pno] y Pp(Xo-)=
Ppo +[np(- xo_)- npo].
Rectificodores de unión p-n y transistores
444
np(-x 0 _)=npo y Pn(Xo+)=Pno• como lo indican (13.1-12) y {13.1-13), la cantidad e-e4>o/kT se puede expresar -en función de la relación de las concentraciones de
equilibrio de huecos y electrones en los lados opuestos de la unión2 , como sigue
e-e+ofkT = npo = Pno
nno Ppo
(13.1-16)
Esto permite expresar las condiciones de frontera {13.1-12) y {13.1-13) en la
forma
n P(-x o- ) = n pO eeVofkT
(13.1-17)
y
(13.1-18)
Si se hace que B = C= O, en {13.1-14) y {13.1-15), y se aplican {13.1-17) y
{13.1-18) para evaluar las otras dos constantes, se puede demostrar fácilmente que
np - npo = npo(eeYo!kT - 1)e(x+xo-l/Ln
(región-p)
(13.1-19)
Pn- Pno = Pno(eeVofkT- 1)e-(x-xo+l/Lp
{región-n)
(13.1-20)
y
Estas ecuaciones permiten ver que para una polarización inversa {V0 <O) la
concentración de electrones en la región p y la concentración de huecos en la región
n son menores que el valor de equilibrio; en este caso, la concentración de portadores minoritarios en exceso es negativa. Se puede afirmar lo contrario cuando el
voltaje de polarización aplicado tiene un sentido directo (V0 > 0). Las ecuaciones
{13.1-19) y {13.1-20) se pueden emplear para encontrar las corrientes de huecos y
electrones que fluyen dentro de las regiones de carga espacial desde el lado n y el
lado p del cristal, respectivamente. Se supondrá que la corriente de electrones que
cruza la unión es la misma que la corriente de electrones minoritarios que fluye
dentro de la región de carga espacial, desde el lado p, y que la corriente de huecos
que cruza la unión es igual a la corriente de huecos minoritarios que fluye dentro
de la región de carga espacial, desde el lado n. Al hacer esto, se está desechando
cualquier generación o recombinación térmica de portadores que pueda ocurrir dentro de la capa de carga espacial propiamente dicha. 3 Esto se justifica por el hecho
de que el espesor de la capa de carga espacial es, en la mayoría de los casos, muy
pequeño y los campos muy altos dentro de la capa de carga espacial aceleran casi
siempre a los electrones desde el lado p, y a los huecos desde el lado n, para que
atraviesen la capa en un intervalo muy pequeño en comparación con sus tiempos de
vida. Al hacer esta simplificación, la corriente de unión se puede evaluar determinando las corrientes de difusión de los portadores minoritarios en las fronteras de la
región de carga espacial, lo cual da
Esto se establece también fácilmente a partir de (12.2-3) ó (12.2-4).
Si no se efectuara esta aproximación, las ecuaciones de continuidad (incluyendo los
términos apropiados del campo} tendrían que resolverse en las dos capas de carga espacial e
igualarse con las soluciones de fuera, como las expresan (13.1-19) y (13.1-20) en x 0 + y - x 0 _
con condiciones de frontera adecuadas. En este caso, el cálculo será más díficil, aunque más
general.
1
3
Teoría del rectificador de unión p-n
n 0 D"(eeVo/kT -1}
= _ __f!____L
dn )
JiO}~Jn(-Xo_)= -Dn ( - dP
X
y
-xo-
(dp")
J p(x O+ ) = -D p d
J p(O),..,
=
X
(13.1-21)
n
= PnoDp
L (eeVofkT _ l} .
XO+
445
(13.1-22)
p
La corriente eléctrica que cruza la unión es, entonces,
1 = e(Jp(O)- Jn(O)) = e(nP~~n + Pn~~P)(eeVo/kT- 1).
(13.1-23)
Este resultado tiene la misma forma que el que se obtuvo anteriormente como
(13.1-5); ahora, la corriente de saturación es
(13.1-24)
Las concentraciones reales de huecos y electrones a ambos lados de la unión,
tanto para la polarización directa como para la inversa, se muestran en la figura 13.4
para un rectificador típico de unión p-n del tipo que se acaba de describir. De
acuerdo con la ecuación anterior, se encuentra que la corriente de saturación incluye
las densidades de equilibrio de portadores minoritarios npo y Pno los coeficientes de
difusión Dn y Dp, así como los tiempos de vida de los portadores en exceso a
través de las longitudes de difusión Ln y Lp. Esto se puede expresar en función de
las densidades de portadores mayoritarios aplicando la relación
(13.1-25)
en donde, (13.1-23) se puede expresar en la siguiente forma
(13.1-26)
Parece que la corriente de saturación se puede reducir mediante el uso de un
material con impurificación relativamente fuerte en la región n y p, y también
haciendo que el tiempo de vida de los portadores en exceso sea lo más grande
posible en ambas regiones. De acuerdo con (13.1-26}, la corriente de la saturación
depende de la temperatura a través d¡: Dn, Dp, Ln, Lp y n¡. De estos parámetros, el
más sensible a la temperatura es la densidad de portadores intrínsecos n¡ y, por
tanto, la corriente de saturación debe aumentar rápidamente al incrementarse la
temperatura. Los semiconductores que tienen bandas de energía prohibida relativamente grandes (y, por ende, valores más o menos pequeños de n¡), son convenientes
para elaborar rectificadores de unión p-n que deban manejar densidades elevadas
de corriente y operar a altas temperaturas. En estas condiciones de operación, la
densidad de portadores intrínsecos dentro del semiconductor con esa banda pequeña
se hace excesiva y la corriente de saturación adquiere un gran valor, lo cual da
como resultado una eficiencia pobre de rectificación y una generación excesiva de
calor en la región de polarización inversa, como se muestra en la figura 13.5. En
consecuencia, los rectificadores de silicio son superiores a las unidades de germanio
para aplicaciones de alta corriente o alta temperatura. Desafortunadamente, la baja
446
Rectificadores de unión p-n y transistores
Concentración
Concentración
Déficit
electrónico
tipo-p
Región
de la unión
(a) Polarización directa
Figura 13.4.
Déficit de huecos
.
tlpO-n
Región
de la unión
(b) Polarización inversa
np(x)
-·
Concentraciones de electrones y huecos en la cercanía de una unión p-n (a) con
polarización directa y (b) con polarización inversa.
corriente de saturación ele los semiconductores de bandas prohibidas grandes, a temperaturas bajas, produce una impedancia más alta en el estado de polarización directa y, por ende, una gran caída de voltaje directo para una corriente dada. Esto
representa una mayor pérdida de potencia dentro del dispositivo y una generación de
calor interno superior en condiciones de corriente pequeña. Por esta razón muchas
veces se prefiere usar rectificadores de germanio cuando se tiene como requisito una
baja caída de voltaje en sentido directo a corrientes bajas, y cuando no es importante un buen funcionamiento en condiciones de alta corriente y alta temperatura.
Las fracciones ele la corriente total de unión portada por electrones y huecos
se menciona a veces como las eficiencias de inyección de electrones y huecos, respectivamente. De acuerdo con (13.1-21) y (13.1-22), es obvio que estas cantidades
están dadas por
(13.1-27)
(13.1-28)
En una umon simétrica, en donde Pp 0 = nn 0 , las corrientes de electrones y
huecos son aproximadamente iguales, a condición de que la relación de movilidad b
sea del orden de la unidad y que Ln y Lp no difieran en gran manera. Sin embargo,
en un dispositivo asimétrico en el que una región está más fuertemente impurificada
que la otra, las expresiones anteriores demuestran que casi toda la corriente que
Corrientes y campos en los rectificadores de unión p-n
447
IVc, Potencia
Corriente
alta de
1saturación
Región
de ruptura
Figura 13.5.
Corriente
baja de
saturación
Disipación de potencia de un rectificador de unión p-n en función del voltaje
aplicado.
fluye por la umon es transportada por el portador que constituye el elemento
mayoritario dentro de la región fuertemente impurificada. Desde el punto de vista
físico esto es cierto, ya que los portadores mayoritarios de la región con impurificación leve que, por ejemplo. podrían inyectarse dentro de la otra región si se aplicara
una polarización directa, existen en una cantidad reducida en comparación con los
portadores mayoritarios dentro de la región de gran impurificación que, en condiciones similares, podrían inyectarse hacia el lado de impurificación ligera. Más tarde se
verá que la eficiencia de inyección de la unión del emisor es un factor importante
en la ganancia de un transistor de unión.
Si el voltaje de polarización inversa aplicado a un rectificador de unión p-n se
incrementa uniformemente, se llegará a un punto en el que la corriente inversa
aumenta de un modo repentino y abrupto, como se ilustra en las figuras 13.3 y
13.5. Este fenómeno se conoce como ruptura y el voltaje al que se produce se
denomina voltaje de ruptura del dispositivo. Si éste funciona mucho más allá del
punto de ruptura, se generará internamente una gran cantidad de calor, ya que tanto
I como IVo 1son grandes y puede fundirse o quemarse en un lapso muy corto. En el
siguiente capítulo se presentará un breve estudio de los mecanismos típicos que
intervienen en la ruptura de los rectificadores de unión p-n.
13.2.
CORRIENTES Y CAMPOS EN LOS RECTIFICADORES
DE UNION p-n
Para obtener los resultados de la sección anterior, se supuso que todo el
transporte de portadores de carga en las regiones volumétricas p y n adyacentes a la
región de carga espacial de la unión es puramente difusivo. La justificación física de
esta suposición es que casi todo el voltaje aplicado a un dispositivo de unión p-n
aparece en la región de carga espacial de la unión que está casi vacía de portadores
de carga y, en efecto, tiene una resistividad mucho mayor que las regiones situadas a
ambos lados.
No obstante, se verá que en realidad los resultados obtenidos, contradicen la
suposición; es necesario tratar de determinar si esta contradicción es lo suficiente-
448 Rectificadores de unión p-n y transistores
mente grave para que se abandone este planteamiento y vuelva a comenzarse desde
el principio. Como se verá, en la mayoría de los casos no sucede esto. Por ahora, la
atención se deberá enfocar en la región n del dispositivo (x > x 0 +)· Obviamente, en
esta sección del dispositivo, los flujos de partículas Jn y JP se pueden expresar
como
dn,.
J n = -D n "E
dx - nnrn
(13.2-1)
y
(13.2-21
en donde E es el campo eléctrico que hasta ahora se ha despreciado. Del mismo
modo, puesto que no existen fuentes ni escapes para la corriente eléctrica dentro
de la región volumétrica, es necesario tener, en el estado estacionario, como ecuación
de continuidad para la densidad de corriente eléctrica 1,
op
--=V·I=O
at
(13.2-3)
en donde p es la densidad de carga. En el sistema unidimensional que se está
viendo, esto significa que
dl/dx =O,
ó
l(x) = e(Jp(x)- Jix)) = const.
(13.2-4)
Las expresiones de corriente de partículas (13.2-2) se pueden transformar en
una expresión algo más útil haciendo notar que, debido a la condición de neutralidad eléctrica ~n = ~p. la densidad de portadores mayoritarios se puede escribir como
sigue
(13.2-5)
de donde,
dn,.
dp,.
dx
dx
-=-
(13.2-6)
Cuando se substituyen estas relaciones en (13.2-1) y (13.2-2), se insertan las
ecuaciones resultantes en la expresión de continui~ad (13.24) y, resolviendo para el
campo E, se obtiene
dp,.
1- eDp(b- 1) -d-x
E=-~--~--~-~
eJJ.p[bn,.o + b(p,. - Pno) + p,.].
(13.2-7)
Los resultados obtenidos en la sección anterior en la forma de las ecuaciones
(13.1-20) y (13.1-23), suponiendo que el efecto de los campos eléctricos en la
región volumétrica n del dispositivo, que queda fuera de la región de carga espacial,
puede ser despreciable en comparación con el efecto del transporte difusivo, se
pueden substituir ahora en (13.2-7) para corroborar la consistencia de los resultados
Corrientes y campos en los rectificadores de unión JH1
449
con la supos1c1on. En el capítulo 10 se demostró que, en general, un campo eléctrico no altera el carácter difusivo del perfil de concentración, a menos que se
sobrepase el valor crítico dado por (10.244). Si &e observa que los coeficient&' de
transporte ambipolar apropiados son Dp y IJ.p, y si se usan (13.1-9) y (10.2-11), esta
condición se puede expresar como
kT
(13.2-8)
IEI~-.
eLP
Si los valores de Pn e 1 dados por (13.1-20) y (13.1-23) se substituyen en
(13.2-7), esta ecuación toma la siguiente forma
lo+ epnoDp (b- 1)e-<x-xo+)/Lp
E_
LP
. (eeYo/kT _ 1)
- qo + Pnoep-p(b + 1)(eeYo/kT- 1)e (x xo+)/Lp
(13.2-9)
en donde a0 = ep.p(pn 0 + bnno) es la conductividad de equilibrio del material tipo n
y en donde 10 está dada por (13.1-24). Para V 0 =O, desaparece el campo dado por
(13.2-9); para voltajes de polarización lo suficientemente pequefíos, ya sean directos
o inversos, se satisfará la condición (13.2-8). En general, en el rango de polarización
inversa, el factor (eeVofkT- 1) debe tener valores entre cero y -1. Puesto que el
segundo término del denominador anterior es casi siempre pequefío en comparación
con a0 para cualquier valor de polarización inversa, debido al hecho de que
nno ;;¡¡:.. Pno• la magnitud del campo aumentará cuando se incremente la polarización
inversa, llegando a un valor máximo para V 0 ~- oo. En estas condiciones, despreciando el segundo término del denominador por la razón que se acaba de citar,
(13.2-9) adquiere la forma
1
p D (b- 1)e-<x-xo+)/Lp
qo
JliPno + bnno)
E=~+nOp
.
(13.2-10)
Si se usan (13.1-24) y (10.2-11), esto se puede transformar en
kT Pno[1- (b- 1)e-<x-xo+)/Lp] + bnpo ~P
E=-·
n
eLP
Pno + bnno
(13.2-11)
Si Lp -Ln y b -1, la condición (13.2-8) debe satisfacerse en todas partes
dentro de la región n para todos los valores de polarización inversa, ya que si el
material dentro de esta región es bastante extrínseco, nno ;;¡¡:.. Pno, npo. Todos estos
resultados coinciden con la hipótesis original de que el campo era tan pequefío que
podrían desecharse los efectos de todos los transportes excepto el difusivo.
Para valores grandes de polarización directa eeVofkT se hace grande y positivo.
En estas cucunstancias, el segundo término del denominador de (13.2-9) puede hacerse tan grande o mayor que el primero . Dentro del límite de un gran voltaje en
directo4 en el borde de la región de carga espacial (x = x 0 +), (13.2-9) se reduce a
E_ kT b
- eLP b + 1
(t + Pno
npo LP)
Ln
(13.2-12)
4 Por supuesto, en estas circunstancias los coeficientes de transporte ambipolar (10.2-27) y
(10.2-28) deben usarse en las ecuaciones de continuidad, ya que las concentraciones de portadores excedentes pueden ser mayores que la densidad de portadores mayoritarios en equilibrio.
Sin embargo, para materiales donde b es del orden de la unidad, la discrepancia no será lo
suticientemente grande como para invalidar las conclusiones cualitativas que se han derivado.
450 Rectificadores de unión p-n y transistores
y es evidente que (13.2-8) ya no se satisface. En estas circunstancias el papel del
campo puede ser muy importante. En consecuencia, no debe esperarse que la ley de
la corriente y el voltaje (13.1-23) se obedezca a grandes voltajes de polarización
directa. Aunque sólo se ha investigado en detalle la región n del dispositivo, es obvio
que se pueden hacer las mismas observaciones en relación con la región p.
Ya se ha verificado la corrección fundamental del uso de los perfiles de
concentración puramente difusivos (13.1-19) y (13.1-20) en casi todas las condiciones para describir la distribución de portadores en exceso en las regiones n y p de
un rectificador de unión p-n. Ahora es necesario, para completar el cuadro, justificar
la suposición de que la co"iente de portadores minoritarios que fluye dentro de la
región de carga espacial de la unión es puramente de tipo difusivo. Esto se puede
lograr de una manera muy similar. También en este caso, considerando en particular
la región n del dispositivo, (13.2-2) deja ver que la componente difusiva de la
corriente de huecos es mucho mayor que la componente de arrastre, siempre que
(13.2-13)
en donde E está dado por (13.2-9). Si en esta ecuación se substituyen (13.1-20) y
(13.2-9), el resultado es
D
Lp e-<x-xa+)/Lp ~ J.lp(l + (eeYo/kT- l)e-<x-xa+)/Lp)
p
(13.2-14)
Lejos de la umon (x ~xo+), los factores e<x-xo+)/Lp se hacen extremada·
mente pequeños y (13.2-14) se reduce a
(13.2-15)
y es obvio que se viola la condición (13.2-13). Por supuesto, esto es de esperarse
desde el punto de vista puramente físico, ya que por ejemplo, en el caso de la
polarización directa, los portadores minoritarios excedentes que se inyectan en la
unión se recombinan con portadores mayoritarios cuando se difunden cada vez más
lejos de la unión y por esta razón su concentración se hace extremadamente pequeña cuando están lejos del plano de la unión. Sin embargo, si la concentración de
portadores minoritarios en exceso se hace pequeña, lo mismo sucede con su gradiente y la corriente de difusión que es proporcional a ella. No obstante, la corriente
total debe ser la misma en todas partes de acuerdo con (13.2-4). El déficit resultante en la corriente de difusión lejos de la unión se contrarresta mediante el
incremento correspondiente en la corriente de arrastre que se origina debido a la
presencia de un campo eléctrico. En efecto, es evidente, a partir de (13.2-9), que
cuando se está lejos de la unión el campo eléctrico E se acerca a un valor constante
J0 (ef!Vo/kT- 1)/ a 0 dando origen a una corriente de arrastre puramente óhmica, libre
de cualquier componente de difusión o efecto de portadores en exceso dentro de
esta región. Esto es precisamente lo que la intuición indicaba.
Corrientes y campos en los rectificadores de unión p-n
4S 1
Por supuesto, más cerca de la unión, parte de la componente de arrastre da
origen a una corriente de difusión y, en la unión misma, con contribución relativa
de la componente difusiva puede valorarse haciendo x = x 0 + en (13.2-14), por lo
cual, esa desigualdad se reduce a
(13.2-16)
Si se sigue una línea de razonamiento similar a la que se usó previamente en
relación con (13.2-14), se puede demostrar que cuando LP -Ln y b,.., 1, (13.2-16)
se satisface a todos los valores de volt.tje de polarización inversa y para pequeños
voltajes de polarización directa. También, al igual que antes, para grandes voltajes de
polarización directa, esta condición puede violarse. Nuevamente (excepto a grandes
valores de polarización directa) estos resultados son consistentes con el punto de
vista original, de que casi toda la corriente de portadores minoritarios que fluye
hacia la región de carga espacial de la unión es de difusión. El resultado se ha
comprobado explícitamente sólo para la región n; pero es evidente que pueden
formularse conclusiones similares para la región p. De donde, se justifica la conclusión establecida de que, aunque los resultados de los cálculos de la sección anterior
revelen que hay campos eléctricos en las regiones volumétricas, en contradicción con
la hipótesis original en la que se basaron dichos cálculos, en la región de polarización inversa o baja polarización directa, los campos son tan reducidos que no hay
contradicciones importantes a la suposición del transporte difusivo de los portadores
minoritarios. 5 Los cálculos realizados en estas circunstancias son totalmente congruentes. Para valores mayores de voltaje de polarización directa, los campos calculados se hacen tan grandes que amenazan esta congruencia y ya no se puede tener la
seguridad de que siga siendo válida la suposición inicial de que el transporte de
portadores minoritarios es puramente difusivo dentro de las regiones volumétricas p
y n del dispositivo. En el siguiente capítulo se estudiarán las propiedades de los
rectificadores p-n en estas condiciones de un modo más detallado.
Ya se hizo notar en relación con (13.2-15), que dentro de las regiones volumétricas, las componentes difusiva y de arrastre de la corriente total no son iguales en
todas partes a pesar de que la corriente total propiamente dicha es constante en
ellas. Se puede hacer la misma observación sobre las componentes de la corriente
de huecos y electrones. Por ejemplo, de acuerdo con la figura 13.4(a), es obvio
que en el lado n cerca de la unión, la corriente de huecos es mucho mayor (en
vista de la gran componente difusiva) que lejos de la unión, en donde los huecos
escasean y en donde la corriente de huecos es casi exclusivamente de arrastre. En
vista del requisito de que la corriente total sea la misma en todas partes, es evidente que la corriente electrónica cerca de la unión debe ser correspondientemente
más pequeña que lejos de ella en la parte volumétrica del cristal. Este equilibrio
se mantiene por medio del campo E, dado aproximadamente por (13.2-9), que
tiene un efecto mucho más importante en las corrientes de portadores mayoritarios
(debido al número mucho mayor de portadores mayoritarios presentes), que en las
corrientes de portadores minoritarios que, como se demostró antes, tiene una naturaleza más bien difusiva.
S Por supuesto, en algunos casos y debido a las caídas óhmicas dentro de las regiones
volumétricas p y n, ya no se podrá identificar a V0 como el voltaje total aplicado, sino sólo
como la caída que se produce en la región de la unión.
452
Rectificadores de unión p-n y transistores
13.3
RECTIFICADORES DE UNION DE TAMAÑO FINITO;
EFECTOS DE SUPERFICIE Y TERMINALES OHMICAS
Los resultados de la secc10n anterior, aunque se derivaron para un dispositivo
de extensión infmita a lo largo del eje x, se pueden aplicar perfectamente a dispositivos de tamaño finito, con la única condición de que las regiones reales n y p sean
muchas veces más gruesas que las longitudes de difusión respectivas Lp y Ln, y que
la cantidad V 0 se considere como el voltaje aplicado a la región de carga espacial de
la unión y no como el voltaje aplicado a todo el dispositivo. Si los espesores de una
o las dos regiones volumétricas adyacentes a las capas de carga espacial de la unión
son del orden de la longitud de difusión en dicha región, o menores que ésta, es
necesario modificar las cálculos de la sección 13.1. Para ver cómo se hace, estúdiese
primero el rectificador que aparece en la figura 13.6(a), en donde la estructura
del dispositivo se termina por medio de dos superficies libres con velocidades de
recombinación superficial sp y sn. Se supone que el dispositivo es grande en las
direcciones y y z, de tal manera que se pueden escribir ecuaciones de continuidad
unidimensionales de la forma (13.1-7) y (13.1-8). Aunque la forma general de las
soluciones tal como la expresan (13.1-14) y (13.1-15) sigue siendo válida, es más
conveniente escribir las soluciones como sigue
np- npo = A cosh
p.- P.o = C cosh
X+ X 0 _
L.
X- Xo+
LP
+ B senh
X+ Xo-
L
(x <O)
(13.3-1)
(x > 0).
(13.3-2)
n
+ Dsenh
X- Xo+
L
P
Se puede demostrar fácilmente que estas soluciones satisfacen las ecuaciones
(13.1-7) y (13.1-8). Las condiciones de frontera (13.1-17) y (13.1-18) siguen siendo
aplicables en los bordes de la unión en x 0 
Descargar