Subido por Belen Luna

integral

Anuncio
Las Integrales de Riemann, Lebesgue
y
Henstock-Kurzweil
Wilman Brito
ii
Dedicatoria
A mis Alejandros:
Sebastian y Rubén.
iv
Prólogo
Con el transcurrir del tiempo, un hermoso jardín de integrales se ha ido sembrando paulatinamente en la amplia y fértil tierra de las matemáticas. Esta increíble y rica diversidad de integrales
no cesa. Un poco más de 100 integrales han crecido, hasta el momento, en ciertas parcelas de
ese hermoso terreno, cada una de ellas con uno o varios nombres que las identifican. Mencionemos, por ejemplo, las integrales de Newton, Cauchy, Riemann, Darboux, Harnack, CauchyRiemann, Lebesgue, Stieltjes, Riemann-Stieltjes, Lebesgue-Stieltjes, Denjoy, Perron, HenstockKurzweil, McShane, C-integral, Pfeffer, BV-integral, Haar, Radon, Daniell, Burkill, Itô, Hellinger, Kolmogoroff, Khinchin, Bochner, Dunford, Pettis, Bartle, Gelfand, Wiener, Feynman, Birkhoff, Dinculeanu, Dobrakov, Dunford-Pettis, Gelfand-Pettis, Bartle-Dunford, Henstock-KurzweilDunford, Henstock-Kurzweil-Pettis, Daniell-Bourbaki, Denjoy-McShane, Denjoy-Bochner, DenjoyPettis, etc. Unas tienen un carácter histórico como las de Newton y Cauchy, algunas fueron absorbidas por otras que son más nuevas y mejores, otras son maneras o formas equivalentes de
expresar una misma integral, etc. ¿Por qué tantas integrales? Pues bien, existen, fundamentalmente, varios aspectos a considerar: algunas de ellas nacieron de un problema particular, otras
surgieron de una necesidad de generalizar una integral a contextos más amplios o abstractos, algunas otras deben su existencia a un análisis profundo y exhaustivo de una integral modificando
algún aspecto de la misma, etc. Por ejemplo, la integral de Riemann es una generalización de la
de Cauchy y nace de un problema concreto que Riemann quería resolver, pero es equivalente a la
de Darboux; la integral de Lebesgue generaliza a la de Riemann pues surge de las deficiencias y
limitaciones que esta última posee, pero es equivalente a las integrales de Daniel y de McShane.
Las integrales de Denjoy, Perron y Henstock-Kurzweil se crean a partir de la necesidad de resolver el problema de las primitivas propuesto por Newton-Leibniz. Posteriormente se demostró
que ellas tres eran equivalentes y contienen, en su interior, a la integral de Lebesgue. A su vez,
la integral de McShane, cuya definición es muy similar a la de Henstock-Kurzweil, se obtiene
por medio de una interrogante y que resulta ser equivalente a la de Lebesgue. Las integrales de
Bochner, Dunford y Pettis fueron diseñadas para trabajar en espacios de Banach, mientras que la
de Haar se desarrolla en grupos topológicos localmente compactos. Por otro lado, la de Itô se
genera a partir de los procesos estocásticos asociados a movimientos Brownianos, etc. Los libros
de Frank E. Burk, “A Garden of Integrales” [28], Stefan Schwabik y Ye Guoju, “Topics in Banach
Space Integration”, [119], Ivan N. Pesin, “Classical and Modern Integration Theories” [109],
el artículo de T. H. Hildebrandt “Integration in Abstract Spaces, etc., poseen abundante y buena
información de algunas de ellas.
vi
En estas notas desarrollaremos sólo tres de estas integrales, las que aparecen en el título. La
integral de Riemann, que se mantiene y continúa enseñándose a pesar de los años transcurridos
desde su creación, será breve. En su presentación sólo mostraremos alguna de sus propiedades
elementales pasando por el formidable Teorema Fundamental de Vitali-Lebesgue que describe
cómo son, en realidad, las funciones Riemann integrables, pero haciendo mucho énfasis en las
deficiencias que posee dicha integral con el sólo propósito de justificar el por qué Lebesgue construyó su integral. Por otro lado, la integral de Lebesgue se desarrolla más ampliamente que las
otras dos por las siguientes razones: primero, debemos fabricar gran parte del aparataje de la Teoría de la Medida y de las Funciones Medibles que son necesarias para la construcción de dicha
integral, este enfoque consume una gran parte del texto; luego mostramos sus poderosos teoremas de convergencia y finalmente extendemos brevemente esa noción de integral a un contexto
totalmente abstracto. Todo ello conduce a la creación de una integral que, aunque es bastante
complicada en su construcción, es totalmente superior a la integral de Riemann en todo sentido.
Su amplío abanico de aplicaciones justifican, con creces, ese gran esfuerzo en su construcción.
Existen otras integrales equivalentes a la integral de Lebesgue que evitan el uso de la Teoría de
la Medida tales como las integrales de Daniell, de Mikusiński y la de McShane. Sin embargo,
es importante aclararlo, la Teoría de la Medida Exterior que conlleva a la noción de Conjunto
Medible y luego a la de Medida es importante en sí misma y no sólo por el hecho de servir como
un puente en la construcción de la integral de Lebesgue. A pesar de las inmensas bondades que
posee la integral de Lebesgue, ella no está exenta de sus propias deficiencias: por ejemplo, la
integral de Lebesgue no es capaz de integrar a todas las funciones derivadas, en otras palabras,
ella no satisface el Teorema Fundamental del Cálculo en toda su generalidad; tampoco puede
integrar funciones
que poseen en algún punto de su dominio una “fuerte oscilación”. Integrales
R∞
de la forma 0 sen( x2 ) dx son elusivas a la integral de Lebesgue, etc. En cambio, con la integral
de Henstock-Kurzweil, que es una extensión propia de la integral de Lebesgue, se subsanan algunas de esas deficiencias. Por ejemplo, el Teorema Fundamental del Cálculo para la integral de
Henstock-Kurzweil se cumple para toda función derivada, cualquier función Lebesgue integral
es Henstock-Kurzweil integrable con integrales iguales y también posee los poderosos teoremas
de convergencia válidos para la integral de Lebesgue. Además, otro punto a su favor que es
muy importante, es que dicha integral no usa la Teoría de la Medida en su construcción y muy
poco de ella en su desarrollo posterior. Cuando intentamos comparar las integrales de Lebesgue
con la integral de Henstock-Kurzweil, tenemos que admitir que hay bondades en ambos lados y,
por supuestos, sus respectivas deficiencias. Por ejemplo, la integral de Henstock-Kurzweil no es
una integral absoluta, es decir, si f es Henstock-Kurzweil integrable, entonces no es cierto, en
general, que su valor absoluto | f | sea Henstock-Kurzweil integrable cosa que si ocurre con la
integral de Lebesgue. Este hecho impide que se pueda desarrollar una teoría HK p ([ a, b]) similar
a la teoría de los espacios L p ([ a, b]) para p ∈ [1, +∞]. Sin embargo, a pesar de no ser la integral
de Henstock-Kurzweil una integral absoluta este hecho no es, en lo absoluto, una calamidad, sino
más bien, constituye, en ciertos aspectos, una enorme fortaleza de dicha integral. Por otro lado,
no existe una extensión canónica de la integral de Henstock-Kurzweil a espacios abstractos, de
modo que la busqueda de una integral perfecta aun continua.
Ahora detallaremos brevemente cómo hemos organizado el contenido de estas extensas notas.
Los capítulos que van del 1 al 4 constituyen los recordatorios básicos que necesitaremos para los
restantes capítulos: casi todas las demostraciones de los resultados requeridos en el desarrollo
de estas notas se encuentran en dichos recordatorios de modo que el lector no tendrá que dejar
su lectura para ir a la busqueda de otro libro para consultar la demostración de un resultado en
particular. Sin embargo, el lector está en pleno derecho de saltarse esos capítulos si considera
vii
que tales conocimientos no le son ajenos y comenzar desde el capítulo 5 para volver la mirada
hacia atrás cada vez que sea necesario recordar un enunciado y(o) su prueba de un resultado
particular. Los capítulos que comienzan desde 5 hasta el 10 tratan sobre la medida y la integral
de Lebesgue en R. Aunque la integral de Lebesgue abarca más de la mitad del libro, queda por
fuera, sin embargo, un inmenso caudal de conocimientos relativos a tal integral. Libros tales como
[111, 14, 60, 106] etc. tratan muchos otros tópicos que no mencionamos ni consideramos en estas
notas. Los capítulos 11 y 12 constituyen ciertas consideraciones abstractas de la medida e integral
de Lebesgue. El capítulo 13 es interesante ya que desarrolla algunos importantes teoremas sobre
la convergencia de medidas. Los resultados demostrados en este capítulo no son utilizados en
estas notas por lo que el lector, sino está interesados en ellos en ese momento, puede evitarlos en
una primera lectura. Finalmente, el capítulo 14 es una incursión a una integral (o varias integrales)
que es fantástica por todos lados: contiene a la integral de Lebesgue, integra cualquier derivada
y no usa la teoría de la medida de Lebesgue en su construcción. Ella es la integral de HenstockKurzweil. Una casi febril investigación se ha desarrollado en los últimos tiempos en torno a
esta integral y sus posibles generalizaciones. Aquí nos restringimos al estudio de funciones
integrables según Henstock-Kurzweil cuyo dominio es un intervalo [ a, b] ⊆ R. Los libros de R.
A. Gordon [66], D. S. Kurz y C. W. Swartz [84], C. W. Swartz [125], R. G. Bartle [38], A. G. Das [40]
y muchos otros introducen al lector al estudio de esta tres integrales haciendo menor énfasis en
las dos primeras, pero dedicándole más espacio a la integral de Henstock-Kurzweil o integral de
Henstock como la llama Gordon. El capítulo finaliza con una breve exposición de las definiciones
de las integrales de Denjoy y Perron que son equivalentes a la integral de Henstock-Kurzweil y
la integral distribucional de Denjoy que es más general que las anteriores.
A modo de Advertencia: Tratándose de una versión preliminar, este trabajo contendrá, con toda
seguridad, un montón de errores, omisiones, demostraciones medio sospechosas, otras incompletas, insuficiencia de ejercicios y algunas otras cosas indeseables. Por tal motivo el lector, en plena
posesión de sus facultades, si acepta leer cualquier parte del mismo y se tropieza con algunos
de los errores u omisiones que se encuentran en él, se compromete a reportarlo a mi persona y
también puede sugerir, si lo cree necesario, otros caminos y vías más adecuadas para una mejor
y futura presentación.
[email protected]
[email protected]
viii
Índice general
Prólogo
V
1. Preliminares
1.1. Un poco de Teoría de Conjuntos . . . . . . . . . . . . . . .
1.1.1. Conjuntos . . . . . . . . . . . . . . . . . . . . . . . .
1.1.2. Funciones . . . . . . . . . . . . . . . . . . . . . . . .
1.1.3. Familias Indexadas. Productos Cartesianos . . . . .
1.2. Conjuntos Numerables y otros más Numerosos . . . . .
1.2.1. Ejemplos de Conjuntos Numerables . . . . . . . . .
1.2.2. El Teorema de Cantor y Conjuntos No-numerables
1.2.3. Ejemplos de Conjuntos No-numerables . . . . . . .
1.2.4. Un Juego y la No-numerabilidad de R. . . . . . . .
1.3. El Axioma de Elección y sus Aliados . . . . . . . . . . . .
1.3.1. El Axioma de Elección . . . . . . . . . . . . . . . . .
1.3.2. El Lema de Zorn . . . . . . . . . . . . . . . . . . . .
1.3.3. Principio del Buen-Orden . . . . . . . . . . . . . . .
1.3.4. Números Ordinales . . . . . . . . . . . . . . . . . .
1.3.5. Números Cardinales . . . . . . . . . . . . . . . . . .
1.3.6. ℵ1 y el Primer Ordinal No-numerable . . . . . . . .
1.3.7. La Aritmética de los Cardinales . . . . . . . . . . .
1.3.8. La Cardinalidad de R y otros Conjuntos Similares
1.3.9. La Hipótesis del Continuo . . . . . . . . . . . . . .
1.3.10. Conjunto de Bernstein . . . . . . . . . . . . . . . . .
1.4. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
2
6
9
10
18
41
44
46
47
47
49
53
57
67
68
69
73
76
78
80
2. Los Números Reales
2.1. Algunas Propiedades de los Números Reales
2.1.1. Principio de Arquímedes . . . . . . . .
2.1.2. Conjuntos Acotados . . . . . . . . . . .
2.1.3. Límites . . . . . . . . . . . . . . . . . . .
2.1.4. El Teorema de Bolzano-Weierstrass . .
2.1.5. Los Números Reales Extendidos . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
83
83
83
85
91
92
95
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ÍNDICE GENERAL
x
2.1.6. Limites Superior e Inferior de una Sucesión . . . . . . . .
2.1.7. Límites Superior e Inferior de Conjuntos . . . . . . . . . .
2.1.8. Series Absolutamente Convergentes y Familias Sumables
2.1.9. Caracterizando Series Absolutamente Convergentes . . .
2.1.10. Familias Sumables . . . . . . . . . . . . . . . . . . . . . . .
2.2. Espacios Topológicos . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.1. Espacios Métricos . . . . . . . . . . . . . . . . . . . . . . . .
2.2.2. El Teorema de Categoría de Baire . . . . . . . . . . . . . .
2.2.3. Espacios Normados . . . . . . . . . . . . . . . . . . . . . .
2.2.4. La Topología Producto . . . . . . . . . . . . . . . . . . . . .
2.2.5. El Espacio de Baire . . . . . . . . . . . . . . . . . . . . . . .
2.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
98
105
107
109
114
119
126
135
144
146
150
152
3. Funciones Continuas
3.1. Propiedades Básicas . . . . . . . . . . . . . . . . . . .
3.1.1. Funciones Continuas con Soportes Compactos
3.1.2. Más sobre Funciones Continuas . . . . . . . .
3.1.3. Oscilación y Discontinuidad de una Función .
3.1.4. Convergencia de Sucesiones de Funciones . .
3.1.5. Una Función Continua Nunca Diferenciable .
3.1.6. Funciones Semicontinuas . . . . . . . . . . . .
3.1.7. Convergencia Puntual en Sc([ a, b]) . . . . . . .
3.1.8. Funciones Acotadas en Sc([ a, b]) . . . . . . . .
3.2. Problemas . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
155
155
157
161
167
175
179
183
187
189
191
4. Desigualdades de Hölder y Minkowski en R n
4.1. Convexidad . . . . . . . . . . . . . . . . . . . . . . .
4.1.1. Las Desigualdades AM-GM . . . . . . . . . .
4.1.2. Las Desigualdades de Hölder y Minkowski
4.2. Problemas . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
193
193
195
199
204
.
.
.
.
.
.
.
.
.
209
209
210
213
214
218
226
229
232
236
.
.
.
.
.
239
239
240
250
253
255
.
.
.
.
5. El Conjunto de Cantor y su Media Hermana
5.1. Representaciones Ternarias y Binarias . . . . . . . .
5.1.1. Representaciones Ternarias . . . . . . . . . . .
5.1.2. Representaciones Binarias . . . . . . . . . . . .
5.1.3. El Conjunto Ternario de Cantor . . . . . . . .
5.1.4. Propiedades del Conjunto Ternario de Cantor
5.1.5. Conjuntos Tipo-Cantor de Medida Cero . . .
5.1.6. Conjuntos Tipo-Cantor de Medida Positiva . .
5.1.7. La Función de Cantor . . . . . . . . . . . . . .
5.2. Problemas . . . . . . . . . . . . . . . . . . . . . . . . .
6. La Medida de Lebesgue en R
6.1. Introducción . . . . . . . . . . . . . . . . . . . . .
6.2. La Medida Exterior de Lebesgue . . . . . . . . .
6.2.1. Condiciones bajo la cual µ∗ es σ-aditiva
6.2.2. Conjuntos de Contenido Cero . . . . . .
6.3. La Medida de Lebesgue . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ÍNDICE GENERAL
6.4.
6.5.
6.6.
6.7.
6.8.
6.9.
xi
6.3.1. La σ-álgebra de Lebesgue . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.3.2. La σ-álgebra de Borel . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.3.3. La Cardinalidad de la σ-álgebra de Borel . . . . . . . . . . . . . . . . . .
6.3.4. Conjuntos Analíticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.3.5. La Medida de Lebesgue . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.3.6. El Lema de Borel-Cantelli . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.3.7. Criterios de Medibilidad . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.3.8. Medida Interior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Conjuntos Medibles con Propiedades Especiales . . . . . . . . . . . . . . . . .
Conjuntos no-medibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.5.1. Conjunto de Vitali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.5.2. Conjunto no-medible de un Grupo Aditivo . . . . . . . . . . . . . . . . .
6.5.3. Conjunto Saturado no-medible . . . . . . . . . . . . . . . . . . . . . . . .
6.5.4. Conjunto de Bernstein . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.5.5. Conjunto de Sierpiński . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.5.6. Ultrafiltros no-medibles . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.5.7. Conjunto de Lévy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Notas Breves sobre El Problema de la Medida . . . . . . . . . . . . . . . . . .
6.6.1. El Problema de la Medida de Lebesgue y El Axioma de Elección . . . .
6.6.2. El Problema de la Medida de Lebesgue y la Hipótesis del Continuo . .
6.6.3. El Problema de la Medida de Lebesgue y la Aditividad Finita . . . . . .
6.6.4. El Problema de la Medida de Lebesgue y el Axioma de Determinación
Ejemplos y Contraejemplos Usando la Función de Cantor . . . . . . . . . . .
Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7. Funciones Medibles
7.1. Definición . . . . . . . . . . . . . . . . . . . . . . . . .
7.2. Propiedades Básicas . . . . . . . . . . . . . . . . . . .
7.2.1. Aproximación de Funciones Medibles . . . . .
7.2.2. Los Teoremas de Severini-Egoroff y de Lusin
7.2.3. Convergencia en Medida . . . . . . . . . . . .
7.3. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . .
7.4. Problemas . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
8. La Integral de Riemann
8.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.2. La Integral de Newton . . . . . . . . . . . . . . . . . . . . . . .
8.3. Construcción de la Integral de Riemann . . . . . . . . . . . .
8.3.1. La Integral de Darboux - Su Construcción . . . . . . .
8.3.2. Equivalencia de las Integrales de Riemann y Darboux
8.3.3. El Teorema de Vitali-Lebesgue . . . . . . . . . . . . . .
8.3.4. Consecuencias del Teorema de Vitali-Lebesgue . . . .
8.3.5. Propiedades Básicas de la Integral de Riemann . . . .
8.3.6. El Teorema Fundamental del Cálculo . . . . . . . . . .
8.3.7. Limitaciones y Deficiencias de la Integral de Riemann
8.4. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
255
263
268
271
279
287
293
300
304
309
310
318
320
323
324
326
332
344
344
346
350
352
354
358
364
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
371
371
377
382
386
394
398
403
.
.
.
.
.
.
.
.
.
.
.
405
405
407
409
411
416
418
423
426
429
436
447
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ÍNDICE GENERAL
xii
8.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 451
9. Diferenciación y un Teorema de Lebesgue
9.1. Funciones Absolutamente Continuas y de Variación Acotada
9.1.1. Funciones Lipschitz y la condición (N) de Lusin . . . .
9.1.2. Funciones de Variación Acotada . . . . . . . . . . . . . .
9.1.3. Cubrimientos de Vitali . . . . . . . . . . . . . . . . . . . .
9.1.4. El Teorema de Densidad de Lebesgue . . . . . . . . . . .
9.1.5. El Teorema de Diferenciabilidad de Lebesgue . . . . . .
9.1.6. Funciones Absolutamente Continuas . . . . . . . . . . .
9.1.7. El Teorema de Banach-Zarecki . . . . . . . . . . . . . . .
9.2. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . .
9.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10. La Integral de Lebesgue
10.1. Construcción de la Integral de Lebesgue . . . . . . . . . . . . .
10.1.1. Propiedades de la Integral de Lebesgue . . . . . . . . . .
10.1.2. Los Poderosos Teoremas de Convergencias . . . . . . . .
10.1.3. El Teorema Fundamental del Cálculo de Lebesgue . . .
10.1.4. La Integral de Lebesgue via Funciones Simples . . . . .
10.1.5. Integrales Dependiendo de un Parámetro . . . . . . . . .
10.1.6. La Integral de Lebesgue sin Medida . . . . . . . . . . . .
10.2. El Espacio L1 ( X, µ) . . . . . . . . . . . . . . . . . . . . . . . . . .
10.2.1. Densidad en el espacio L1 ([ a, b]) . . . . . . . . . . . . . .
10.2.2. El Lema de Riemann-Lebesgue . . . . . . . . . . . . . . .
10.2.3. La Completación del Espacio R([ a, b]) . . . . . . . . . . .
10.2.4. Conjuntos Uniformemente Integrables . . . . . . . . . .
10.2.5. Los Teoremas de Convergencia de Vitali . . . . . . . . .
10.2.6. El TFC para la Integral de Lebesgue . . . . . . . . . . . .
10.2.7. El Teorema de Vitali-Carathéodory . . . . . . . . . . . .
10.2.8. Regla de la Cadena e Integración por Partes . . . . . . .
10.2.9. Cambio de Variable para la Integral de Lebesgue . . . .
10.2.10.Puntos de Lebesgue de una Función Integrable . . . . .
10.3. Los Espacios L p ( X, µ), 1 < p ≤ +∞ . . . . . . . . . . . . . . . .
10.3.1. Las Desigualdades de Hölder y Minkowski en L p ( X, µ)
10.3.2. Convergencia Fuerte y Débil en L p , 1 < p < +∞ . . . .
10.3.3. La inclusión Lq ⊆ L p para 1 ≤ p < q . . . . . . . . . . . .
10.3.4. Conjuntos Uniformemente Integrables en L p para p > 1
10.3.5. Densidad en los Espacios L p ( X, µ) . . . . . . . . . . . . .
10.3.6. Separabilidad de los Espacios L p (R, µ), p ∈ [1, +∞) . .
10.3.7. El Espacio L ∞ ( X, µ) . . . . . . . . . . . . . . . . . . . . .
10.3.8. Convolución en L p (R, µ) . . . . . . . . . . . . . . . . . .
10.4. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . .
10.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
453
453
454
461
472
478
483
498
512
517
523
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
527
528
532
540
545
546
568
571
576
586
590
592
593
601
608
619
624
625
628
630
630
635
640
643
645
646
647
655
665
674
ÍNDICE GENERAL
11. Medida e Integración Abstracta
11.1. Espacios de Medidas . . . . . . . . . . . . . . . . .
11.1.1. Medidas sin Átomos . . . . . . . . . . . . .
11.1.2. Completación de una Medida . . . . . . .
11.1.3. El Teorema de Extensión de Carathéodory
11.1.4. La Medida de Lebesgue-Stieltjes en R . .
11.1.5. Funciones de Variación Acotada sobre R .
11.1.6. Funciones Medibles . . . . . . . . . . . . .
11.1.7. Funciones Integrables . . . . . . . . . . . .
11.2. Medida Producto y el Teorema de Fubini . . . .
11.2.1. Clases Monótonas . . . . . . . . . . . . . .
11.2.2. Medida Producto y el Teorema de Fubini .
11.3. La Medida de Lebesgue en R n . . . . . . . . . . .
11.3.1. Cambio de Variable: caso lineal . . . . . . .
11.3.2. Cambio de Variable: caso no-lineal . . . . .
11.3.3. El Teorema de Sard . . . . . . . . . . . . . .
11.4. Medida de Borel sobre el Espacio de Cantor 2N
11.4.1. σ-álgebra Producto . . . . . . . . . . . . . .
11.4.2. Una Métrica sobre 2N . . . . . . . . . . . .
11.4.3. Una Medida sobre 2N . . . . . . . . . . . .
11.5. Ejercicios Resueltos . . . . . . . . . . . . . . . . .
11.6. Problemas . . . . . . . . . . . . . . . . . . . . . . .
xiii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
12. El Teorema de Radon-Nikodým
12.1. Medidas con Signos e Integración . . . . . . . . . . . . . . . . . . . . .
12.1.1. El Teorema de Drewnowski . . . . . . . . . . . . . . . . . . . . .
12.1.2. Integración Respecto a una Medida con Signo . . . . . . . . . .
12.1.3. El Teorema de Radon-Nikodým . . . . . . . . . . . . . . . . . .
12.2. Aplicaciones del Teorema de Radon-Nikodým . . . . . . . . . . . . .
12.2.1. Una Identidad en L1 ( X, M, ν) . . . . . . . . . . . . . . . . . . .
12.2.2. El Teorema de Descomposición de Lebesgue . . . . . . . . . . .
12.2.3. El Teorema de Representación de Riesz - El Dual de L p ( X, ν),
12.2.4. Existencia de la Esperanza Condicional . . . . . . . . . . . . . .
12.2.5. Unicidad de la Medida de Lebesgue . . . . . . . . . . . . . . . .
12.3. Diferenciación de Medidas . . . . . . . . . . . . . . . . . . . . . . . . .
12.3.1. La Función Maximal de Hardy-Littlewood . . . . . . . . . . . .
12.3.2. El Teorema de Hardy-Littlewood . . . . . . . . . . . . . . . . . .
12.3.3. El Teorema de Diferenciabilidad de Lebesgue . . . . . . . . . .
12.4. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
679
679
686
689
692
700
709
710
712
715
715
718
734
747
753
765
767
768
771
772
774
778
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
1 ≤ p < +∞
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
781
782
796
798
800
810
810
810
811
816
819
820
823
824
826
829
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
13. Convergencia en ca(M, R )
833
13.1. Convergencia según Antosik-Mikusiński . . . . . . . . . . . . . . . . . . . . . . . . 834
13.2. Medidas Uniformemente σ-aditivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 837
13.3. Los Teoremas de Nikodým y el de Vitali-Hahn-Saks . . . . . . . . . . . . . . . . . . 844
xiv
14. La Integral de Henstock-Kurzweil
14.1. Construcción de la Integral de Henstock-Kurzweil . . . . . . . . . .
14.1.1. El Teorema Fundamental del Cálculo . . . . . . . . . . . . . .
14.1.2. Propiedades Básicas . . . . . . . . . . . . . . . . . . . . . . . .
14.1.3. El Lema de Saks-Henstock . . . . . . . . . . . . . . . . . . . .
14.1.4. El Segundo Teorema Fundamental del Cálculo . . . . . . . .
14.1.5. Integrabilidad Absoluta . . . . . . . . . . . . . . . . . . . . . .
14.1.6. La clase LHK ([ a, b]) . . . . . . . . . . . . . . . . . . . . . . . .
14.1.7. Comparando Integrabilidad: Lebesgue y Henstock-Kurzweil
14.1.8. Los Teoremas de Convergencia en HK([ a, b]) . . . . . . . . .
14.1.9. La Norma de Alexiewicz . . . . . . . . . . . . . . . . . . . . .
14.2. La Integral de McShane . . . . . . . . . . . . . . . . . . . . . . . . . .
14.3. La C-integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14.4. Las Integrales de Denjoy, Perron y Distribucional . . . . . . . . . .
14.4.1. La Integral de Denjoy . . . . . . . . . . . . . . . . . . . . . . .
14.4.2. La Integral de Perron . . . . . . . . . . . . . . . . . . . . . . .
14.4.3. La Integral de Denjoy Distribucional . . . . . . . . . . . . . .
14.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
ÍNDICE GENERAL
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
849
850
858
863
868
875
876
881
883
888
896
897
904
908
908
910
912
917
Bibliografía
918
Índice Alfabético
925
CAPÍTULO
1
Preliminares
Este capítulo describe algunas de las herramientas básicas que se van a requerir en el transcurso de estas notas. Hemos tratado de incluir la casi totalidad de los resultados que se requieren
para desarrollar las tres integrales que aparecen en el título, lo cual ha permitido que la longitud
de estas notas sea extremadamente larga, pero garantizándole al lector que no recurrirá a otro
texto para la demostración de los resultados utilizados.
1.1. Un poco de Teoría de Conjuntos
En esta sección revisaremos de manera sucinta algunas nociones básicas de la Teoría de Conjuntos la cual constituye la base de las matemáticas modernas. El padre fundador de tan fascinante teoría fue Georg Ferdinand Ludwig Philipp Cantor (1845-1918). A partir de 1874 y por más de
30 años Cantor desarrolla de manera intuitiva una teoría general de conjuntos haciendo énfasis
en los conjuntos que poseen infinitos miembros. Con la noción de conjunto infinito, Cantor logra
sacar de la oscuridad dicho concepto llevándolo a extremos inconcebibles: crea una jerarquía infinita y creciente de infinitos. Muchas de sus ideas chocaron con una resistencia férrea de parte
de prominentes matemáticos como Leopold Kronecker (1823-1891) quien afirmaba:
“No se qué predomina en la teoría de Cantor: filosofía o teología, pero de lo que sí estoy seguro es
que allí no hay matemática.”
A pesar de las críticas recibidas sobre su incipiente teoría, Cantor logra obtener el respaldo de
muchos matemáticos, en especial de uno de los más brillante, prolífico y respetado del momento:
David Hilbert (1862-1943) quien afirmó, de modo premonitorio, lo siguiente:
“Del Paraíso creado por Cantor para nosotros, nadie podrá expulsarnos.”
Esta afirmación es compartida por Paul Cohen quien afirma:
“Todos coinciden, aun si se cree o no que la Teoría de Conjuntos se refiere a una realidad existente,
en que hay una belleza en su sencillez y en su ámbito de aplicación”
Más aun, en su libro Naive Set Theory, Paul R. Halmos hace notar que:
2
Cap. 1 Preliminares
“Los matemáticos están de acuerdo en que cada uno de ellos debe saber algo de Teoría de Conjuntos;
el desacuerdo comienza al tratar de decidir qué tanto es algo”
Por otro lado, Edwin Hewitt y Karl Stromber afirman, al comienzo del Capítulo 1 en su libro Real
and Abstract Analysis:
“Desde el punto de vista de un lógico, las matemáticas son la Teoría de Conjuntos y sus consecuencias. Para el analista, los conjuntos y conceptos definidos inmediatamente a partir de ellos son
herramientas esenciales, y la manipulación de conjuntos es una operación que debe llevar a cabo
continuamente.”
1.1.1. Conjuntos
Para hacer matemáticas superiores se requiere de una Teoría de Conjuntos robusta, práctica y
conveniente. Dos de los más importantes sistemas de axiomas con los cuales se pueden crear tal
Teoría de Conjuntos y que han permitido desarrollar casi toda la matemática existente hasta el
presente son: la que se basa en la Axiomática de Zermelo-Fraenkel (ZF) cuyos creadores fueron
Ernst Zermelo (1871-1953) y Abraham Fraenkel (1891-1965). Por lo general, a tal axiomática se
le añade un axioma adicional conocido como el Axioma de Elección (ZFC), y la otra es la Teoría
de Conjuntos sustentada sobre la Axiomática de Zermelo-Fraenkel-von Neumann-Bernays-Gödel
(ZFNBG). En la primera axiomática, los conceptos primitivos corresponden a las ideas intuitivas
de “conjunto” y “pertenencia”, mientras que en la segunda se parte de las nociones de “clase” y
“pertenencia”. En ésta última teoría un conjunto es, por definición, una clase la cual es un miembro de alguna otra clase, pero donde existen clases que no son conjuntos (véase, [55], [108]).
Una buena justificación para optar por cualquiera de las dos axiomatizaciones es que las Teorías
de Conjuntos que se construye con ellas permiten un desarrollo adecuado del sistema de los
números reales, incluyendo sus operaciones aritméticas así como las demostraciones de sus propiedades. También el Análisis, la Topología, el Álgebra y, en general, casi todas las otras ramas de
la matemática han podido ser desarrolladas gracias a dichas teorías. Puesto que la existencia de
clases que no son conjuntos sólo aparece una sola vez en estas notas, hemos optado por adoptar
la Teoría de Conjuntos que se construye con el sistema (ZFC). En esta sección no describiremos
explícitamente la totalidad de los Axiomas de Zermelo-Fraenkel, tan sólo nos ocuparemos de formular ciertas definiciones y operaciones usuales de conjuntos con las que trabajaremos y generar
algunas de sus consecuencias. Referencias donde se pueden estudiar tales axiomas y muchas de
sus consecuencias son, por ejemplo, [127], [55], [108], [70], [74], etc.
Comúnmente, un conjunto se describe como una colección (o reunión, o agrupación, etc) de
objetos de cualquier naturaleza llamados los elementos o miembros del conjunto pero evitando
definir lo que es una colección o lo que es un objeto con el sólo propósito de no incurrir en
un circulo vicioso. Por tal motivo, los términos “conjunto” y “elemento” permanecerán sin ser
definidos y serán aceptados como entidades fundamentales confiando en que el lector posee
una noción, o sentimiento intuitivo, de lo que es un “conjunto” y lo que es “elemento de un
conjunto”. Los elementos que pertenecen o forman parte de un conjunto particular, digamos X,
serán denotados por el símbolo “x ∈ X” que se lee: “x es un elemento o miembro de X”, o
también se dirá que “x pertenece a X.” Análogamente, el enunciado “x 6∈ X” significa que “x no
pertenece a X”, o bien que “x no es un miembro o elemento de X”.
En general, usaremos letras minúsculas tales como a, b, c, . . . , x, y, z para indicar los miembros
o elementos de un conjunto, y letras mayúsculas A, B, C, . . . , X, Y, Z, A, B, . . ., A, B, C, etc.,
para designar conjuntos. Si los elementos de un conjunto son a su vez conjuntos (los cuales serán
representados por letras mayúsculas), entonces dicho conjunto será llamado una familia, o una
Sec. 1.1 Un poco de Teoría de Conjuntos
3
colección de conjuntos e indicado con una letra tipo gótica A, B, C, . . ., o tipo caligrafía A, B, C, . . .
Como siempre, usaremos el símbolo N para denotar el conjunto de los números naturales, esto
es, N = {1, 2, 3, . . . }, mientras que Z, Q, I y R representan, respectivamente, el conjunto de los
números enteros, los números racionales, los números irracionales y los números reales.
Una de las ideas básicas de conjuntos es la siguiente.
Definición 1.1.1. Sean A y B conjuntos. Diremos que A es un subconjunto de B si todo elemento de A
pertenece al conjunto B.
Escribiremos A ⊆ B o A ⊇ B para denotar que A es un subconjunto de B. En ocasiones,
en lugar de decir que “A es un subconjunto de B”, diremos que “A está incluido en B”. La
negación de A ⊆ B, en notación A * B, y que se expresa diciendo que A no es un subconjunto
de B, significa que existe al menos un elemento de A que no es miembro de B.
Un método usual de obtener subconjuntos de un conjunto dado es el siguiente: se parte de
un conjunto X y se considera una propiedad P( x) referente a los elementos x ∈ X la cual puede
o no ser cierta para algunos de sus miembros. En este sentido, cualquier conjunto de la forma
A = { x ∈ X : P( x) es verdadera}
( 1)
define un subconjunto de X. ¿Qué ocurre si a la propiedad P no se le impone ningún tipo de
limitaciones? Por ejemplo, suponga que aceptamos la siguiente “idea ingenua”:
Axioma de Abstracción. Dada cualquier propiedad P existe un conjunto cuyos elementos son
aquellos que poseen la propiedad dada. De modo más formal,
(∃ X )(∀ x)[ x ∈ X ⇔ P( x)].
Una consecuencia lógica que se deriva de la aceptación del Axioma de Abstracción es la
existencia del conjunto de todos los conjuntos. En efecto, basta considerar la propiedad P( x) como la
afirmación: “x es un conjunto” para obtener tal conjunto. Denotemos por U la colección de todos
los conjuntos. Lo que Russell demostró, con un argumento enteramente elemental, es que U,
como conjunto, no existe, originándose con ello la así llamada “Paradoja de Russell”. Pero, ¿qué
es una paradoja? Pues bien, una paradoja implica, a menudo, un argumento muy convincente
que conduce a una conclusión errónea que parece correcta, o a una conclusión correcta que
parece incorrecta o sorprendente. En términos sencillos, una paradoja es un razonamiento en
doble sentido: supone la verdad de algo y concluye su falsedad. Similarmente, si supone su
falsedad entonces se llega a su verdad. Entre 1893 y 1903, Friedrich Ludwig Gottlob Frege (18841925) en un intento por axiomatizar la incipiente teoría de conjuntos de Cantor, también llamada
la teoría de conjuntos “ingenua”, incluyó entre sus axiomas el Axioma de Abstracción y es aquí
donde aparece Bertrand Arthur William Russell (1872-1970). Russell razonó del modo siguiente:
dado cualquier conjunto X y cualquier objeto x, las reglas de la lógica dictan que x ∈ X o x 6∈ X. En
particular, un conjunto X, o es miembro de sí mismo, o no lo es. Russell entonces considera la
colección R constituida por los conjuntos que no son miembros de si mismo, es decir, R = {X ∈
U : X 6∈ X }. Puesto que U es, por el Axioma de Abstracción, un conjunto, resulta que R también
es un conjunto lo que genera la siguiente contradicción:
R∈R
Por esto,
⇔
R 6∈ R.
4
Cap. 1 Preliminares
Paradoja de Russell. La colección U no es un conjunto.
La conclusión fundamental que se extrae del resultado anterior es la siguiente: la no aceptación del Axioma de Abstracción impide la construcción de colecciones tan grandes como U, R
y muchas otras. Puesto que la Teoría de Conjuntos basada en la axiomática de (ZFC) prescinde
del Axioma de Abstracción colecciones gigantesca como las de Russell están prohibidas en esta
Teoría de Conjuntos pues ellas no son conjuntos, por lo que:
Hecho Universal: expresiones del tipo X ∈ X no son aceptadas cualquiera sea el conjunto X.
Como suele suceder en muchas partes de las matemáticas, existen convenciones que resultan
ser muy adecuadas. Por ejemplo, en la Teoría de Conjuntos, postular la existencia de un conjunto
que no posee elementos es una de ellas. A tal conjunto se le llama el conjunto vacío y denotado
por ∅. El conjunto vacío está caracterizado por la siguiente propiedad: “x ∈ ∅” nunca se satisface,
cualquiera sea x. Es importante destacar que, una vez admitido la existencia del conjunto vacío,
siempre se cumple que ∅ ⊆ X, para cualquier conjunto X. En efecto, suponer que ∅ * X significa
que existe algún x ∈ ∅ tal que x 6∈ X, pero como x ∈ ∅ nunca se satisface, entonces ello obliga a
sentenciar que ∅ ⊆ X. De esto último se deduce que el conjunto vacío es único.
Definición 1.1.2. Dos conjuntos A y B son iguales, en notación, A = B, si ocurre que A ⊆ B y
B ⊆ A. Si la relación A = B no se cumple, entonces diremos que A y B son distintos y lo denotaremos
por A 6= B.
La notación “A $ B” significa que A ⊆ B pero A 6= B, que se expresa diciendo que A es un
subconjunto propio de B.
Definición 1.1.3. Dado un conjunto X, indicaremos por P ( X ) al conjunto potencia o de las partes
de X, es decir,
P (X ) = A : A ⊆ X .
Por ejemplo,
P (∅) = {∅},
P ({∅}) = {∅, {∅}}, etc.
En general, si X ⊆ Z, entonces P ( X ) ⊆ P ( Z ).
Definición 1.1.4. Dados los conjuntos A y B, la unión e intersección de ambos conjuntos, denotados por
A ∪ B y A ∩ B respectivamente, se definen como:
A∪B = x : x ∈ A ó x ∈ B
y
A∩B = x : x ∈ A y x ∈ B .
En el caso particular en que A ∩ B = ∅, entonces se dice que A y B son conjuntos disjuntos
o ajenos. Se sigue inmediatamente de la definición anterior que las operaciones de unión e
intersección son conmutativas, esto es, A ∪ B = B ∪ A y A ∩ B = B ∩ A. Además,
y
A∩B ⊆ A ⊆ A∪B
A ∩ B ⊆ B ⊆ A ∪ B.
La unión e intersección de conjuntos se distribuyen según las siguientes igualdades:
A ∪ ( B ∩ C ) = ( A ∪ B) ∩ ( A ∪ C )
y
A ∩ ( B ∪ C ) = ( A ∩ B) ∪ ( A ∩ C )
Más aun, la siguiente es una caracterización de A ⊆ B en términos de la unión y la intersección.
A⊆B
⇔
A = A∩B
⇔
B = A ∪ B.
Sec. 1.1 Un poco de Teoría de Conjuntos
5
Definición 1.1.5. Dados los conjuntos A y B, la diferencia A \ B es el conjunto formado por todos los
elementos de A que no son miembros de B, esto es,
A \ B = x : x ∈ A y x 6∈ B .
Es importante observar lo siguiente referente a la diferencia de conjuntos:
( a) A \ B = ∅ si, y sólo si, A ⊆ B.
(b) A \ B = A \ ( A ∩ B) y A \ ∅ = A.
( c ) A ∩ B = A \ ( A \ B ).
(d) Si A \ B ⊆ A, entonces A ∩ B = ∅.
En el caso particular en que X es un conjunto fijo y A ⊆ X, entonces a X \ A se le llama
el complemento de A (relativo a X) y se denota por Ac . Observe que si X es un conjunto y
A, B ⊆ X, entonces A \ B = A ∩ Bc .
Definición 1.1.6. La diferencia simétrica de los conjuntos A y B se expresa en la forma
A△B = A\B ∪ B\A
= A∪B \ A∩B .
Algunas de las propiedades que son válidas con esta operación de conjuntos son las siguientes:
si A, B, C, D son conjuntos arbitrarios, entonces
( a1 ) A △ B = B △ A
(b1 ) A △ ∅ = A
( c 1 ) A △ A = ∅.
( d1 ) A △ B = A c △ B c .
( e1 ) ( A △ B ) △ C = A △ ( B △ C ) .
( f 1 ) A ∩ ( B △ C ) = ( A ∩ B ) △ ( A ∩ C ).
( g1 ) ( A ∪ B ∪ C ) \ ( A ∩ B ∩ C ) = ( A △ B) ∪ ( B △ C ).
( h1 ) ( A ∪ B ) △ ( C ∪ D ) ⊆ ( A △ C ) ∪ ( B △ D ) .
Puesto que no existe ninguna limitación para restringirnos a dos conjuntos en las definiciones
de unión e intersección, podemos considerar uniones e intersecciones arbitrarias de conjuntos.
Definición 1.1.7. Sea A una familia arbitraria de conjuntos. Definimos la unión e intersección, respectivamente, de dicha familia como
[
y
A =
\
[
A =
\
A =
A ∈A
A =
A ∈A
x : x ∈ A para algún A ∈ A
x : x ∈ A para todo A ∈ A ,
6
Cap. 1 Preliminares
S Si A es una familia numerable,
S∞ digamos A = { A1 , A2 , . . .}, entonces, en lugar de escribir
A,
usaremos
la
notación
A ∈A
T∞
T n=1 An . Lo mismo se hará con la intersección, es decir, escribiremos n=1 An en lugar de A∈A A. Más aun, si A = { Amn : m, n = 1, 2, . . . }, entonces las
notaciones
∞
[
∞ [
∞
[
Amn =
m,n =1
∞
\
y
Amn
m =1 n =1
Amn =
m,n =1
∞ \
∞
\
Amn
m =1 n =1
se usarán frecuentemente. Como antes, si ocurre que A ∩ B = ∅ para todo par de conjuntos A, B
en A , entonces diremos que A es una familia disjunta o que los conjuntos de A son disjuntos
dos a dos.
Suponga
que X es un conjunto no vacío y que A es una familia de subconjuntos de X. Si
S
X = A∈A A, entonces diremos que A es un cubrimiento de X. Si, además, la familia A es
disjunta, entonces se dice que A es una partición de X o que X es una unión disjunta de A .
A diferencia de los elementos de la unión y de la intersección, los del producto cartesiano son
de naturaleza distinta a los elementos de A y de B.
Definición 1.1.8. Sean X, Y conjuntos no vacíos. El producto cartesiano X × Y se define por
X × Y = ( x, y) : x ∈ X, y ∈ Y .
Recuerde que todo par ordenado ( x, y) se define como ( x, y) = {{a}, {a, b}}. De esto e sigue
( x, y) ⊆ P ({ x, y}). Algunas propiedades importantes sobre familias de conjuntos y que se usan
frecuentemente son las siguientes. Sean A , B familias de conjuntos. Entonces se verifica que:
[ [ [
A ∩
B =
A∩B
A ∈A
y
\
A ∈A
B ∈B
A
\
∪
B ∈B
( A,B )∈A ×B
B
=
\
( A,B )∈A ×B
A∪B .
También se cumplen las Leyes de Morgan: si X es un conjunto no vacío y A ⊆ P ( X ), entonces
[
\
\
[
X\
A =
X\A
y
X\
A =
X\A .
A ∈A
A ∈A
A ∈A
A ∈A
lo que comúnmente se escribe como
[
A ∈A
A
c
=
\
A ∈A
A
c
y
\
A ∈A
A
c
=
[
Ac
A ∈A
1.1.2. Funciones
Sean X, Y conjuntos no vacíos. Una relación de X en Y es cualquier subconjunto R de X × Y.
En lo que sigue, cualquier elemento ( x, y) de R se indicará por el símbolo x R y. Si X = Y,
entonces a la relación R se le llama relación binaria.
Sec. 1.1 Un poco de Teoría de Conjuntos
7
Definición 1.1.9. Una función, o aplicación, de X en Y es una relación f de X en Y que posee la
siguiente propiedad adicional: si ( x, y) ∈ f y ( x, z) ∈ f , entonces y = z.
Siguiendo la tradición, a la función f de la definición anterior la denotaremos, en lo sucesivo,
por el símbolo f : X → Y. Así, toda función f : X → Y asigna a cada uno de los elementos
x ∈ X un único y ∈ Y al que designaremos por f ( x). Al conjunto X se le llama el dominio de
la función f , mientras que a Y se le llama el contradominio de f .
Definición 1.1.10. Dos funciones f : X → Y y g : X ′ → Y ′ son iguales si X = X ′ , Y = Y ′ y
f ( x) = g( x) para todo x ∈ X.
Una función f : X → Y se llama inyectiva o uno a uno si dados x, y ∈ X arbitrarios,
la igualdad f ( x) = f (y) implica que x = y. La función f se dice que es sobreyectiva, o
simplemente sobre, si Y = f ( X ), es decir, si para cada y ∈ Y existe un x ∈ X tal que y = f ( x).
Si f es tanto inyectiva así como también sobreyectiva, entonces la diremos que es biyectiva. Para
una función f : X → Y, el conjunto
Gra( f ) = ( x, f ( x)) ∈ X × Y : x ∈ X
es llamado el gráfico de f . Si f : X → Y es una función y A ⊆ X, entonces la imagen de A por f
es el conjunto
f ( A) = f ( x) ∈ Y : x ∈ A .
Por otro lado, si B ⊆ Y, la imagen inversa de B por f es el conjunto
f −1 ( B ) = x ∈ X : f ( x ) ∈ B .
Es fácil ver que si A ⊆ P ( X ), entonces
[ [
f
A =
f ( A)
A ∈A
y
f
A ∈A
\
A
A ∈A
⊆
\
f ( A ).
A ∈A
Observe que la última inclusión puede ser propia. En efecto, si existen elementos x, y ∈ X con
x 6= y para los cuales f ( x) = f (y), entonces tomando A = { x} y B = {y}, se tiene que
A ∩ B = ∅, de donde f ( A ∩ B) = ∅, mientras que f ( A) ∩ f ( B) = { f ( x)}. La construcción de
este ejemplo sólo es posible si nuestra función f no es inyectiva, de modo que si f es inyectiva,
entonces
\ \
f
A =
f ( A ).
A ∈A
A ∈A
Para la imagen inversa se cumple que si B ⊆ P (Y ), entonces
[ \ [
\
−1
−1
−1
f
B =
f ( B)
y
f
B =
f −1 ( B ).
B ∈B
B ∈B
B ∈B
Si B ⊆ Y, también es válida la siguiente igualdad:
f −1 Y \ B = X \ f −1 ( B ).
Más aun, dado A ⊆ X, se tiene que
A ⊆ f −1 f ( A ) ,
B ∈B
8
mientras que si B ⊆ Y, entonces
Cap. 1 Preliminares
f f −1 ( B) ⊆ B.
Ya hemos visto que A ⊆ f −1 f ( A) . ¿Bajo qué condiciones f −1 ( f ( A)) = A? Para que ocurra la
igualdad f −1 ( f ( A)) = A cualquiera que sea A ⊆ X, es necesario y suficiente que f sea inyectiva.
Similarmente, f es sobreyectiva si, y sólo si, f ( f −1 ( B)) = B para todo B ⊆ Y.
Si f : X → Y y g : Y → Z son funciones, entonces podemos definir la función compuesta
g ◦ f : X → Z como ( g ◦ f )( x) = g( f ( x)) para todo x ∈ X. Sea A un subconjunto de X. La
aplicación i A : A → X, definida por i( x) = x para todo x ∈ A, se llama la aplicación inclusión
de A en X. En el caso particular cuando A = X, la aplicación inclusión de X en X, se llama
la función identidad y será indicada por Id : X → X. Cada función biyectiva f : A → B da
origen a otra función biyectiva, llamada la inversa de f y denotada por f −1 : B → A tal que
f ◦ f −1 = f −1 ◦ f = Id.
Sean f : X → Y una función y A un subconjunto no vacío de X. La restricción de f al
subconjunto A es la aplicación f | A : A → Y definida por ( f | A )( x) = f ( x) para todo x ∈ A.
Nótese que f | A = f ◦ i A , donde i A es la inclusión de A en X. Por otro lado, dada una función
g : A → Y, toda aplicación f : X → Y tal que g = f | A se llama una extensión de g al conjunto
X. La función χ A : X → R definida por
(
1 si x ∈ A,
χ A ( x) =
0 si x 6∈ A
se le denomina la función característica de A. En el caso particular cuando A = Q, a χQ se le
llama la función de Dirichlet.
Sea f : X → R una función. Diremos que f es no-negativa sobre X si f ( x) ≥ 0 para todo
x ∈ X. Similarmente, decir que f es no-positiva sobre X significa que f ( x) ≤ 0 para todo
x ∈ X. De modo más general, si f , g : X → R son funciones, entonces f ≤ g sobre X, significa
que ( g − f )( x) ≥ 0 para todo x ∈ X.
Si f : X → R es una función, entonces f se puede escribir en la forma f = f + − f − , donde


 f ( x)
− f ( x )
si
f
(
x
)
≥
0
si f ( x) ≤ 0
+
−
y
f ( x) =
f ( x) =
0
0
si f ( x) < 0
si f ( x) > 0
Observe que tanto f + así como f − son ambas no-negativas. A f + y f − se les llaman la
parte positiva y la parte negativa de f , respectivamente. El valor absoluto de f se define
entonces como | f | = f + + f − . Finalmente, la proyección de X × Y sobre X es la aplicación
prX : X × Y → X definida por prX ( x, y) = x para todo ( x, y) ∈ X × Y. Similarmente, la
proyección de X × Y sobre Y es la aplicación prY : X × Y → Y definida por prY ( x, y) = y para
todo ( x, y) ∈ X × Y.
Definición 1.1.11. Sea X un conjunto no vacío. Una relación de equivalencia sobre X es una relación
binaria R sobre dicho conjunto que es
( a) reflexiva: x R x para todo x ∈ X,
(b) simétrica: x R y ⇒ y R x, para todo x, y ∈ X, y
(c) transitiva: x R y y y R z ⇒ x R z, para todo x, y, z ∈ X.
Sec. 1.1 Un poco de Teoría de Conjuntos
9
Frecuentemente usaremos el símbolo ∼ en lugar R. En consecuencia, escribiremos x ∼ y en
lugar de x R y y diremos que x y y son ∼ equivalentes. La clase de equivalencia de x módulo
∼ es el conjunto
Cx = y ∈ X : x ∼ y .
Observe que cualesquiera sean x, y ∈ X, se verifica que Cx = Cy o bien Cx ∩ Cy = ∅. Más aun,
puesto que x ∈ Cx para
S todo x ∈ X, resulta que las clases de equivalencias forman una partición
de X, es decir, X = x ∈ X Cx . Al conjunto
X/∼ = Cx : x ∈ X ,
se le llama el cociente de X por la relación ∼.
La función Q : X → X/∼ definida por Q( x) = Cx para cada x ∈ X, es claramente sobreyectiva y se le llama la aplicación cociente o canónica sobre X.
1.1.3. Familias Indexadas. Productos Cartesianos
Todo conjunto no vacío X puede ser considerado como una familia indexada por sus propios
elementos, es decir, X = {zx : x ∈ X }, donde zx = x para cada x ∈ X. Con frecuencia, resulta
más práctico y útil, asignarle a cada elemento x ∈ A una etiqueta distinta. Un modo de hacer
esto es el siguiente: se considera un conjunto no vacío I (cuyos elementos llamaremos índices) de
modo que exista una aplicación biyectiva x(·) : I → X. La imagen de cada elemento α ∈ I por
medio de x(·), es decir, x(α), se denotará por xα y entonces el conjunto X se identificará con
{ xα : α ∈ I }, al que denotaremos por el símbolo ( xα )α∈ I y se dirá que X está indexado por el
conjunto I. Cuando I es un conjunto dirigido, es decir, cuando sobre I existe una relación entre sus elementos verificando la propiedad: cualesquiera sean α, β ∈ I, existe un ξ ∈ I tal que
y
α ξ
β ξ,
entonces diremos que ( xα )α∈ I es una red en X. Cuando I = N, entonces diremos que ( xn )∞
n =1
es una sucesión en X.
En general, si A es una familia de conjuntos y si suponemos que I es un conjunto no vacío
y x(·) : I → A es una aplicación biyectiva, entonces la colección A se identifica con la familia
de conjuntos { Aα : α ∈ I }, lo que frecuentemente escribiremos S
como A = ( Aα )α∈ I . SEn este
caso, la unión de los elementos de la familia A se escribirá como α∈ I Aα en lugar de A∈A A,
y lo mismo para la intersección. Si I = N, entonces a la familia A = ( An )∞
n =1 se le llama una
sucesión de conjuntos. Si A = ( Aα )α∈ I es una familia de conjuntos donde I es un conjunto
dirigido, entonces diremos que ( Aα )α∈ I es una red de conjuntos. La red ( Aα )α∈ I se llama
creciente (respectivamente, decreciente) si Aα ⊆ A β (respectivamente, Aα ⊇ A β ) siempre que
α β. Cuando I = N entonces hablaremos de una sucesión creciente o decreciente de conjuntos.
Si las inclusiones son todas estrictas, entonces diremos que la sucesión es estrictamente creciente
(respectivamente, estrictamente decreciente).
Definición 1.1.12. Sea ( Aα )α∈ I una familia cualquiera de conjuntos. Se define el producto cartesiano
de esta familia como el conjunto de todas las funciones x(·) que tienen dominio I tal que x(α) = xα ∈ Aα
para cada α ∈ I, es to es,
(
)
Y
[
Aα = x(·) : I →
Aα x(α) = xα ∈ Aα para cada α ∈ I .
α∈ I
α∈ I
10
Cap. 1 Preliminares
Según lo expresado anteriormente, podemos también escribir
n
o
Y
Aα = ( xα )α∈ I : xα ∈ Aα para cada α ∈ I .
α∈ I
Q
Si cada conjunto Aα es no vacío, entonces toda función x ∈ α∈ I Aα es llamada una función
de elección para la familia ( Aα )α∈ I . Si ocurre queQtodos los Aα son iguales, digamos, Aα = A
para todo α ∈ I, entonces el producto cartesiano α∈ I Aα se denotará brevemente por A I . En
n en lugar de A I . En
el caso particular en que
Q∞ I = {1, . . . , n} para algún
Q n ∈ N, escribiremos A
n
general, escribiremos n=1 An como sinónimo de n∈N An . El conjunto K es llamado el espacio
Euclidiano de dimensión n (o n-dimensional). Observe que si X es un conjunto arbitrario,
X constituye el conjunto de todas las funciones f : X → R. De interés es el producto
entonces RQ
cartesiano ∞
n =1 A n donde A n = {0, 1} para todo entero n ≥ 1. A éste producto lo denotaremos
N
por 2 , el cual consiste de todas las sucesionesQ ( xn )∞
n =1 donde cada xn ∈ {0, 1}. Finalmente,
para cada β ∈ I se considera la aplicación p β : α∈ I Aα → A β definida por p β (( xα )α∈ I ) = x β . A
p β se llama la β-ésima proyección. Claramente p β es una aplicación sobreyectiva.
Si ( Aα )α∈ I y ( Bβ ) β∈ J son familias de conjuntos, entonces el producto de sus uniones e intersecciones satisfacen:
[ [ [
Aα ×
Bβ =
Aα × Bβ ,
α∈ I
\
α∈ I
β∈ J
Aα
×
\
β∈ J
( α,β)∈ I × J
Bβ
=
\
( α,β)∈ I × J
Aα × Bβ.
1.2. Conjuntos Numerables y otros más Numerosos
En esta sección introduciremos un método para “comparar” el “número” de elementos que
poseen dos conjuntos. Esto se hará a través de la noción de cardinalidad. Posteriormente, si los
conjuntos poseen un cierto “orden”, entonces, además de comparar el número de elementos que
ellos poseen, también estaremos interesados en preservar la “posición” que ellos ocupan en cada
conjunto. Comenzaremos con la noción de “igual de números de elementos” entre dos conjuntos.
En el año 1874 Cantor demostró que existía una correspondencia uno-a-uno entre N y el
conjunto de los números algebraicos (en realidad fue Dedekind quien lo hizo). Posteriormente,
demuestra que no existe correspondencia uno-a-uno entre N y el conjunto de los números reales.
Estos hechos le permitió considerar la existencia de una correspondencia uno-a-uno como un
criterio para comparar el tamaño de dos conjuntos.
Definición 1.2.1. Dos conjuntos A y B se dice que son equipotentes, o biyectables, si existe una
función biyectiva f : X → Y.
Escribiremos A ≈ B para abreviar la expresión “ A y B son equipotentes”. Esta relación,
evidentemente, nos muestra que los conjuntos A y B poseen el “mismo número de elementos”. Esta
idea permite que intentemos asignar a cualquier conjunto A un objeto de la Teoría de Conjuntos,
al que llamaremos número cardinal y denotado por card( A), de modo que
X≈A
⇔
card( X ) = card( A).
Sec. 1.2 Conjuntos Numerables y otros más Numerosos
11
Una motivación para esto es observar, usando la noción de conjuntos equipotentes, que:
( a) A ≈ A para cualquier conjunto A,
(b) si A ≈ B, entonces B ≈ A y
(c) si A ≈ B y B ≈ C, entonces A ≈ C
Nótese que la relación ≈ se comporta como una relación de equivalencia sobre la colección U de
todos los conjuntos. Sin embargo, como U no es un conjunto y puesto que la definición de
relación de equivalencia, Definición 1.1.11, se formuló sólo para conjuntos, tropezamos con un
serio problema: ≈ no es una relación de equivalencia sobre U. ¿Cómo resolver este impasse? Uno
puede intentar manejar esta situación definiendo el cardinal del conjunto X del modo siguiente:
card( X ) = CX
donde CX = { A ∈ U : A ≈ X }. Observe que con esta definición
X≈A
⇔
card( X ) = card( A).
Sin embargo, como estamos trabajando en la Teoría de Conjuntos basada en la axiomática de ZFC,
resulta que tal definición no es apta desde nuestro punto de vista ya que card( X ) debe ser un
conjunto y no tenemos certeza de que CX lo sea. ¿Cómo definir, entonces, la cardinalidad de un
conjunto en nuestra teoría? Pues bien, para dar una definición precisa de cardinalidad debemos
apoyarnos en el Axioma de Elección y la Teoría de Ordinales que desarrollaremos brevemente en
el próximo capítulo. Sin embargo, para ciertos tipos de conjuntos podemos aproximarnos a una
tal definición.
Definición 1.2.2 (Bolzano). Diremos que un conjunto A es finito si ocurre que A = ∅, o existe
un n ∈ N tal que A ≈ {1, 2, . . . , n}. En este caso se dice que A tiene n-elementos y escribiremos
card( A) = n.
Es importante destacar que en base a esta definición se tiene que: si A y B son conjuntos
finitos, entonces:
A ≈ B ⇔ card( A) = card( B)
Nótese que si A y B son conjuntos finitos con card( A) = m, card( B) = n y, además, m 6= n,
entonces A 6≈ B. Esta observación nos dice, en particular, que un conjunto finito no puede ser
equipotente a ningún subconjunto propio de sí mismo.
Definición 1.2.3 (Bolzano). Un conjunto A se llama infinito si él no es finito. Un conjunto infinito A
se dice que es numerable si A ≈ N, en caso contrario diremos que A es no-numerable. La expresión
“ A es a lo más numerable” significa que A, o es finito, o es infinito numerable.
Fijemos un conjunto A y sea
Bi(N, A) =
f : N → A | f es biyectiva .
Con la notación anterior, nuestra definición de conjunto numerable se puede expresar de esta
forma:
A es numerable si, y sólo si, Bi(N, A) 6= ∅.
12
Cap. 1 Preliminares
Es importante observar que si A es numerable, entonces siempre podemos hacer una lista infinita
de sus elementos y escribir a A, por ejemplo, como A = {a1 , a2 , a3 , . . . }. En efecto, basta elegir
cualquier función f ∈ Bi( A, N ) y luego definir an = f (n) ∈ A para cada n ∈ N. Nótese que al
ser f inyectiva, todos los an so distintos dos a dos y puesto que ella también es sobreyectiva, cada
elemento de A es de la forma an para un único n ∈ N. En este caso diremos que {a1 , a2 , a3 , . . .}
es una enumeración de A. Por supuesto, A puede ser enumerado de muchas formas diferentes pues
ello depende de la elección de la función f en Bi( A, N ). Por otro lado, decir que un conjunto A
es no-numerable significa que A es infinito y no existe ninguna biyección de A en N, lo que también
se puede expresar en la forma:
A es no-numerable si, y sólo si, A es infinito y Bi(N, A) = ∅.
Un principio que es fundamental en matemáticas es el siguiente:
Definición 1.2.4 (Principio del Buen-Orden). Si A es cualquier subconjunto no vacío de N, entonces A posee un primer elemento, esto es, existe un n0 ∈ A tal que n0 ≤ n para todo n ∈ A.
El Principio del Buen-Orden es el responsable del siguiente hecho: cualquier subconjunto de
N es a lo más numerable.
Teorema 1.2.5. Si A es un subconjunto no vacío de N, entonces A es a lo más numerable. En
particular, si A es infinito,
entonces él se puede representar por medio de una sucesión estrictamente
creciente, es decir, A = mn : n ∈ N , donde
m1 < m2 < m3 < · · · < m n < · · ·
Prueba. Si A es finito, la conclusión es obvia. Suponga entonces que A es infinito. Puesto que
A es no vacío, el Principio del Buen-Orden garantiza que A posee un primer elemento, es decir,
existe un m1 ∈ A, tal que
m1 ≤ a para todo a ∈ A.
Ahora bien, como A es infinito, el conjunto A1 = A \ {m1 } es no vacío y, de nuevo, por el
Principio del Buen-Orden, existe un m2 ∈ A1 tal que
m2 ≤ a
para todo a ∈ A1 .
Por supuesto, como m1 6∈ A1 , resulta que
m1 < m2 .
Sea A2 = A1 \ {m2 } = A \ {m1 , m2 }. Entonces A2 es no vacío y se repite, como antes, el
procedimiento anterior para hallar un m3 ∈ A2 tal que
m1 < m2 < m3 .
En definitiva, teniendo en cuenta que A es infinito, podemos continuar indefinidamente con el
argumento antes descrito para concluir que el conjunto A se puede escribir en la forma A =
mn : n ∈ N , donde
m1 < m2 < m3 < · · · < m n < · · ·
La aplicación f : N → A definida por f (n) = mn es claramente biyectiva y termina la prueba.
Sec. 1.2 Conjuntos Numerables y otros más Numerosos
13
Algunas consecuencias inmediatas que se obtienen de la definición de conjuntos infinitos son
las siguientes: Sean A y B conjuntos no-vacíos.
(Nu1 ) Si A es a lo más numerable (respectivamente, no-numerable) y B es equipotente con A,
entonces B es a lo más numerable (respectivamente, no-numerable). Esto sigue del hecho de que la
composición de dos funciones biyectivas es biyectiva.
(Nu2 ) Si A es numerable y B ⊆ A, entonces B es a lo más numerable. En efecto, la numerabilidad
de A nos garantiza la existencia de una función biyectiva f : A → N. El conjunto A′ = f ( B) ⊆
N es, por el Teorema 1.2.5, a lo más numerable y, en consecuencia, la función g : B → A′ definida
por g(b) = f (b) para todo b ∈ B es biyectiva. El resultado ahora sigue de (Nu1 ).
(Nu3 ) Si A es no-numerable y A ⊆ B, entonces B es no-numerable. Es consecuencia de (Nu2 ).
El siguiente resultado nos provee de una caracterización muy útil de los conjuntos numerables.
Teorema 1.2.6. Sea A un conjunto infinito. Las siguientes condiciones son equivalentes:
(1) A es numerable.
(2) Existe una función sobreyectiva f : N → A.
(3) Existe una función inyectiva g : A → N.
Prueba. (1) ⇒ (2). Suponga que A es numerable y escoja una función f ∈ Bi(N, A). Puesto
que f es sobreyectiva, (2) sigue.
(2) ⇒ (3). Suponga que f : N → A es una función sobreyectiva y observe que f −1 ({a}) 6= ∅
para todo a ∈ A. Puesto que f −1 ({a}) ⊆ N el Principio del Buen-Orden nos garantiza que
mı́n f −1 ({a}) existe y es único. Esto permite definir la función g : A → N por
g( a) = mı́n f −1 ({a})
para cada a ∈ A.
Veamos ahora que g es inyectiva. En efecto, suponga que a, a′ ∈ A con a 6= a′ . Entonces
f −1 ({a}) ∩ f −1 ({a′ }) = ∅, lo cual implica que mı́n f −1 ({a}) 6= mı́n f −1 ({a′ }). Por esto g( a) 6=
g( a′ ) y g es inyectiva.
(3) ⇒ (1). Suponga que g : A → N es una función inyectiva. Puesto que A es infinito y
g( A) ⊆ N, resulta que g( A) también es numerable. Sea h : g( A) → N una biyección. Teniendo
en cuenta que g : A → g( A) es una biyección, se tiene que f = h ◦ g es una biyección y termina
la prueba.
Siguiendo la tradición, usaremos el símbolo ℵ0 para designar el número de elementos de N, es
decir, escribiremos
card(N ) = ℵ0 .
La cardinalidad de un conjunto numerable se puede definir sin ambigüedad del modo siguiente:
Definición 1.2.7. Si A es cualquier conjunto numerable, definimos la cardinalidad de A por
card( A) = ℵ0
14
Cap. 1 Preliminares
Observe que, similar al caso finito, si A y B son conjuntos numerables, entonces
A≈B
⇔
card( A) = card( B).
¿Cómo definir card( A) si A es no-numerable? Pues bien, es aquí donde se presenta el meollo
del asunto. A diferencia de la familia de los conjuntos numerables en donde existe un único
objeto, ℵ0 , que los identifica a todos, en el caso de la colección de los conjuntos no-numerables
no hay tal objeto. En realidad, existe una cantidad infinita de “objetos” en orden “estrictamente
creciente” para conjuntos no-numerables. Sin embargo, la relación anterior permite que podamos
introducir una definición (incompleta) de cardinalidad del modo siguiente:
Definición 1.2.8 (incompleta). A cada conjunto A se le asigna un único objeto, al que llamaremos la
cardinalidad de A, card( A), tal que:
A≈B
⇔
card( A) = card( B).
El problema con esta definición es que no se especifica qué cosa es card( A) o cómo se escoge
y, por lo tanto, se le considera incompleta. Más adelante veremos, cuando hallamos introducido
la noción de número cardinal, que ésta definición incompleta es, en realidad, una buena definición,
es decir, usando el Axioma de Elección y la Teoría de Conjuntos Bien-Ordenados se demuestra
que existe una operación que es compatible con la relación ≈.
Teorema 1.2.9. Sean A y B conjuntos no vacíos con A finito y B numerable. Entonces A ∪ B es
numerable.
Prueba. Es suficiente suponer que A y B son disjuntos. Siendo A finito, existe un n ∈ N y
una función biyectiva f : Nn → A, donde Nn = {1, 2, . . . , n}. Similarmente, existe una función
biyectiva g : N → B. Considere la función
h : N \ Nn → N
definida por
h(i) = i − n,
para todo i ∈ N \ Nn .
Claramente h es biyectiva. Finalmente, la función ϕ : N → A ∪ B definida por
ϕ| N = f ,
n
es biyectiva y termina la prueba.
ϕ |N \ N = g ◦ h
n
Uno de los resultados fundamentales acerca de la noción de conjuntos numerables es el siguiente el cual se puede demostrar por del medio del genial Método de la Diagonal de Cantor.
Teorema 1.2.10. SeaS( An )∞
n =1 una colección infinita numerable y disjunta de conjuntos a lo más numerables. Entonces ∞
A
n =1 n es numerable.
Prueba. En vista del Teorema 1.2.9 es suficiente suponer que cada An es infinito numerable.
Puesto que cada conjunto An es numerable, podemos hacer una lista de sus elementos, por
ejemplo, del modo siguiente:
An = anj : j = 1, 2, . . . .
Sec. 1.2 Conjuntos Numerables y otros más Numerosos
15
Disponga ahora todos los elementos de cada uno de los conjuntos An en el siguiente arreglo matricial infinito (los puntos suspensivos indican que las sucesiones se prolongan indefinidamente
a la derecha y hacia abajo):
a12
a22
a32
..
.
···
···
···
..
.
A1
A2
A3
..
.
a11
a21
a31
..
.
a13
a23
a33
..
.
An
..
.
an1 an2 an3 · · ·
..
..
..
..
.
.
.
.
y haga una lista de ellos siguiendo las diagonales sucesivas come se muestra en la figura adjunta:
a11
a12
a13
a14
···
a21
a22
a23
a24
···
a31
a32
a33
a34
···
a41
a42
a43
a44
···
..
.
..
.
..
.
..
.
..
.
∞
Ahora bien, como la colección An n=1 es disjunta, resulta que los aij son todos distintos
S∞entre
sí, lo cual permite que se pueda establecer una correspondencia biunívoca entre N y n=1 An
tal como se muestra en la figura adjunta.
a11
a12
a21
a31
a22
a13
a14
a23
a32
a41
...
↑
↑
↑
↑
↑
↑
↑
↑
↑
↑
..
.
1
2
3
4
5
6
7
8
9
10
...
Esto establece la numerabilidad de
S∞
n =1
An y termina la prueba.
La demostración del resultado anterior posee una pequeña sutileza que con mucha frecuencia pasa desapercibida. En efecto, aunque dicha prueba pareciera, en una primera mirada, ser
constructiva, ella no lo es. La razón es la siguiente: considere la colección
B = Bi(N, An ) : n ∈ N .
Como cada conjunto Bi(N, An ) es no vacío, podemos seleccionar una función f n en él para
producir la enumeración de An , es decir, como la elección es arbitraria, esto nos indica que
existen muchas maneras de enumerar
los elementos de An . Una vez que los conjuntos An han
sido expresados en la forma An = anj : j = 1, 2, . . . , el resto de la prueba es, efectivamente,
constructiva. Sin embargo, como acabamos de ver, para poder elegir una función en cada uno de
los conjuntos Bi(N, An ) debemos hacer uso del enigmático y necesario Axioma de Elección, en
su versión numerable, que discutiremos un poco más adelante.
16
Cap. 1 Preliminares
Corolario 1.2.11. Sea ( An )∞
n =1 una familia infinita numerable de conjuntos numerables. Entonces para
cualquier entero k ≥ 2,
∞
k
[
Y
An
y
An
n =1
n =1
son numerables. Más aun, si A es cualquier conjunto numerable, entonces
Pfin ( A) = F ⊆ A : card( F ) es finito
también es numerable.
∞
Prueba. Si la sucesión An n=1 es disjunta, el resultado sigue del teorema anterior. Suponga
∞
∞
entonces que la sucesión An n=1 no es disjunta y considere la sucesión Bn n=1 definida por:
B1 = A1
y
Bn = A n \ A 1 ∪ · · · ∪ A n − 1
para n ≥ 2.
Es claro que dicha sucesión posee las siguientespropiedades: (i) cada BS
n ⊆ A n y, en
Sconsecuen∞
∞
cia, es a lo más numerable, (S
ii) la familia Bn n=1 es disjunta y (iii) ∞
B
=
n =1 n
n =1 A n . Se
∞
sigue del Teorema 1.2.10 que n=1 An es numerable.
Q
Para demostrar kn=1 An ) es numerable, es suficiente comprobar que N × N es numerable.
Veamos esto. Para cada n ∈ N escribamos An = {(m, n) : m ∈ N }. Puesto
S que los conjuntos
An son infinitos y disjuntos dos a dos, el Teorema 1.2.10 nos garantiza que ∞
n =1 A n = N × N es
numerable.
Finalmente, para verificar que Pfin ( A) es numerable, suponga que A es un conjunto numerable y sea A = {a1 , a2 , . . . } una enumeración de A. Para cada n ∈ N, considere el conjunto
An = P ({a1 , . . . , an }) = F : F ⊆ {a1 , . . . , an } .
S
Claramente An es finito y, por consiguiente, ∞
n =1 A n es numerable. Observe ahora que
∞
[
An = Pfin ( A)
n =1
y termina la prueba.
Tal vez el lector sienta curiosidad en saber por qué, en el Corolario 1.2.11 (b), no se incluyó
la afirmación: el producto numerable de conjuntos numerables es numerable. La razón es simple: tal
afirmación es falsa. PorQejemplo, si tomamos An = {0, 1} para todo n ∈ N, entonces, como
N es no-numerable.
veremos más adelante, ∞
n =1 A n = 2
Un hecho fundamental que se deriva de la parte ( a) del Corolario 1.2.11 es el siguiente
principio conocido con el nombre de:
Principio del Palomar c-Infinito (PPc ). Sea A un conjunto no-numerable.
Si todos los
∞
elementos de A se distribuyen en una colección a lo más numerable An n=1 de conjuntos, entonces
existe al menos un conjunto, digamos An0 , que contiene una cantidad infinita no-numerable de
elementos.
Si en el principio anterior el conjunto A es infinito numerable y si consideramos sólo una colección finita { A1 , A2 , . . . , An } de conjuntos, se tiene esta otra versión infinita del Principio del
Palomar.
Sec. 1.2 Conjuntos Numerables y otros más Numerosos
17
Principio del Palomar ℵ0 -Infinito (PPℵ0 ). Sea A un conjunto infinito numerable. Si todos
los elementos de A se distribuyen en una colección finita { A1 , A2 , . . . , An } de conjuntos, entonces
al menos uno de los conjuntos, digamos Ai0 , debe contener una cantidad infinita numerable de
elementos.
Otro hecho interesante que poseen los conjuntos infinitos numerables es que ellos pueden ser
particionados en infinitos conjuntos cada uno de los cuales es infinito numerable. Esta afirmación
es suficiente demostrarla para N0 .
Teorema 1.2.12 (Partición de N). Existe una sucesión ( An )∞
n =0 de subconjuntos de N 0 tal que:
( a) cada An es infinito,
(b) Am ∩ An = ∅ si m 6= n y
(c) N0 =
∞
[
An .
n =0
Prueba. Considere, como se muestra en la figura, el siguiente arreglo matricial de N0 siguiendo
las diagonales:
0
2
5
9
14
20
1a - diagonal
1
4
8
13
19
···
2a - diagonal
3
7
12
18
···
3a - diagonal
6
11
17
···
4a - diagonal
10
16
···
5a - diagonal
15
..
.
···
···
A0
A1
A2
A3
A4
A5
..
.
Si f (n, i) denota la entrada sobre la n-ésima fila y la i-ésima columna, entonces es fácil demostrar
que
(n + i)(n + i + 1)
f (n, i) =
+ i
2
para todo n, i ∈ N0 . En efecto, observe que para cada k ≥ 1, existen k + 1 elementos en la
k-ésima diagonal. De aquí se sigue que, para cada m ≥ 1, el número total de elementos que se
encuentran por arriba de la m-ésima diagonal es:
m
−1
X
( k + 1) =
k=0
m
X
k=1
k =
m ( m + 1)
.
2
Por consiguiente, si denotamos por f (m, 0) la entrada inicial sobre la m-ésima diagonal, tendremos que
m ( m + 1)
f (m, 0) =
,
2
18
Cap. 1 Preliminares
la cual también se cumple si m = 0. Sean ahora n, i ∈ N0 con n + i > 0. Entonces f (n, i) está
en la (n + i)-diagonal y es el i-ésimo elemento en dicha diagonal comenzando desde f (n + i, 0).
De allí que, tomando m = n + i en la igualdad anterior resulta que
f (n, i) = f (n + i, 0) + i =
La sucesión ( An )∞
n =0 definida por A n =
propiedades deseadas.
(n + i)(n + i + 1)
+ i.
2
f (n, i) : i ∈ N0
para cada n ∈ N0 , cumple con las
Ya hemos visto que 2N ≈ N, es decir, N contiene un subconjunto propio equipotente con él.
Similarmente, N ≈ Pri(N ), donde Pri(N ) es el conjunto (infinito) de todos los números primos.
Tal vez una de las características más sobresaliente que definen a los conjuntos infinitos y que
ningún conjunto finito la posee viene dado por el siguiente:
Teorema 1.2.13 (Dedekind). Un conjunto X es infinito precisamente cuando X es equipotente a un
subconjunto propio de sí mismo.
Prueba. Si X es infinito numerable, entonces (Nu2 ) nos dice que cualquier subconjunto infinito
de X es numerable y, en consecuencia, equipotente a X. Suponga ahora que X es no-numerable
y sea a1 ∈ X. Como X es infinito, X \ {a1 } es no vacío. Seleccione a2 ∈ X \ {a1 }. En general,
sea n ∈ N con n ≥ 1 y suponga que los términos a1 , . . . , an−1 han sido escogidos. De nuevo,
como X \ {a1 , . . . , an−1 } es infinito, elija un an en dicho conjunto. De este modo se construye un
subconjunto infinito numerable A = {a1 , a2 , . . . , an , . . .} de X. Puesto que X es no-numerable,
se sigue del Teorema 1.2.9 que X \ A es infinito. Sea f : X → X definida por
(
x
si x 6∈ A
f ( x) =
a n +1
si x = an , n = 1, 2, . . ..
Claramente f es inyectiva. Si tomamos Y = f ( X ), resulta que Y = X \ {a1 } es un subconjunto
propio de X y se cumple que Y ≈ X. Fin de la prueba.
Del resultado anterior se concluye que:
Corolario 1.2.14. Si X es un conjunto infinito, entonces X contiene una copia de N, es decir, existe
un subconjunto A de X tal que A ≈ N.
1.2.1. Ejemplos de Conjuntos Numerables
Nuestra definición de conjunto numerable establece la existencia de una correspondencia biunívoca entre el conjunto numerable, digamos A, y N. Esta definición, por supuesto, está atada
a un problema de existencia y, por consiguiente, no siempre es fácil determinar una tal biyección
aun estando en conocimiento de que nuestro conjunto es numerable. El siguiente ejemplo expone,
de manera contundente, esta situación.
(N0 ) Pri(N ), el conjunto de todos los números primos, es numerable. Existen muchas y variadas maneras de demostrar este resultado. La siguiente es la siempre elegante, hermosa, simple
y viejita prueba dada por el propio Euclides. Suponga, para generar una contradicción, que la
totalidad de los números primos es finito, digamos
Pri(N ) = p1 , p2 , . . . , pn
Sec. 1.2 Conjuntos Numerables y otros más Numerosos
19
y considere el número natural q = p1 p2 · · · pn + 1. Claramente q > pi para todo i = 1, . . . , n
por lo que q 6∈ Pri(N ). Veamos de inmediato que esto conduce a una contradicción. En efecto,
como q no es un número primo, resulta, por el Teorema Fundamental de la Aritmética, que
él es divisible por algún pi y como p1 p2 · · · pn también es divisible por pi , tenemos que 1 =
q − p1 p2 · · · pn es divisible por pi > 1 lo cual es imposible. Por consiguiente, nuestro punto de
partida de que Pri(N ) era finito es falsa y, por lo tanto, él es infinito numerable.
Por siglos el hombre ha intentado, sin éxito (hasta ahora), conocer de algún medio o fórmula
que le permita generar todos los números primos. En el momento en que el hombre esté en
posesión de un tal mecanismo, muchos de los problemas difíciles que aun permanecen confusos y sin resolver en el ámbito de la Teoría de Números se podrán aclarar y solucionar (y, por
supuesto, sus tarjetas de créditos y sus cuentas bancarias estarían en peligro). Por tal razón, el
ejemplo anterior nos revela que aunque sepamos que un determinado conjunto es numerable, en
nuestro caso Pri(N ), puede resultar una tarea ardua y tremendamente difícil exhibir una función
biyectiva explícita entre dicho conjunto y N.
(N1 ) N0 es numerable. La aplicación f : N → N0 definida por
f (n) = n − 1
para todo n ∈ N,
es biyectiva. Esto sigue también del Teorema 1.2.9.
(N2 ) 2N = {2, 4, 6, . . . , 2n, . . .} es numerable. La función f : N → 2N dada por f (n) = 2n para
todo n ∈ N es claramente una biyección. Similarmente, el conjunto N2 = {1, 4, 9, . . . , n2 , . . . } es
numerable.
(N3 ) Z es numerable. En efecto, la función f : Z → N definida por
(
2n
si n = 1, 2, . . .
f (n) =
1 − 2n
si n = 0, −1, −2, . . ..
es biyectiva.
(N4 ) N n y Z n son numerables para cada n ∈ N. Esto es consecuencia de (b) del Corolario 1.2.11. Por lo tanto,
card(N n ) = card(Z n ) = ℵ0
para cualquier n ∈ N.
(N5 ) Q es numerable. Recordemos que
m
Q =
: m, n ∈ Z, n 6= 0 .
n
Tal vez una de las primeras sorpresas acerca de la numerabilidad de un conjunto lo constituye, sin
duda alguna, el conjunto Q de los números racionales. Este conjunto, como sabemos, tiene una
sorprendente e increíble propiedad: entre dos números racionales distintos, no importa cuan cercano
estén, existe entre ellos una cantidad infinita numerable de racionales distintos. Este hecho pudiera hacer
pensar que Q es “más numeroso” que N: entre dos números naturales distintos habitan, a lo sumo,
sólo una cantidad finita de números naturales, pero infinitos racionales. Y, sin embargo, como veremos
de inmediato, ambos conjuntos N y Q son equipotentes.
20
Cap. 1 Preliminares
Una manera simple de demostrar la numerabilidad de Q, usando el Teorema 1.2.6, es considerar la aplicación f : Z × N → Q definida por
m
para todo m ∈ Z, n ∈ N
f (m, n) =
n
la cual es claramente sobreyectiva. En efecto, como Z × N es numerable, escoja una función
biyectiva g : N → Z × N. Se sigue entonces que la composición f ◦ g : N → Q es sobreyectiva
y entonces el Teorema 1.2.6 termina la prueba.
Existen, por supuesto, muchas otras formas distintas de demostrar que Q es numerable. En
los siguientes ejemplos veremos algunas maneras diferentes y, a veces sorprendentes, de contar
a Q. También, el artículo de David M. Bradley, Counting the Positive Rationals: A Brief Survey,
disponible en Internet, contiene otros ejemplos que ilustran la numerabilidad de Q.
(N05 ) Numerabilidad de Q según Cantor (1873). Puesto que Q = Q − ∪ {0} ∪ Q + , donde Q + =
{q ∈ Q : q > 0} y Q − = {q ∈ Q : q < 0}, es suficiente demostrar que Q + es numerable.
Es importante destacar que, para contar a Q + , sus fracciones deben estar escritas en forma
irreducibles, esto quiere decir que, si m/n ∈ Q + , entonces m y n son primos relativos. Denote
+
por Qirre
las fracciones de Q + que son irreducibles. Sea A1 = N y para cada entero n ≥ 2,
considere el conjunto
n[
−1
m
+
∈ Qirre : m ∈ N \
Ak .
An =
n
k=1
Como los conjuntos An son disjuntos
dos a dos y cada uno de ellos es numerable, se sigue
S
+
entonces del Teorema 1.2.10 que ∞
A
n =1 n = Q irre es numerable. Esta es la demostración clásica
de que Q + es numerable dada por G. Cantor en 1873. En efecto, Cantor dispuso los elementos
de cada conjunto Bn = {m/n : m ∈ N }, con n ∈ N, en un arreglo matricial infinito como se
sugiere en el gráfico adjunto y luego seleccionó las fracciones que allí aparecen, siguiendo las
diagonales, pero teniendo la precaución de omitir todos aquellas fracciones que ya habían sido
encontradas en las diagonales anteriores; esto, por supuesto, no es otra cosa que la definición de
los conjuntos An :
B1
1
1
2
1
3
1
4
1
5
1
···
A1
B2
1
2
2
2
3
2
4
2
5
2
···
A2
B3
1
3
2
3
3
3
4
3
5
3
···
A3
B4
1
4
2
4
3
4
4
4
5
4
···
A4
B5
1
5
2
5
3
5
4
5
5
5
A5
..
.
..
.
..
.
..
.
..
.
..
.
···
..
..
.
.
1
2
3
4
5
6
7
8
9
10
11
...
l
l
l
l
l
l
l
l
l
l
l
...
1
1
2
1
1
2
1
3
3
1
4
1
3
2
2
3
1
4
1
5
5
1
...
Sec. 1.2 Conjuntos Numerables y otros más Numerosos
21
De esta forma se concluye que Q + es numerable. Aunque tal razonamiento no genera duda
alguna, sin embargo, no es claro determinar, con exactitud, cuál es el número natural asignado a
cada fracción. Por ejemplo, ¿a cuál número natural corresponde la fracción 123/123321123111?
Otra pregunta difícil de responder es: ¿cuál es el número racional que sigue, usando el argumento
de la diagonal de Cantor, inmediatamente después de uno dado? Por esto, el procedimiento
sugerido por Cantor, si bien “cuenta a todos los números racionales positivos” no permite, de
manera explícita, establecer cuál es número natural que corresponde a cada fracción en Q + .
Se sigue de (b) del Corolario 1.2.11 que Q n es numerable para todo entero n ≥ 1.
(N15 ) Numerabilidad de Q según Lauwerier (1991). La idea de Hans Lauwerier consiste en hacer
una lista de los números racionales en (0, 1] comenzando con la fracción 1/1 y considerando,
para cada n ∈ N con n ≥ 2, todas las fracciones m/n escritas en forma irreducibles que
satisfacen la condición 1 ≤ m < n. Colóquelas en orden creciente según su denominador, es
decir:
1
,
2
1
,
1
1
,
3
2
,
3
1
,
4
3
,
4
1
,
5
2
,
5
3
,
5
4
,
5
1
,
6
5
,
6
1
,
7
2
,
7
3
,
7
4
,
7
5
,
7
6
, ···
7
+
Para completar la lista de los racionales en Qirre
, intercale, entre dos fracciones consecutivas,
todos los recíprocos de las fracciones aparecidas en la lista anterior comenzando con la fracción
1/2:
1
,
1
2
,
1
1
,
2
3
,
1
1
,
3
3
,
2
2
,
3
4
,
1
1
,
4
4
,
3
3
,
4
5
,
1
1
,
5
5
,
2
2
,
5
5
,
3
3
, ···
5
+
De esta forma se cuentan “todos” los racionales en Qirre
. Otra manera muy similar de contar
+
a Q es agrupar sus fracciones según la suma de su numerador y su denominador: primero la
fracción cuya suma es 2, entonces se agrupan aquellas cuya suma es igual a 3, y así sucesivamente.
1
;
1
|{z}
2
1 2
, ;
|2{z1}
3
1 3
, ;
|3{z1}
4
1 2 3 4
, , , ;
|4 3{z2 1}
5
1 5
, ;
|5 {z1}
6
1 2 3 4 5 6
, , , , , ; ···
|6 5 4{z3 2 1}
7
Observe el gran parecido de la sucesión de Lauwerier con la sucesión de Cantor dispuesta
siguiendo las diagonales.
(N25 ) Numerabilidad de Q según S. Abbott. Una idea muy similar a la Lauwerier es la dada por
S. Abbott (véase, por ejemplo, [1], pág. 24). Para cada n ∈ N, considere el siguiente conjunto:
p
An =
± ∈ Qirre : p, q ∈ N0 , q 6= 0, p + q = n .
q
Una muestra de los elementos de algunos de los conjuntos An sigue a continuación:
0
1 1
1 1 2 2
1
1 3
3
A1 =
, A2 =
,−
, A3 =
,− , ,−
, A4 =
,− , ,− .
1
1 1
2 2 1 1
3
3 1
1
Lo importante es observar que:
(i) cada conjunto An es finito.
(ii) Am ∩ An = ∅ si m 6= n y
22
Cap. 1 Preliminares
(iii) cada número racional escrito en forma irreducible aparece una, y sola una vez, en exactamente uno de los conjuntos An .
S
Resulta de lo anterior que ∞
n =1 A n = Q es numerable. Una lista de los elementos de Q es
mostrada abajo, aunque, como en el caso de la matriz de Cantor, puede ser una tarea ardua dar
explícitamente una fórmula para dicha correspondencia.
- 11
1
1
↑
↑
↑
↑
↑
↑
↑
↑
↑
↑
↑
...
1
2
3
4
5
6
7
8
9
10
11
...
1
2
- 12
2
1
- 21
- 13
1
3
3
1
- 31
...
0
1
(N35 ) Numerabilidad de Q según Sagher (1989). Tal vez un modo más práctico de contar los
números racionales sea considerar el siguiente argumento debido a Yoram Sagher, (Amer. Math.
Monthly, 96(9), 1989). Sea m/n ∈ Qirre y suponga que m y n son enteros positivos. El Teorema
Fundamental de la Aritmética nos muestra que podemos expresar, de modo único, a m y n en
la forma:
j
j
m = p1i1 · · · pikk
y
n = q11 · · · qll ,
donde los p1 , . . . , pk , q1 , . . . , ql son números primos y los i1 , . . . , ik , j1 , . . . , jl ∈ {1, . . . , 9}. Observe
que debido a que la fracción m/n está en forma irreducible, se tiene que pi 6= q j para todo i, j.
La función de Sagher S : Q → N que cuenta los racionales es la siguiente: S(1) = 1 y
m
2j1 −1
2j −1
2ik
1
S
= p2i
· · · ql l .
1 · · · p k · q1
n
Es fácil establecer que S es inyectiva y sobre. Por ejemplo,
S(1/108 ) = 1015 ,
S(22/7) = 112 · 22 · 71 = 3388,
S(3/5) = 32 · 51 = 45.
Por otro lado, para determinar cuál es número racional asociado a un número natural N, expréselo, como antes, en la forma N = p1i1 · · · pikk . Ahora separe los números primos con potencias
pares e impares, esto es,
2j
2j l −1
s −1
N = pα11 · · · pαnn p2k
· · · p2k
β1
βs
y entonces defina
S −1 ( N ) =
j
j
pα11 · · · pαnn
pkβl1 · · · pkβss
.
Por ejemplo: si N = 27 · 34 · 17 · 72 · 5, entonces sepárelos como N = 34 · 72 · 27 · 5 · 17 y ahora
defina
32 · 71
S−1 ( N ) = S−1 (34 · 72 · 27 · 5 · 17) = 4 1
.
2 · 5 · 171
Aunque la descomposición de un número entero positivo en factores primos puede ser una
tarea agotadora si dicho número es muy grande, no deja de ser interesante la función de Sagher,
la cual resulta ser más atractiva que el procedimiento usado por Cantor a la hora de contar a los
racionales.
Sec. 1.2 Conjuntos Numerables y otros más Numerosos
23
(N45 ) Numerabilidad de Q usando fracciones continuas. La Teoría de las Fracciones Continuas
añade otra forma de contar los racionales. En efecto, es un hecho bien conocido que cualquier
número racional p/q admite una única representación decimal como una fracción continua finita de la
forma:
1
p
= a0 +
,
q
1
a1 +
1
a2 +
..
.
1
a n −2 +
1
a n −1 +
an + 1
donde a1 , a2 , . . . , an ∈ N y a0 es un entero no-negativo. De allí que si definimos
b k = a0 + a1 + · · · + a k ,
para 0 ≤ k ≤ n,
entonces la aplicación f : Q → N dada por
n
X
p
f
=
2b k
q
k=0
constituye una biyección entre Q y N.
(N55 ) Numerabilidad de Q según Kantrowitz (2000). Un principio general descubierto por
Robert Kantrowitz en el año 2000 (Math. Mag. 73(2000), 40-42) establece que:
Todas las palabras de longitud finita que se pueden formar a partir de un alfabeto finito es
numerable.
Un alfabeto finito no es otra cosa que conjunto finito cuyos elementos, a los que llamaremos
letras, cumplen con la siguiente regla: se permite construir cualquier palabra finita con las letras del
alfabeto colocándolas una delante de la otra. El número de letras que contiene cada palabra finita
se llama la longitud de dicha palabra (las letras que aparecen en cada palabra pueden repetirse
tantas veces como se quiera).
Suponga que A es un alfabeto finito con r ∈ N letras y sea Pal(A) el conjunto de todas las
“palabras” de longitud finita que se pueden formar con el alfabeto A. Para cada n ∈ N, sea En
el conjunto de todas las palabras de longitud n. Entonces En es un conjunto finito con exactamente rn palabras, de modo que existe una función inyectiva f1 de E1 sobre el segmento inicial
{1, 2, . . . , r}, una función inyectiva f2 de E2 sobre el siguiente segmento {1 + r, 2 + r, . . . , r + r2 }
y así, sucesivamente. Observe que, para cada n ≥ 2, la función f n aplica el conjunto En sobre el
segmento
1 + r + r 2 + · · · + r n −1 , 2 + r + r 2 + · · · + r n −1 , . . . , r + r + r 2 + · · · + r n }
∞
de longitud rn . De esto
se
sigue
que
la
colección
E
es disjunta y entonces, por el Teoren
n =1
S
ma 1.2.10, el conjunto ∞
E
=
Pal
(
A
)
es
numerable.
n
n =1
Ejemplos:
24
Cap. 1 Preliminares
( a) Si A = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, /, −}, entonces Pal(A) es numerable. Observe que si m/n
se interpreta como el cociente de números naturales y − como el signo menos, entonces Q se
puede identificar con un subconjunto de Pal(A) y, por lo tanto, Q es numerable.
(b) Sea B = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, x, +, −, (, ), ∧, / } y denote por Q [ x] el conjunto formado
por todos los polinomios en la variable x con coeficientes racionales. Puesto que Pal(B) es
numerable y Q [ x] es un subconjunto de Pal(B), resulta que Q [ x] es numerable. Por ejemplo, el
polinomio x3 − 45 x2 + 2 puede ser representado por la palabra x ∧ 3 − (4/5) x ∧ 2 + 2.
(N65 ) Numerabilidad de Q según Calkin-Wilf (2000). Una manera muy elegante de contar los
+
elementos de Qirre
fue la que propusieron Neil Calkin y Herbert Wilf en el año 2000 (véase, por
ejemplo, [2], p. 104-108) que consiste de la siguiente sucesión, respetando el orden en que están
dispuestos sus términos:
CW :
1 1 2 1 3 2 3 1 4 3 5 2 5 3 4
, , , , , , , , , , , , , , ,...
1 2 1 3 2 3 1 4 3 5 2 5 3 4 1
Lo primero que llama la atención en esa lista es que:
(CW0 ) El denominador de cada fracción en la lista CW es el numerador de la siguiente fracción. Esto significa que el n-ésimo número racional en la lista CW se puede expresar en la forma b(n)/b(n + 1),
n = 0, 1, 2, . . ., donde b es una exquisita y elegante función de N en N que cuenta, para cada
n ∈ N, el número de formas, o maneras, de escribir el entero n como suma de potencias de
2 pero imponiendo la siguiente restricción: cada potencia debe ser usada a lo sumo dos veces. Por
ejemplo, partiendo de b(0) = 1, tenemos que
b ( 1) = 1
pues
1 = 20 ,
b ( 2) = 2
ya que
2 = 21 = 20 + 20 ,
b ( 3) = 1
pues
3 = 21 + 20 ,
b ( 4) = 3
ya que
4 = 22 = 21 + 21 = 21 + 20 + 20 ,
b ( 5) = 2
..
.
pues
5 = 22 + 20 = 21 + 21 + 20 ,
Pero, ¿cómo se construye tan extraña y afortunada lista? La forma más simple de construir la
lista CW es a través del así llamado árbol de Calkin-Wilf, que consiste en aplicar las siguientes
dos reglas sencillas:
(CW1 )
1
1
es el tope del árbol.
(CW2 ) Cada vértice (o nodo) es un número racional mn que posee dos ramas: la rama izquierda que se
n
define por mm+n , mientras que la rama derecha viene dada por m+
n .
Sec. 1.2 Conjuntos Numerables y otros más Numerosos
25
m
n
m
m+n
Nivel
1
1
m+n
n
N1
1
2
2
1
1
3
1
4
..
.
2
3
3
2
3
5
4
3
N2
..
.
5
2
2
5
..
.
..
.
3
1
5
3
3
4
..
.
N3
4
1
N4
..
.
..
.
Árbol de Calkin-Wilf
Observe que si x = m/n, entonces sus ramas izquierda y derecha se pueden escribir, respectivamente, en la forma:
m
m
x
= m n n =
m+n
x+1
+
n
n
m+n
m
=
+ 1 = x + 1.
n
n
y
Nótese también que si m/n es la rama izquierda de algún vértice p, entonces m < n y p =
n
Similarmente, si m/n es la rama derecha del vértice q, entonces m > n y q = m−
n .
m>n ⇒
q=
m−n
n
p=
m
n−m
m
n−m .
⇐ m<n
m
n
La lista CW se genera, siguiendo el árbol de Calkin-Wilf, del modo siguiente: coloque la fracción
del nivel 1 en el primer lugar y continúe colocando, de izquierda a derecha, las fracciones de los
niveles siguientes separadas por comas.
Algunas de las formidables e increíbles propiedades que posee el árbol de Calkin-Wilf son
mostradas a continuación.
(CW3 ) Todas las fracciones que aparecen en el árbol de Calkin-Wilf son irreducibles, es decir, pertenecen
+
a Qirre
.
Prueba. Es claro que 11 , la primera fracción en el tope del árbol, está en forma irreducible. Suponga, para generar una contradicción, que alguna fracción en el árbol, digamos m/n, no está
en forma irreducible. Esto significa que existe algún entero k > 1 tal que
m = km′
y
n = kn′
26
Cap. 1 Preliminares
con m′ , n′ ∈ N. Para fijar idea, suponga también que m/n aparece en el nivel Nj y que todas
las fracciones por encima de dicho nivel están en forma reducida. Por supuesto, la fracción m/n
proviene de un vértice p/q que está en el nivel Nj−1 y, por consiguiente, está, por hipótesis, en
forma reducida. Si m/n es la rama izquierda de p/q, entonces
p
m
km′
=
=
,
q
n−m
k( n ′ − m ′ )
contrario a nuestra suposición. De forma similar, si m/n es la rama derecha de p/q, entonces
m−n
k( m ′ − n ′ )
p
=
=
,
q
n
kn′
obteniéndose de nuevo una contradicción. Esto prueba nuestra afirmación.
Otra forma de demostrar lo anterior es observar que si m y n son primos relativos, también
lo son m y m + n, así como también, n y m + n.
+
(CW4 ) Cualquier fracción en Qirre
aparece en el árbol, es decir, pertenece a CW.
Prueba. Suponga que la conclusión es falsa, es decir, que existe al menos una fracción irreducible
en Q + que no está en CW. Denote por R el conjunto de todas las fracciones irreducible en Q +
que no aparecen en el árbol. Nuestra hipótesis nos dice que R 6= ∅. De todas las fracciones que
están en R hay, al menos una, cuyo denominador es el más pequeño: denótelo por n y reúna a
todas esas fracciones en un conjunto Rn . De éste último conjunto de fracciones existe al menos
una cuyo numerador es el más pequeño: designe a esa fracción por m/n. Observe que:
(i) Si m > n, entonces (m − n)/n ∈ R. En efecto, si (m − n)/n 6∈ R, entonces dicho elemento
estaría en CW y, en consecuencia, sus dos ramas (m − n)/m y m/n también estarían en CW
lo cual es imposible por la elección de m/n. Ahora bien, el hecho de que (m − n)/n ∈ R y
m − n < m nos revela la existencia de un elemento en R cuyo numerador es menor que m, lo
que de nuevo conduce a una contradicción por la elección de m/n.
(ii) Similarmente, si m < n, entonces m/(n − m) ∈ R lo que conduce, razonando como en el
caso anterior, a una contradicción. La conclusión es clara: R = ∅ y con esto finaliza la prueba de
(CW4 ).
(CW5 ) Cada fracción en el árbol aparece una, y sola una, vez.
Prueba. Observe, en primer lugar, que 1/1 aparece una sola vez en el árbol ya que cada rama
izquierda, digamos m/(m + n) es menor que 1 y cada rama derecha ( p + q)/n es mayor que 1
cualquiera sea el vértice m/n. Suponga ahora que existe al menos una fracción en el árbol que
aparece, por lo menos, dos veces y sea R el conjunto de tales fracciones. Como antes, sea R1
el subconjunto de R formado por las fracciones que tienen el denominador más pequeño y, de
estos últimos, sea m/n el elemento de R1 que posee el numerador más pequeño.
(i) Si m < n, entonces m/n es la rama izquierda de al menos dos vértices, digamos p y q.
p
m
n
q
m
n
Sec. 1.2 Conjuntos Numerables y otros más Numerosos
De aquí se sigue que
p =
27
m
= q,
n−m
y, por lo tanto, la fracción m/(n − m) se repite más de una vez. Esto prueba que m/(n − m) ∈ R
y como su denominador es menor que n se obtiene entonces una contradicción con la elección
de m/n.
(ii) Si m > n, entonces un razonamiento similar al anterior conduce de nuevo a una contradicción. Por consiguiente, R = ∅ y termina la prueba.
Las afirmaciones (CW3 ), (CW4 ) y (CW5 ) se combinan para obtener una biyección entre N y
CW = Q + como se muestra en la figura adjunta:
1
1
2
2
1
3
3
2
2
3
3
1
4
4
3
3
5
...
↑
↑
↑
↑
↑
↑
↑
↑
↑
↑
...
1
2
3
4
5
6
7
8
9
10
...
El lector tiene todo el derecho a preguntarse: bueno, y ¿cuál es, explícitamente, la biyección entre
N y Q + ? La respuesta es fácil si podemos determinar, cada vez que elijamos una fracción en el
árbol, cuál es la fracción que le sigue. He aquí el modo de obtenerla.
(CW6 ) Para cada x en el árbol, el siguiente elemento o sucesor viene dado por
f ( x) =
1
,
2[ x ] + 1 − x
donde [ x] es la parte entera de x.
Prueba. Fijemos una fracción x = m/n del árbol CW con sus dos ramas
muestra en el gráfico adjunto.
m
n
m
m+n
esto es, con x =
m
n
x
x+1
m+n
n
x
2x + 1
x
x +1
y x + 1 como se
x
x+1
x+2
De éste diagrama se puede deducir, sin dificultad, que la rama derecha de x es x + 1 y que la
rama derecha de x + 1 es x + 2, es decir, la segunda rama derecha de x es x + 2 y, en general,
la k-ésima rama derecha de x es x + k. Similarmente, la rama izquierda de x es x +x 1 y la rama
x
x
x
izquierda de x +
1 es 2x +1 y, en general, la k-ésima rama izquierda de x es kx +1 .
28
Cap. 1 Preliminares
x
x
x+1
x+1
asos
k p
x+1
( x + 1) + 1
x
+1
x+1
y=
x+1
= f ( y)
k ( x + 1) + 1
x
+k
x+1
Veamos ahora cómo obtenemos, dada una fracción en el árbol de Calkin-Wilf, su sucesora
inmediata. Suponga que nuestra fracción es la rama izquierda de x = m/n, es decir, la fracción
m/(m + n) la cual podemos reescribir en la forma
y =
x
.
x+1
Resulta entonces que su sucesora es la fracción
x+1 =
1
,
1−y
lo que nos proporciona una fórmula simple para hallar el siguiente elemento en el árbol siempre
que y sea la rama izquierda del vértice x = m/n. Observe que, en este caso, 0 ≤ y < 1 y, por
consiguiente, [y] = 0, de modo que su sucesor 1−1 y viene dado por
f ( y) =
1
1
=
.
2[ y ] + 1 − y
1−y
Suponga ahora que y es alguna rama derecha en el árbol y queremos hallar su sucesora inmediata
f (y) en dicho árbol. Para determinar f (y) debemos, en primer lugar, hallar el primer vértice
del árbol, digamos x, desde cuyas dos ramas y después de k pasos tomando las ramas derechas
de x/( x + 1) y las ramas izquierdas de x + 1, respectivamente, conducen a y y f (y) (véase el
gráfico anterior). Se tiene entonces que
y =
x
m
+k =
+ k,
x+1
m+n
Sec. 1.2 Conjuntos Numerables y otros más Numerosos
29
de donde se sigue que [y] = k ya que m/(m + n) < 1 y, por lo tanto,
resulta que
f ( y) =
x+1
1
1
=
=
1
k ( x + 1) + 1
[y] + 1 −
k + x +1
x
x +1
=
x
= y − [y]. De esto
x+1
1
2[ y ] − y + 1
la cual representa la hermosa y sencilla fórmula descubierta por Moshe Newman en el 2003, a
propósito de un problema formulado por Donald E. Knuth en el 2001.
4.0
3.5
3.0
2.5
2.0
1.5
1.0
0.5
0.5
1.0
1.5
2.0
2.5
3.0
Definiendo f n = f ( f n−1 ) para cada n ≥ 2, donde f 1 = f , se tiene entonces que
f (0) = 1,
f 6 ( 0) =
2
,
3
f 2 ( 0) =
1
,
2
f 7 (0) = 3,
f 3 (0) = 2,
f 8 ( 0) =
1
,
4
1
,
3
4
f 9 ( 0) = ,
3
3
,
2
5
f 10 (0) = ,
3
f 4 ( 0) =
f 5 ( 0) =
por lo que la función CW : N → Q + definida por
CW(n) = f n (0),
para cada n ∈ N
es la biyección buscada. Observe que determinar el número racional asociado a cada n puede tomar muchísimos pasos (si n es muy grande) ya que la función CW es una relación de
recurrencia.
(CW7 ) Otra propiedad notable del árbol de Calkin-Wilf. Otra forma de hallar la n-ésima fracción en
la sucesión CW es proceder del modo siguiente: exprese a n en su forma binaria, digamos
n = bk 2k + bk−1 2k−1 + · · · + b1 2 + b0 =
bk bk−1 . . . b1 b0
2
y entonces siga el camino de las ramas en el árbol de Calkin-Wilf determinado por los dígitos
bk , . . . , b0 pero comenzando con la fracción 10 como se muestra en el gráfico adjunto. Aquí, bi = 1
indica que “debes tomar la rama derecha”, mientras que bi = 0 significa que “debes tomar la rama
30
Cap. 1 Preliminares
izquierda” en cada vértice.
0
1
1
1
1
0
1
2
0
0
1
4
1
3
0
4
3
3
5
2
1
0
1
1
..
.
1
3
2
..
.
1
0
5
2
2
5
..
.
..
.
2
3
1
1
0
5
3
3
4
3
1
1
4
1
..
.
..
.
Por ejemplo, si n = 11, entonces como 11 = 1 · 23 + 0 · 22 + 1 · 2 + 1 · 20 = (1011)2 resulta que
la fracción que corresponde a n = 11 es 52 (véase el gráfico anterior).
(N75 ) Numerabilidad de Q según Farey. Otro interesante y fascinante modo de contar los racionales que no se repiten lo constituye la inigualable sucesión de Farey. El conjunto de las
fracciones, o sucesión, de Farey de orden n, denotado por Fn , es el conjunto de todas las fracciones irreducibles en el intervalo cerrado [0, 1], colocadas en orden creciente, cuyos denominadores
no exceden a n. Así,
p
∈ Fn
q
p
∈ Qirre ,
q
⇔
0 ≤ p < q ≤ n.
Por ejemplo,
F1 =
F2 =
F3 =
F4 =
F5 =
F6 =
..
.
Observe que:
0 1
,
1 1
0 1 1 2 1
, , , ,
1 3 2 3 1
0 1 1
, ,
1 2 1
0 1 1 1 2 3 1
, , , , , ,
1 4 3 2 3 4 1
0 1 1 1 2 1 3 2 3 4 1
, , , , , , , , , ,
1 5 4 3 5 2 5 3 4 5 1
0 1 1 1 1 2 1 3 2 3 4 5 1
, , , , , , , , , , , ,
1 6 5 4 3 5 2 5 3 4 5 6 1
Sec. 1.2 Conjuntos Numerables y otros más Numerosos
31
(i) F1 ⊆ F2 ⊆ · · · ⊆ Fn para cualquier n ≥ 1.
Una de las cosas curiosas que poseen cada uno de los conjuntos Fn con n ≥ 2 y que fue
descubierta por John Farey en 1816 es que tal conjunto se construye a partir de Fn−1 copiando,
en primer lugar, todos sus elementos en Fn y luego insertando las medianas entre fracciones
consecutivas de Fn−1 pero solamente cuando los denominadores de tales medianas no excedan
a n. Pero, ¿qué son las medianas? El detalle en la construcción de los conjuntos Fn consiste en
una forma muy peculiar de sumar fracciones, llamada la mediana de dos fracciones y definida
del modo siguiente:
Definición 1.2.15. La mediana de dos fracciones p/q y p′ /q′ se define como
p′
p + p′
p
⊕F ′ =
.
q
q
q + q′
Pues bien, partiendo de las dos fracciones 01 y 11 se generan, con la ayuda de las medianas,
los conjuntos Fn para n ≥ 2. En efecto, F2 se construye a partir de F1 insertando, entre las dos
fracciones de F1 , la fracción 12 la cual se obtiene “sumando” las dos fracciones de F1 al estilo
Farey, es decir,
0
1
1
1
2
1
1
1
0
⊕F =
|
1
1
2
F3 se construye de F2 insertando entre ellos las medianas de los elementos de F2 , es decir,
1
1
0
⊕F = ,
1
2
3
0
1
1
1
2
⊕F =
2
1
3
1
3
1
2
2
3
|
|
|
1
1
Un procedimiento similar se hace para construir F4 pero aquí hay que tener la precaución de
evitar incorporar medianas cuyos denominadores excedan a 4. Por ejemplo, las medianas
1
1
2
⊕F =
3
2
5
1
2
3
⊕F =
2
3
5
y
no pueden ser incluidas en F4 ya que su denominador excede a 4. Recuerde que, por definición,
los denominadores de las fracciones de F4 no deben ser mayores que 4, por lo que las únicas
medianas permitidas en F4 son
0
1
1
⊕F =
1
3
4
2
1
3
⊕F =
3
1
4
y
Luego, las fracciones que viven en F4 son
0
1
1 1
4 3
1
2
2 3
3 4
| |
|
| |
1
1
32
Cap. 1 Preliminares
De esta forma se construye, para cada n ≥ 2, la sucesión de Farey Fn a partir de Fn−1 .
Es importante tener en cuenta el siguiente hecho respecto a las medianas.
(1) Si p/q y p′ /q′ son dos fracciones arbitrarias con 0 ≤
p
q
<
p′
q′ ,
entonces
p
p + p′
p′
<
<
.
q
q + q′
q′
Prueba. El hecho de que
p
q
<
p′
q′
nos garantiza que p′ q − pq > 0 y, por lo tanto,
p + p′
p
p′ q − pq
> 0
−
=
q + q′
q
q( p + q)
p′
p + p′
p′ q − pq
> 0.
−
=
q′
q + q′
q′ ( p + q)
y
Fin de la prueba.
Esta propiedad era muy bien conocida por Arquímedes y también por algunos geómetras de
la India, lo que hace presumir que tal vez otras personas la√
conociesen. Además, ella fue utilizada
por Nicolás Chuquet en el año de 1484 para aproximar a n cuando n ≤ 14.
Observe que, por definición, los racionales que aparecen en cualquier sucesión de Farey de
orden n están dispuestos en orden creciente y que, por lo tanto, no es posible que una misma fracción
en Fn aparezca en dos lugares diferentes. Por consiguiente:
Corolario 1.2.16. Cada fracción irreducible en [0, 1] aparece una, y solo una, vez en
Qirre ∩ [0, 1] =
∞
[
Fn .
S∞
n =1 Fn ,
es decir,
n =1
En particular, Qirre ∩ [0, 1] es numerable.
Prueba. En efecto, si m/n es una fracción irreducible en (0, 1), entonces claramente m/n ∈ Fn y
el hecho de que
S ella aparezca una sola vez es consecuencia de la observación anterior. Finalmente,
puesto que ∞
n =1 Fn es numerable, entonces Q [0,1] = Q ∩ [0, 1] es numerable.
Otra de las propiedades fundamentales que posee cada sucesión de Farey es la siguiente:
(2) Si p/q y p′ /q′ son dos términos consecutivos en Fn , entonces
| p′ q − pq| = 1.
Prueba. La demostración la haremos por inducción sobre n. La conclusión se cumple trivialmente si n = 1. Suponga ahora que el resultado es cierto para cualquier par de fracciones
p
consecutivas en Fn y probemos que el resultado también se cumple para Fn+1 . Suponga que q
y
p′
q′
son dos fracciones consecutivas en Fn y escribamos
Fn =
p p′
..., , ′ ,... .
q q
Por hipótesis, | pq′ − p′ q| = 1. Sólamente existen dos posibilidades: que q + q′ ≤ n + 1, o bien,
que q + q′ > n + 1.
Sec. 1.2 Conjuntos Numerables y otros más Numerosos
( a) si q + q′ ≤ n + 1, entonces
Fn +1 =
33
p p + p′ p′
,
,...
..., ,
q q + q′ q′
y se cumple que | p(q + q′ ) − q( p + p′ )| = | pq′ − p′ q| = 1. Similarmente,
| p′ (q + q′ ) − q′ ( p + p′ )| = | pq′ − p′ q| = 1.
(b) si q + q′ > n + 1, entonces
p+ p′
q+q′
6∈ Fn+1 y, por lo tanto,
Fn +1 =
p p′
..., , ′ ,... .
q q
Esto nos dice que | pq′ − p′ q| = 1 y el resultado es válido para Fn+1 . Fin de la prueba.
(3) Toda fracción de Farey es simétrica respecto a la fracción 1/2 en el siguiente sentido: cada fracción
p
p
p
1
q ∈ Fn con n > 2 y q 6 = 2 , posee su simétrica 1 − q ∈ Fn y ambas son equidistantes de 1/2.
Suponga que an,k denota el término de Fn que ocupa el lugar k contado de izquierda a
derecha, entonces, por ejemplo:
a4,3 =
1
,
3
2
1
= 1− ,
3
3
a4,5 =
a6,6 =
2
,
5
a6,8 =
3
2
= 1−
5
5
y así con todos los elementos de Fn .
Existen hermosas y variadas formas de hacer diagramas con las sucesiones de Farey. Por
ejemplo, comenzando con F1 , dibuje un semicírculo de diámetro 1 pasando por los puntos (0, 0)
y (1, 0). Luego, cuando se haya construido F2 , dibuje dos semicírculos tangentes, ambos de
diámetro 1/2, el primero pasando por los puntos (0, 0) y (1/2, 0), mientras que el segundo
semicírculo pase por (1/2, 0) y (1, 0). Continúe construyendo 4, 8, etc. semicírculos pasando
por cada par de puntos consecutuvos de F3 , F4 , etc. como se muestra en el gráfico adjunto.
|
0
1
|
1
5
|
1
4
|
1
3
|
2
5
|
1
2
|
3
5
|
2
3
|
3
4
|
4
5
|
1
1
34
Cap. 1 Preliminares
Las sucesiones de Farey han sido objeto de intensos estudios. Muchas son sus propiedades y
aplicaciones (véase, por ejemplo, [68]). El siguiente es otro caso curioso de lo que se puede hacer
con ellas, la cual fue encontrada en 1938 por Lester R. Ford. En plano y sobre el eje X dibuje,
por cada fracción p/q ∈ Fn , un círculo tangente al punto ( p/q, 0) y de radio 1/q2 . Resulta
que estos círculos, llamados círculos de Ford, tienen la propiedad de que cualesquiera sean las
fracciones consecutivas p/q y p′ /q′ , los círculos construidos sobre ellos son tangentes (véase la
figura adjunta).
|
0
1
|
1
5
|
1
4
|
1
3
|
2
5
|
1
2
|
3
5
|
2
3
|
3
4
|
4
5
|
1
1
Nota Curiosa. Un comentario final respecto a las fracciones de Farey. En Londres existió, desde
1704 hasta 1841, una revista llamada “The Ladies Diary”, también conocida como “The Woman
Almanache”, que se dedicaba a mostrar calendarios, acertijos, problemas matemáticos y otros
“Entretenimientos Particulares, Peculiarmente Adaptados para el Uso y Diversión de la MujerBella”. En la edición de 1747 apareció el siguiente problema propuesto por J. May de Amsterdam:
“Se requiere encontrar (por un teorema general) el número de fracciones irreducibles, cada una
menor que la unidad, tal que el denominador más grande sea menor que 100”.
Este problema permaneció sin resolverse por espacio de 4 años hasta que, en 1751, un caballero de nombre R. Flitcon dio una solución satisfactoria: existen 3003 fracciones irreducibles, aunque
no suministró una lista de ellas y, menos aun, una fórmula explícita para hallarlos. Correspondió
al matemático francés Charles Haros crear una tabla de tales fracciones, la cual fue publicada en el
año de 1802 en el “Journal de l’Ecole Polytechique” que contenía, además, sus respectivas aproximaciones decimales. Para lograr su objetivo Haros tuvo que usar las medianas para su construcción.
Posteriormente, un inglés de nombre Henry Goodwyn, se ocupó de confeccionar su propia tabla
de fracciones irreducibles cuyos denominadores comenzaban desde 1 y terminaban en 1024, la
cual publicó en la “Royal Society” el 25 de Abril de 1816. No había transcurrido un mes desde su publicación cuando un geólogo inglés, John Farey, publicó una nota en “The Philosophical
Magazine and Journal” titulada: “Sobre una curiosa Propiedad de las Fracciones Vulgares”, donde
se percataba sobre el uso de las medianas para construir nuevas fracciones irreducible pero sin
ofrecer ninguna prueba de ello. Por suerte, la nota de Farey fue publicada en la revista francesa
“Bulletin de la Societé Philomatique” y el curioso Cauchy la leyó y demostró que el método de las
medianas sugerido por Farey era correcto y, desde entonces, tal sucesión lleva su nombre.
Sec. 1.2 Conjuntos Numerables y otros más Numerosos
35
(N85 ) Numerabilidad de Q según Stern-Brocot. Existe otro árbol, tan genial, fascinante y hermoso como el árbol de Calkin-Wilf, que permite no sólo contar, sino también ordenar de menor a mayor
+
en una sucesión creciente, todos los racionales en Qirre
, es decir, cada nivel del árbol, llamémoslo
+
SBn , contiene 2n − 1 elementos de Qirre
tal que, para cada n ∈ N los elementos de SBn están
dispuestos en orden creciente:
r1 < r2 < · · · < r2n − 1 ,
∞
[
y
SB1 ⊆ SB2 ⊆ · · · ⊆ SBn ⊆ · · ·
+
SBn = Qirre
n =1
Este árbol fue descrito por primera vez por el matemático alemán Moritz Stern en 1858 y tres
años después, e independientemente, por el relojero francés Achielle Brocot. Las reglas para la
construcción del árbol de Stern-Brocot son similares a la construcción de las sucesiones de Farey
de orden n pero con una excepción: la suma de los denominadores de las medianas no requieren
que estén acotadas por n. Dichas reglas se pueden expresar del modo siguiente:
1
0
y .
1
0
(SB2 ) Se inserta, tantas veces como sea necesaria, la mediana entre dos fracciones consecutivas.
(SB1 ) Se comienza con las fracciones
1
1
0
1
1
2
0
1
1
3
0
1
1
4
0
1
1
5
1
4
..
.
2
5
2
7
1
3
3
8
2
5
2
3
..
.
3
5
1
2
3
7
1
2
2
1
1
1
1
2
1
3
1
0
4
7
3
5
..
.
3
4
2
3
5
8
2
3
3
2
1
1
5
7
3
4
4
3
1
1
4
5
1
1
5
4
..
.
4
3
3
2
..
.
3
1
2
1
5
3
3
2
7
5
1
0
8
5
5
3
..
.
5
2
2
1
7
4
2
1
7
3
5
2
..
.
1
0
4
1
3
1
8
3
3
1
7
2
4
1
1
0
6
1
..
.
Árbol de Stern-Brocot
Pues bien, partiendo de las dos fracciones 01 y 10 se generan, con la ayuda de las medianas,
las siguientes fracciones: en el primer paso se obtiene la mediana 11 = 01 + 10 la cual se añade a
las dos fracciones anteriores para formar:
0 1 1
, , .
1 1 0
( 1)
36
Cap. 1 Preliminares
En el siguiente paso añaden, al conjunto anterior, las medianas
1
2
y
2
1
obteniéndose:
0 1 1 2 1
, , , , .
1 2 1 1 0
( 2)
En el próximo paso se añaden a las fracciones que aparecen en (2) las cuatro nuevas medianas
obtenidas de éste: 13 , 23 , 32 y 31 , esto es:
0 1 1 2 1 3 2 3 1
, , , , , , , , ,
1 3 2 3 1 2 1 1 0
y se continúa ad infinitum. El árbol de Stern-Brocot es el que se construye sólo con las nuevas
medianas tal como se muestra en el gráfico anterior.
Si por cada n ∈ N, denotamos por SBn el conjunto de todas las fracciones de SBn−1 añadiéndole las medianas de cada dos fracciones consecutivas de SBn−1 , se tiene que:
SB0 =
SB1 =
SB2 =
SB3 =
SB4 =
..
.
0 1
,
1 0
0 1 1 2 1
, , , ,
1 2 1 1 0
0 1 1
, ,
1 1 0
0 1 1 2 1 3 2 3 1
, , , , , , , ,
1 3 2 3 1 2 1 1 0
0 1 1 2 1 3 2 3 1 4 3 5 2 5 3 4 1
, , , , , , , , , , , , , , , ,
1 4 3 5 2 5 3 4 1 3 2 3 1 2 1 1 0
Observe que cada conjunto SBn contiene a todos los vértices de los niveles anteriores del
árbol. Con estas definiciones es fácil probar las siguientes conclusiones:
( a) SBn−1 ⊆ SBn para todo n ≥ 1.
(b) Fn ⊆ SBn para todo n ≥ 1.
(c) p/q ∈ SBn
⇔
q/p ∈ SBn .
(d) card(SBn ) = 2n + 1 para todo n ≥ 1.
(e) Cada conjunto SBn está ordenado de menor a mayor y todas sus elementos son fracciones
irreducibles.
Nota: Observe que (c) indica una simetría inversa respecto a la fracción 11 , es decir, la fracción
p/q y su inversa q/p son ambas equidistante de 11 , lo cual significa que el número de fracciones
que existen entre cada una de ellas y 1/1 es el mismo.
Algunas de las propiedades notables de los conjuntos SBn , árbol de Stern-Brocot, y similares
a las sucesiones de Farey, son las siguientes:
Sec. 1.2 Conjuntos Numerables y otros más Numerosos
37
(SB3 ) Si m/n y m′ /n′ son dos términos consecutivos en cualquier conjunto SBk , entonces
m′ n − mn′ = 1
y, por lo tanto,
(SB)
m′
m
1
−
=
.
′
n
n
n · n′
Prueba. La relación es cierta para el caso de las fracciones 01 , 10 ya que 1 · 1 − 0 · 0 = 1. Observe ahora que cuando se inserta una nueva mediana (m + m′ )/(n + n′ ) entre dos fracciones
consecutivas m/n y m′ /n′ , entonces los casos que se deben chequear son:
(m + m′ )n − m(n + n′ ) = 1
y
m′ (n + n′ ) − (m + m′ )n′ = 1
y ambas ecuaciones son equivalentes a la condición original m′ n − mn′ = 1. De allí que (SB) es
invariante en cualquier conjunto SBk .
(SB4 ) Cada nueva mediana insertada en cada paso en la construcción del árbol de Stern-Brocot está en
forma reducida.
Prueba. Suponga que alguna mediana del árbol, digamos (m + m′ )/(n + n′ ), no está en forma
reducida. Esto significa que existe un k > 1 tal que
m + m′
kp
=
′
n+n
kq
donde p y q son primos relativos. Puesto que
m
m + m′
kp
<
=
,
n
n + n′
kq
se sigue de (SB3 ) que
1 = (kp) · n − m · (kq) = k · ( pn − mq)
y como k > 1, resulta que pn − mq = 1/k no es un entero, lo cual es absurdo.
(SB5 ) Si m/n,
entonces
m′′ /n′′
y
m′ /n′
son tres términos consecutivos en cualquier conjunto SBk ,
m′′
m + m′
=
.
n′′
n + n′
Prueba. Esto es así por definición.
(SB6 ) Todas las fracciones construidas en el k-ésimo paso están ordenadas de menor a mayor.
Prueba. Sigue de lo anterior.
(SB7 ) Ninguna fracción del árbol de Stern-Brocot aparece más de una vez.
Prueba. Es consecuencia de (SB6 ).
+
(SB8 ) Cada fracción en Qirre
aparece en el árbol de Stern-Brocot.
+
Prueba. Sea m/n ∈ Qirre
. Por simetría es suficiente demostrar que si m/n ≤ 1, entonces m/n ∈
SBn . Pero si m/n ≤ 1, se sigue del Corolario 1.2.16 que m/n ∈ Fn ⊆ SBn y termina la prueba.
38
Cap. 1 Preliminares
+
Esto último nos indica que existe una biyección entre Qirre
y las fracciones del árbol de Stern+
Brocot y, por lo tanto, Qirre es numerable.
Son muchas las propiedades que posee el árbol de Stern-Brocot. Queremos finalizar este
pequeño análisis con la siguiente curiosidad: si se sigue en zig-zag la rama infinita del árbol de
Stern-Brocot comenzando con la fracción 11 como se indica en el gráfico,
1
1
2
1
1
2
1
3
2
3
2
5
1
4
1
5
2
7
3
8
3
5
3
7
..
.
3
2
5
8
4
7
..
.
3
4
5
7
..
.
3
1
4
3
4
5
5
4
..
.
5
3
7
5
..
.
8
5
5
2
7
4
..
.
7
3
4
1
8
3
7
2
..
.
6
1
..
.
es decir,
1
1
2
3
5
8
13
→
→
→
→
→
→
→ ···
1
2
3
5
8
13
21
resulta que los numeradores y denominadores de esas fracciones no son otra cosa que los exquisitos e increíbles números de Fibonacci f n los cuales, como se sabe, se definen para cada n ≥ 3
como:
f n = f n −1 + f n −2 ,
f1 = 1, f2 = 1.
Por ejemplo, los 15 primeros números de Fibonacci son:
1,
1,
2,
3,
5,
8,
13,
21,
34,
55,
89,
144,
233,
377,
610, . . .
Dos hechos que son fascinantes y a la vez sorprendentes de tales números son los siguientes:
(1o ) Para cada entero n ≥ 1, f n se puede representar en la forma:
"
√ n
√ n #
1
1+ 5
1− 5
fn = √
−
,
2
2
5
√
√
donde φ = (1 + 5)(2) y φ′ = (1 − 5)/2 son los números de oro.
(2o ) ¿Qué relación existe entre los números de Fibonacci y el triángulo de Pascal? Recordemos
que una representación del triángulo de Pascal toma, por lo general, la forma siguiente:
Sec. 1.2 Conjuntos Numerables y otros más Numerosos
39
1
1
1
3
1
1
6
1
1
7
8
..
.
3
10
1
6
15
35
70
..
.
1
5
10
35
56
1
4
20
15
21
28
1
6
4
5
1
1
1
2
21
56
1
7
28
..
.
1
8
1
Si en la representación anterior desplazamos sus elementos tal cual se muestra en la siguiente gráfica y consideramos las suma de las diagonales mostradas en el mismo, se obtienen los
susodichos números de Fibonacci.
1
1
1
1
1
1
1
1
1
..
.
1
1
2
3
4
5
6
7
8
2
3
1
3
6
10
15
21
28
..
.
1
4
10
20
35
56
5
8
1
5
15
35
70
..
.
1
6
21
56
13
21
34
1
7
28
..
.
1
8
1
Pues bien, la sucesión de fracciones de Farey en zig-zag es ( f n+1 / f n+2 )∞
n =0 la cual converge al
fabuloso número de oro
√
5−1
′
−φ =
≈ 0,6180339887 . . .
2
cuando n → ∞.
La siguiente pregunta es natural: Dado cualquier número irrational α, ¿existe alguna rama infinita
del árbol de Stern-Brocot que converge a α?
(N6 ) Alg (R ), el conjunto de los números algebraicos, es numerable (Dedekind).
Denotemos por Z [ x] el conjunto de todos los polinomios con coeficientes enteros, es decir,
p ∈ Z [ x] si
p ( x ) = a0 + a1 x + a2 x 2 + · · · + a n x n
donde los coeficientes a0 , a1 , . . . , an son números enteros y no todos son ceros. Un número real
x0 se dice algebraico si es raíz de algún polinomio p ∈ Z [ x], es decir, si existe p ∈ Z [ x] tal
que p( x0 ) = 0. Por ejemplo, cualquier número racional p/q es algebraico ya que él satisface la
40
Cap. 1 Preliminares
ecuación p( x)√= qx − p = 0. También ocurre que muchos números irracionales
√ son algebraicos.
Por ejemplo, 2 es algebraico ya que el polinomio p( x) = x2 − 2 satisface p( 2) = 0.
Cualquier número real que no es algebraico se llama trascendente, es decir, un número trascendente es aquel que no satisface ninguna ecuación algebraica con coeficientes enteros. La
primera prueba de la existencia de números trascendentes fue dada por Joseph Liouville quien,
en 1844, descubrió una clase muy extensa de tales números. Por ejemplo, todos lo números de la
forma
1
1
1
1
1
1 + + 2 + 6 + 24 + · · · + k! + · · ·
n n
n
n
n
son trascendentes, donde n es cualquier número entero mayor que 1. Aunque este descubrimiento
de Liouville genera muchos números trascendentes, sigue siendo un reto difícil para un matemático demostrar que un sospechoso particular es o no trascendente. Por tal razón, cuando Charles
Hermite demostró, en 1873, que e es trascendente, los matemáticos no dejaron de asombrarse ante
la belleza y sencillez de la prueba. Nueve años más tarde del descubrimiento de Hermite, en 1882,
Ferdinand Lindemann demostró que π pertenecía al mismo clan. Una prueba de la existencia de
números trascendentes fue dada a conocer por G. Cantor sin dar ningún ejemplo concreto de uno
de ellos. Hasta el día de hoy constituye la prueba más elemental de la existencia de tales números. Un hecho curioso es el siguiente: algún tiempo antes de que Cantor demostrara que R era
no-numerable, ya él había probado la numerabilidad de Q, él le preguntó a Dedekind si podía
probar la no-numerabilidad de R. Dedekind trabajó un tiempo en ese problema pero no logró
demostrarlo. Sin embargo, Dedekind le ofreció a Cantor la demostración de que el conjuntos de
los números algebraicos es numerable.
Prueba de que Alg (R ) es numerable. La idea de la demostración es considerar, para cada n ∈ N,
el conjunto Z n [ x] de todos los polinomios en Z [ x] de grado n, esto es,
( n
)
X
j
Zn [ x] =
a j x : a0 , a1 , . . . , an ∈ Z, an 6= 0 .
j=0
Veamos que dicho conjunto es numerable. En efecto, considere la aplicación f : Z n [ x] → Z n+1
definida por
!
n
X
j
f
aj x
= a0 , a1 , . . . , a n .
j=0
Claramente f n es inyectiva. Además, como Z n+1 es numerable, existe una función biyectiva
Φ : Z n+1 → N. Definamos ahora ϕ : Z n [ x] → N por ϕ( p) = (Φ ◦ f )( p) para cualquier
p ∈ Z n [ x]. Puesto que la composición de dos funciones inyectivas es inyectiva, resulta del
Teorema 1.2.6 que Z n [ x] es numerable. Se sigue del Corolario 1.2.11 que
Z[ x] =
∞
[
Zn [ x]
n =1
es numerable. Finalmente, observe que Alg (R ) se puede escribir como sigue:
[
Alg (R ) =
Z ( p) ,
p ∈ Z[x]
donde Z ( p) = x ∈ R : p( x) = 0 . Puesto que cada polinomio p ∈ Z [ x] posee a lo sumo
un número finito raíces, resulta que Alg (R ) es numerable por ser unión numerable de conjuntos
finitos. Esto termina la prueba.
Sec. 1.2 Conjuntos Numerables y otros más Numerosos
41
1.2.2. El Teorema de Cantor y Conjuntos No-numerables
Hasta este momento hemos podido constatar la existencia de una cantidad inmensa de conjuntos infinitos numerables pero no así la existencia de conjuntos no-numerables. Por lo tanto,
la noción general de infinito sólo tendrá relevancia si logramos probar que no todos los conjuntos
infinitos son equipotentes a N, es decir, si se logra demostrar que existen conjuntos no-numerables.
En esta corta sección demostraremos, usando un poderoso resultado de Cantor, la existencia de
conjuntos no-numerables. Es importante destacar que demostrar que un cierto candidato, digamos B, es no-numerable siguiendo nuestra definición puede resultar una tarea difícil pues ello
conlleva a verificar, en primer lugar, que él es infinito y, segundo, que ninguna función f : B → N
puede ser biyectiva. Por fortuna, existen otras formas distintas e interesantes de verificar la nonumerabilidad de un conjunto: por ejemplo, uno de ellos consiste en utilizar el método de prueba
por contradicción, es decir, suponer que alguna extraña función f : B → N es biyectiva y generar
una contradicción. Una segunda opción es saber que un determinado conjunto, digamos A, es
no-numerable y entonces encontrar alguna función biyectiva f : B → A. Un tercer modo de verificar la no-numerabilidad de un conjunto es utilizando el así llamado “Método de la Diagonal de
Cantor”, el cual fue ideado por G. Cantor para demostrar que R es un conjunto no-numerable,
etc.
Recordemos que si X y Y son conjuntos no vacíos, entonces Y X consiste del conjunto de todas
las funciones f : X → Y. En particular, si Y = {0, 1}, escribiremos 2X en lugar de {0, 1}X . Un
resultado sencillo pero que es de suma importancia es el siguiente:
Teorema 1.2.17 (Cantor). Sea X un conjunto no vacío. Entonces P ( X ) y 2X son equipotentes; es
decir,
card P ( X ) = card 2X .
Prueba. La aplicación ϕ : P ( X ) → 2X definida por
ϕ( A) = χ A
para todo A ∈ P ( X ) es biyectiva. En efecto, sean A, B ∈ P ( X ) con A 6= B. Esto significa que
existe un x ∈ X tal que x ∈ A \ B, o x ∈ B \ A. Sin perder generalidad suponga que x ∈ A \ B.
Entonces x ∈ A y x 6∈ B de modo que
ϕ( A)( x) = χ A ( x) = 1
y
ϕ( B)( x) = χ B ( x) = 0
y, en consecuencia, ϕ( A) 6= ϕ( B). Esto prueba que ϕ es inyectiva. Para demostrar la sobreyectividad, tome cualquier f ∈ 2X y considere el conjunto
A = x ∈ X : f ( x) = 1 .
Es claro que ϕ( A) = f y termina la prueba.
De la misma forma en que la igualdad de dos conjuntos A y B se puede descomponer en
dos inclusiones: A ⊆ B y B ⊆ A, la noción de cardinalidad, a pesar de no haber sido definida en
forma precisa, también se puede descomponer en dos desigualdades y ser usadas para comparar
conjuntos.
Definición 1.2.18. Sean A y B conjuntos no vacíos. Definimos
card( A) ≤ card( B)
si existe una aplicación inyectiva f : A → B.
42
Cap. 1 Preliminares
Escribiremos
card( A) < card( B)
para indicar que card( A) ≤ card( B) pero card( A) 6= card( B). Observe que esto último significa
que: ninguna función inyectiva f : A → B puede ser sobreyectiva. Una manera de ilustrar estos
hechos es observando, por ejemplo, que:
( a) card( A) < card( B) si A es finito y B es infinito.
(b) ℵ0 ≤ card( X ) si X es cualquier conjunto infinito (Corolario 1.2.14), y
(c) ℵ0 < card( X ) si X es cualquier conjunto infinito no-numerable.
Otro resultado extraordinario, llamado el Teorema de Cantor por E. Zermelo pero cuya prueba
fue dada por primera vez por G. Hessenberg y que posee consecuencias profundas, establece que
no existe sobreyección entre un conjunto X y su potencia P ( X ), o dicho de otro modo: en cualquier
conjunto no vacío X siempre existen más subconjuntos que elementos.
Teorema 1.2.19 (Teorema de Cantor). Cualquier conjunto arbitrario no vacío X es equipotente a un
subconjunto propio de P ( X ), pero no es equipotente a P ( X ); es decir,
card( X ) < card(P ( X )).
Prueba. Que X no es equipotente a P ( X ) significa que: ninguna función f : X → P ( X ) puede
ser sobreyectiva. Para ver esto, suponga que f : X → P ( X ) es una función sobreyectiva. Para
cada x ∈ X, f ( x) es un subconjunto de X que puede o no contener a x. Considere entonces el
conjunto F = { x ∈ X : x 6∈ f ( x)}. Afirmamos que no existe x ∈ X tal que F = f ( x). En efecto,
como estamos asumiendo que f es sobreyectiva, existe algún x0 ∈ X para el cual F = f ( x0 ).
Observe, sin embargo, que: x0 ∈ F si, y sólo si, x0 6∈ f ( x0 ) = F. Esta contradicción establece
que f no puede ser sobreyectiva y, en consecuencia, X y P ( X ) no son equipotentes. Más aun, si
definimos g : X → P ( X ) por g( x) = { x} para todo x ∈ X, resulta que g es inyectiva, lo cual
prueba que X es equipotente a un subconjunto propio de P ( X ) y concluye la prueba.
Una consecuencia inmediata del Teorema de Cantor es que:
Corolario 1.2.20. P (N ) es no-numerable.
Prueba. Si P (N ) fuese numerable, entonces el Teorema 1.2.6 nos garantizaría la existencia de
una aplicación inyectiva de N sobre P (N ) lo que estaría en contradicción con el Teorema de
Cantor.
Otra consecuencia del Teorema de Cantor es impedir la existencia del conjunto de todos los
conjuntos. En efecto, suponga que tal conjunto existe y llamémoslo U. Por definición, todo
subconjunto de U es asimismo un elemento de U y, en consecuencia, P (U) es un subconjunto
de U, es decir,
P (U) ⊆ U
lo cual implica que card(P (U)) = card(2U ) ≤ card(U). Pero entonces, esto contradice el Teorema de Cantor el cual afirma que card(U) < card(2U ). Por esto, U no existe como conjunto.
Similarmente, el Teorema de Cantor impide la formación, como conjunto, de todos los números
cardinales, de todos los conjuntos que son equipotentes a un conjunto dado, etc.
Recordemos que cuando intentamos definir la cardinalidad de un conjunto no-numerable
tropezábamos con el hecho de que no existía un objeto que los identificase a todos, sino que
Sec. 1.2 Conjuntos Numerables y otros más Numerosos
43
existía una cantidad “infinita de infinitos” en orden creciente. Pues bien, estamos listo para mostrar
tal colección. Una de las consecuencias extraordinarias del Teorema 1.2.19 se evidencia en el
siguiente hecho:
ℵ0 < card(P (N )) < card(P (P (N ))) < · · · ,
es decir, existe una jerarquía infinita, estrictamente creciente, de conjuntos infinitos.
Teorema 1.2.21. Sean A, B y C conjuntos arbitrarios. Entonces:
( a) card( A) ≤ card( A).
(b) card( A) ≤ card( B) y card( B) ≤ card(C ) ⇒ card( A) ≤ card(C ).
(c) A ⊆ B ⇒ card( A) ≤ card( B).
Observe que el resultado anterior establece que ≤ es casi una relación de orden entre conjuntos. Que ello se comporte en realidad como una relación de orden, se debe a un extraordinario
resultado debido a Cantor, Bernstein y Schröeder.
Teorema 1.2.22 (Cantor-Bernstein-Schröeder). Sean A y B conjuntos arbitrarios y suponga que
card( A) ≤ card( B)
card( B) ≤ card( A).
y
Entonces card( A) = card( B).
Prueba. La demostración la haremos en dos pasos. Primero demostraremos que: si X, A′ y B′
son conjuntos arbitrarios con
X ⊆ B′ ⊆ A′
card( X ) = card( A′ ),
y
′
entonces card( B′ ) = card( A′). En efecto,
∞ sea f : A → X una función biyectiva y defina las
∞
sucesiones de conjuntos An n=0 y Bn n=0 del modo siguiente:
A0 = A ′
B0 = B′
y
y para cada n ∈ N0 , sean
A n +1 = f ( A n ) ,
Bn + 1 = f ( Bn ) .
(CBS)
Puesto que A0 ⊇ B0 ⊇ X, se sigue de (CBS) e inducción que An ⊇ Bn ⊇ An+1 para todo
n ∈ N0 . Considere ahora el conjunto Cn = An \ Bn para cada entero n ≥ 0 y sean
C =
∞
[
D = A′ \ C.
y
Cn
n =0
Por (CBS) y el hecho de que f es inyectiva, se tiene que f (Cn ) = Cn+1 y, por lo tanto,
f (C ) =
∞
[
Cn .
n =1
Finalmente, defina g :
A′
→
B′
por
g( x ) =
(
f ( x)
x
si x ∈ C
si x ∈ D.
44
Cap. 1 Preliminares
Puesto que g|C y g| D son funciones inyectivas y sus imágenes son conjuntos disjuntos, se deduce
que g es una función inyectiva de A′ sobre f (C ) ∪ D = B′ .
El segundo paso es suponer que card( A) ≤ card( B) y card( B) ≤ card( A). Esto significa que
existen funciones inyectivas f : A → B y g : B → A y, por consiguiente, la función g ◦ f : A → A
es inyectiva y card( A) = card( g( f ( A))). Más aun, como g( f ( A)) ⊆ g( B) ⊆ A, se sigue de la
primera parte que card( g( B)) = card( A). Por otro lado, puesto que card( B) = card( g( B)) se
concluye entonces que card( A) = card( B) y termina la prueba.
Otra manera de formular el Teorema de Cantor-Bernstein-Schröeder es del modo siguiente:
Si f : A → B y g : B → A son funciones inyectivas, entonces existe una biyección de A en B.
1.2.3. Ejemplos de Conjuntos No-numerables
En lo que sigue mostraremos algunos ejemplos concretos de conjuntos que son no-numerables.
En el transcurso de estas notas aparecerán otros ejemplos interesantes de tales conjuntos. Comenzaremos demostrando un hecho que es fundamental en matemáticas:
Teorema 1.2.23 (Cantor). R es no-numerable.
Prueba. Para demostrar la no-numerabilidad de R vamos a utilizar el Método de la Diagonal
de Cantor. Puesto que cualquier subconjunto infinito de un conjunto numerable es numerable,
si podemos encontrar un subconjunto de R que es no-numerable, entonces R también será nonumerable. El subconjunto de R que queremos analizar es el intervalo (0, 1). Suponga entonces
que (0, 1) es numerable y sea { x1 , x2 , x3 , . . .} una lista de todos los elementos de (0, 1). Escriba
cada elemento xn ∈ (0, 1) usando su representación decimal, esto es,
xn = 0.xn1 xn2 xn3 . . .
donde cada xni ∈ {0, 1, 2, . . . , 9} para todo n y todo i en N. Antes de continuar, observe que la
representación decimal de cada número en (0, 1) no es única. Por ejemplo,
0.539999 . . .
y
0.540000 . . .
representan el mismo número. Por esta razón, convenimos en no usar la version que termina en
9’s. Disponga ahora de todos los elementos en (0, 1) en el siguiente arreglo:
x1 = 0.x11 x12 x13 . . . x1n . . .
x2 = 0.x21 x22 x23 . . . x2n . . .
x3 = 0.x31 x32 x33 . . . x3n . . .
..
..
.
.
xn = 0.xn1 xn2 xn3 . . . xnn . . .
..
..
.
.
Ahora viene lo realmente genial: vamos a construir, usando los elementos de la “diagonal” en
el arreglo anterior, un elemento b ∈ (0, 1) que no aparece en la lista { x1 , x2 , x3 , . . . }, es decir,
distinto de todos los xn . En efecto, si para cada n ∈ N, definimos
(
xnn − 1
si xnn 6= 0
bn =
1
si xnn = 0,
Sec. 1.2 Conjuntos Numerables y otros más Numerosos
45
entonces b = 0.b1 b2 b3 . . . es claramente un número en (0, 1) que difiere de cada xn precisamente
en la cifra decimal xnn y, por lo tanto, b no es igual a ningún xn . Esto, por supuesto, es contrario
a la suposición de que la sucesión x1 , x2 , x3 , . . . comprendía a todos los números reales en (0, 1).
Esta contradicción establece que (0, 1) no es numerable y, en consecuencia, tampoco lo es R. Más adelante veremos otros modos de demostrar que R es no-numerable. La cardinalidad
de R será denotada por
card(R ) = c.
Otros Ejemplos.
(NN0 ) Cualquier intervalo no-degenerado I ⊆ R es no-numerable.
(NN1 ) I = R \ Q, el conjunto de los números irracionales, es no-numerable.
(NN2 ) R n es no-numerable para cada n ∈ N. Un modo fácil de ver esto es pensar a R como canónicamente sumergido en R n , es decir, identificando a R con el subespacio R × {0} × · · · × {0}
de R n donde a cada punto x ∈ R se le asigna el vector ( x, 0, . . . , 0) ∈ R n . De este modo podemos suponer que R ⊆ R n para cada n ≥ 1. Como R es no-numerable, se sigue entonces de
(Nu3 ) que R n es no-numerable. Este ejemplo fue descubierto por Cantor en 1877 cuando n = 2,
quien en una carta dirigida a Dedekind le decía: “Lo veo, pero no puedo creerlo”, aparentemente
asombrado por el hecho de que R2 fuese tan numeroso como R.
(NN3 ) NN , la familia de todos los subconjuntos infinitos de N, es no-numerable. En efecto, si
escribimos N ∞ = NN , resulta que
P (N ) = N < ∞ ∪ N ∞ ,
donde N < ∞ = Pfin (N ). Como N < ∞ es numerable, Corolario 1.2.11, y P (N ) es no-numerable,
se concluye que NN es no-numerable.
Otra notación frecuentemente usada para el conjunto NN es N ω .
(NN4 ) Tras (R ), el conjunto de todos los números trascendentes, es no-numerable. Esto es consecuencia de los siguientes hechos:
R = Alg (R ) ∪ Tras (R ),
la no-numerabilidad de R y la numerabilidad de Alg (R ). En efecto, si Tras (R ) fuese numerable, entonces Alg (R ) ∪ Tras (R ) también lo sería y, en consecuencia, R sería numerable. Esta
contradicción establece que Tras (R ) es no-numerable.
Q
N
(NN5 ) ∞
n =1 {0, 1} = 2 , el conjunto de todas las sucesiones de 0’s y 1’s, es no-numerable.
La demostración es muy similar a la ofrecida por Cantor para probar que R es no-numerable
(usando el Método de la Diagonal) y, en consecuencia, se omite.
(NN6 ) card R [0,1] es no-numerable. Más aun, card R [0,1] > c. En efecto, en primer lugar,
observe que el conjunto C de todas las funciones constantes
definidas sobre [0, 1] posee cardi
[
0,1
]
[
0,1
]
nalidad c y como C ⊆ R
resulta que card R
≥ c. Esto prueba la no-numerabilidad
[
0,1
]
de card R
. Para verificar la segunda afirmación, suponga que card R [0,1] = c y sea
Φ : [0, 1] → R [0,1] una biyección. Nótese que, para cada x ∈ [0, 1], Φ( x) ∈ R [0,1] de modo
que, si hacemos Φ( x) = Φx , entonces R [0,1] = {Φx : x ∈ [0, 1]}. Identifique cada Φx con el conjunto de sus imágenes, esto es, Φx = {Φx (y) ∈ R : y ∈ [0, 1]}. Afirmamos que existe una función
46
Cap. 1 Preliminares
g ∈ R [0,1] tal que Φx 6= g para todo x ∈ [0, 1]. En efecto, considere la función g : [0, 1] → R
definida por
g( x) = Φx ( x) + 1 para todo x ∈ [0, 1] .
Esta función g difiere de cualquier Φx ∈ R [0,1] al menos en el punto y = x. Por esto, Φ no
puede ser biyectiva y entonces card R [0,1] > c.
1.2.4. Un Juego y la No-numerabilidad de R.
El siguiente juego es otra forma elegante de presentar la no-numerabilidad de R. Dos jugadores, denotados por α y β, juegan el siguiente juego infinito en R. Se fija un subconjunto
X ⊆ [0, 1] y el juego lo comienza el jugador α eligiendo un número real a1 ∈ (0, 1). Enseguida
β responde seleccionando un número b1 ∈ ( a1 , 1). El turno ahora es de α quien escoge un
número a2 ∈ ( a1 , b1 ). La respuesta de β consiste en elegir un punto b2 ∈ ( a2 , b1 ) y se continua
ad infinitum. En consecuencia, se obtienen dos sucesiones, la del jugador α, ( an )∞
n =1 , que es
estrictamente creciente, mientras que la de β, (bn )∞
,
es
estrictamente
decreciente
relacionadas
n =1
por las siguientes desigualdades:
a n − 1 < a n < bn − 1
y
a n < bn < bn − 1
para todo n ≥ 1, donde hemos puesto a0 = 0 y b0 = 1.
|
0
|
a1
| | |
a2 a3 a4 · · ·
| | |
b4 b3 b2
|
b1
|
1
Puesto que toda sucesión monótona acotada converge, véase el Teorema 2.1.23, página 93, resulta
que lı́mn→∞ an = a ∈ (0, 1). Se declara ganador al jugador α si a ∈ X, en caso contrario el
jugador β es el ganador.
Lema 1.2.24. Sea X un subconjunto no vacío de R. Si X es numerable, entonces β posee una estrategia ganadora.
Prueba. La conclusión es inmediata si X = ∅. Suponga entonces que X es infinito numerable
y sea { x1 , x2 , . . . } una enumeración de X. Considere la siguiente estrategia del jugador β: en el
n-ésimo movimiento, β selecciona bn = xn si tal movimiento es legal, en caso contrario él elige como bn
cualquier número real permitido según las reglas establecidas. De esto resulta que, por cada n ≥ 1, se
tiene que xn ≤ an o xn ≥ bn . Puesto que an < a < bn para todo n ≥ 1, concluimos que a 6∈ X.
Esto, por supuesto, significa que β siempre gana con esa estrategia.
Si tomamos X = [0, 1] en lema anterior, entonces claramente α gana el juego sin importar
como juegue su oponente. De esto se obtiene que:
Corolario 1.2.25. El intervalo [0, 1] es no-numerable. En particular, R es no-numerable.
Nota Adicional 1.2.1 En el Corolario 1.2.11 ( a), vimos que la unión numerable de conjuntos
numerables sigue siendo numerable. ¿Qué ocurre si, en lugar de considerar una unión
numerable de conjuntos numerables, suponemos una colección no-numerable de conjuntos
numerables? ¿Cómo es su unión? ¿Será dicha unión no-numerable? El siguiente ejemplo
nos muestra que la respuesta puede, en general, ser falsa.
Sec. 1.3 El Axioma de Elección y sus Aliados
47
Existe una colección no-numerable de conjuntos, digamos ( Aα )α∈R , tal que
(1) cada Aα es infinito numerable,
(2) Aα A β si α < β y
[
( 3)
Aα es numerable.
α ∈R
En efecto, para cada α ∈ R, considere el conjunto Aα = q ∈ Q : q ≤ α . Puesto
que Q es numerable, resulta que cada Aα es infinito numerable y, por supuesto, su unión
S
α∈R A α = Q es numerable. Además, si α < β, entonces para cualquier q ∈ A α , se tiene
que q ≤ α < β y, por consiguiente, q ∈ A β . Esto prueba que Aα ⊆ A β . Más aun, por
la densidad de lo números racionales, existe q0 ∈ Q tal que α < q0 < β, de modo que
q0 ∈ A β , pero q0 6∈ Aα .
Otro hecho interesante de la no-numerabilidad es que ella puede ser utilizada, en combinación con el Teorema del Valor Medio, para dar una prueba del siguiente resultado de
Volterra.
Teorema de Volterra. No existe ninguna función continua f : R → R tal que
f (Q ) ⊆ I
y
f (I ) ⊆ Q.
(∗)
Prueba. Suponga lo contrario, es decir, que cualquier función continua f : R → R satisface
(∗). Fijemos una tal f . Por definición se tiene que f toma al menos dos valores, uno
racional y otro irracional. Sean entonces p ∈ Q y s ∈ I tales que f ( p) = α ∈ I y
f (s) = β ∈ Q. Asuma que α < β. Puesto que f es continua, la Propiedad del Valor
Intermedio nos dice que f asume todos los valores en el intervalo cerrado [α, β], es decir,
[α, β] ⊆ f (R ). Por otro lado, como f (I ) ⊆ Q, resulta que f (I ) es numerable y, por
supuesto, f (Q ) también lo es. Por consiguiente, f (R ) es numerable lo cual es imposible
ya que [α, β] es no-numerable y [α, β] ⊆ f (R ).
1.3. El Axioma de Elección y sus Aliados
1.3.1. El Axioma de Elección
Suponga que A = { Aα : α ∈ J } es una familia arbitraria de conjuntos cada uno de los cuales
es no vacío. ¿Existe algún procedimiento que permita construir un nuevo conjunto eligiendo uno,
y sólo un punto, en cada uno de los conjuntos Aα de A? El Axioma de Elección, o Axioma
de Zermelo como también se le conoce, es un axioma de la teoría de conjuntos que postula la
existencia de un tal conjunto pero sin dar ninguna indicación de cómo se hace tal elección.
Axioma de Elección (AC). Dada cualquier colección arbitraria ( Xα )α∈ J de conjuntos no vacíos, siempre
se puede elegir, de cada uno de los conjuntos Xα , uno, y sólo un miembro xα ∈ Xα para construir un
nuevo conjunto X con tales elementos.
El Axioma de Elección fue propuesto por primera vez por Ernst Zermelo en 1904 quien lo
utilizó precisamente para demostrar que todo conjunto puede ser bien-ordenado. De inmediato provocó reacciones: resultó, para algunos matemáticos, un plato un tanto difícil de digerir y, por
48
Cap. 1 Preliminares
supuesto, generó mucha controversia. La no existencia de un “procedimiento” o “descripción explícita” para elegir los puntos de cada uno de los conjuntos en una colección arbitraria de conjuntos
es lo que produce la controversia. Como veremos un poco más adelante, existen colecciones de
conjuntos que son increíblemente enormes y, por lo tanto, no existe, en términos generales, un
procedimiento para escoger un elemento en cada uno de los conjuntos de esas colecciones. A
pesar de la ausencia de un tal mecanismo de selección, existen situaciones donde es posible hacerlo
sin requerir el Axioma de Elección. En efecto, si nuestra familia de conjuntos consta sólo de un
número finito de conjuntos, entonces la elección de un punto en cada uno de los conjuntos de
la familia se puede llevar a cabo sin invocar el Axioma de Elección. También, si ( Aα )α∈ J es una
familia arbitraria de subconjuntos de N, entonces el Principio del Buen-Orden puede ser invocado para hacer tal elección: de cada conjunto Aα seleccione su primer elemento. Por supuesto, este
caso tampoco requiere el uso del Axioma de Elección.
El Axioma de Elección siempre fue, desde sus inicios, un axioma polémico. Paul Bernays
(1888-1977) y Adolf Abraham Fraenkel (1891-1965) afirman de él lo siguiente:
El Axioma de Elección (junto con la Hipótesis del Continuo) es probablemente el más
interesante y más discutido axioma en matemáticas después del Axioma de las Paralelas
de Euclides.
En 1938 esa controversia fue profundamente iluminada por el lógico-matemático Kurt Gödel
quien demostró que si la Teoría de Conjuntos construida con el sistema ZF es consistente, entonces
también lo es la Teoría de Conjuntos construida con el sistema ZFC. Posteriormente, en 1963, Paul
Cohen cierra el ciclo al demostrar que si al sistema ZF se le añade la negación del Axioma de
Elección, la nueva Teoría de Conjuntos que se edifica con ella también es consistente. Dicho de
otro modo, el Axioma de Elección es independiente de los axiomas de Zermelo-Fraenkel, lo que
permite concluir que ni la verdad, ni la falsedad de dicho axioma pueden ser demostrados en
ZF. Su aceptación, en términos generales, se sustenta sobre el hecho de que dicho axioma es
tremendamente útil. Muchos resultados importantes y fundamentales en Análisis Real, Análisis
Funcional, Álgebra, Topología, etc. sólo se pueden demostrar si se acepta, sin limitaciones, el
Axioma de Elección. Una muestra de ello se puede ver, por ejemplo, en el libro de H. Herrlich:
Axiom of Choice [71].
Es importante destacar que el Axioma de Elección lo que realmente afirma es simplemente
la existencia de una función de lección y, en consecuencia, se puede formular ligeramente diferente,
aunque equivalente, del modo siguiente:
Axioma de Elección (AC). Si ( Xα )α∈ J es una familia de conjuntos tal que Xα es no vacío para todo
α ∈ J, entonces el producto cartesiano Πα∈ J Xα es no vacío, es decir, existe al menos una función de elección
para la familia ( Xα )α∈ J .
En el siguiente resultado se muestra un “procedimiento” explícito para construir una función
de elección de una familia de conjuntos sin usar el Axioma de Elección.
Teorema 1.3.1. Sea X un conjunto no vacío y suponga que f : N → X es una función sobreyectiva.
Entonces existe una función inyectiva g : X → N tal que f ( g( x)) = x para todo x ∈ X.
Prueba. El requerimiento de que f ( g( x)) = x significa que g( x) debe ser un elemento del
conjunto f −1 ({ x}) = {n ∈ N : f (n) = x}. Ahora bien, la sobreyectividad de f nos garantiza
que el conjunto f −1 ({ x}) es no-vacío para cada x ∈ X. Defina g : X → N demandando que
g( x) = mı́n f −1 ({ x})
Sec. 1.3 El Axioma de Elección y sus Aliados
49
para cada x ∈ X. Puesto que el mínimo de cada subconjunto no-vacío de N existe (Principio
del Buen-Orden) y es único, resulta que g está bien definida, es claramente inyectiva y se cumple
que f ( g( x)) = x para cualquier x ∈ X.
¿Qué ocurre si, en el teorema anterior, consideramos N = X y una función sobreyectiva
arbitraria f : X → X? ¿Se puede, en este caso, determinar una función inyectiva g : X → X tal
que f ( g( x)) = x para todo x ∈ X? La respuesta es que en presencia del Axioma de Elección una
tal g siempre existe. En efecto, como antes, la sobreyectividad de f nos muestra que el S
conjunto
−
1
−
1
f ({ x}) 6= ∅ para cada x ∈ X. Sea A x = f ({ x}) para x ∈ X y observe que X = x ∈ X A x .
El Axioma de Elección nos dice que podemos elegir, de cada conjunto A x , un único punto ax .
La función g : X → X definida g( x) = ax para cada x ∈ X posee las propiedades requeridas.
Otro resultado de cierta utilidad que también es consecuencia del Axioma de Elección es el
siguiente.
Teorema 1.3.2. Sean X un conjunto arbitrario no vacío y sea f : X → X una función. Entonces, para
cada conjunto A ⊆ X se cumple que
card( f ( A)) ≤ card( A).
Prueba. Para cada y ∈ f ( A), sea Xy = f −1 ({y}). Puesto que Xy 6= ∅ para cada elemento
y ∈ f ( A) y como Xy1 ∩ Xy2 = ∅Qsi y1 6= y2 , el Axioma de Elección nos garantiza la existencia
de una función de elección g ∈ y∈ f ( A) Xy . Veamos que g es inyectiva. En efecto, en primer
lugar, observe que g : f ( A) → A. Sean y1 , y2 ∈ f ( A) con y1 6= y2 . Entonces g(y1 ) ∈ Xy1 ,
g(y2 ) ∈ Xy2 y como ambos conjuntos son disjuntos, resulta que g(y1 ) 6= g(y2 ). Esto prueba que
g es inyectiva y, por lo tanto, card( f ( A)) ≤ card( A).
Nota Adicional 1.3.2 Existen formas más débiles del Axioma de Elección que han sido propuestos para excluir ciertos resultados que pueden ser catalogados como extraños tal como la
Paradoja de Banach-Tarski. Entre esas forman están, por ejemplo, el Axioma de Elección
Numerable, ACω , el cual establece que:
∞
Axioma Q
de Elección Numerable (ACω ). Si Xn n=1 es una sucesión de conjuntos no vacíos,
entonces ∞
n =1 Xn es no vacío.
Otro axioma es el Axioma de Elección Múltiple, DC, que reza lo siguiente:
Axioma de Elección Múltiple (DC). Sea R una relación binaria sobre un conjunto no vacío X
con la propiedad de que para cada x ∈ X exsite un y ∈ X de modo que ( x, y) ∈ R. Entonces existe
una sucesión ( xn )∞
n =0 en X tal que ( xn , xn +1 ) ∈ R para todo n = 0, 1, 2, . . .
Es fácil establecer que AC ⇒ DC ⇒ ACω y que ninguna de las implicaciones opuestas son
válidas.
1.3.2. El Lema de Zorn
Entre las numerosas y variadas formas equivalentes de pensar el Axioma de Elección se encuentra el así llamado Lema de Zorn, un resultado formulado por Max Zorn (1906-1993) en 1935
y que resulta ser extremadamente útil en varias ramas del quehacer matemático. Por ejemplo, el
Lema de Zorn es fundamental para demostrar resultados importantes tales como: el Teorema de
50
Cap. 1 Preliminares
Hahn-Banach, el Teorema de Krein-Milman, el Teorema del Ultrafiltro, la prueba de la existencia
de una base de Hamel en cualquier espacio vectorial no trivial, etc.
Recordemos que una relación binaria sobre un conjunto X no es otra cosa que cualquier
subconjunto R de X × X.
Definición 1.3.3. Una relación binaria R sobre un conjunto X se dice que es un orden parcial si ella es
( a) reflexiva: ( x, x) ∈ R para todo x ∈ X,
(b) antisimétrica: si ( x, y) y (y, x) están en R, entonces x = y,
(c) transitiva: si ( x, y) y (y, z) están en R, entonces ( x, z) ∈ R.
En lugar de ( x, y) ∈ R también se acostumbra a escribir xRy. En lo que sigue escribiremos,
en lugar de R, el símbolo para denotar un orden parcial sobre X. En este caso, la expresión
( x, y) ∈ R se escribe como x y. Un conjunto X equipado con un orden parcial es llamado un conjunto parcialmente ordenado y denotado por ( X, ). Dos elementos x, y en un
conjunto parcialmente ordenado se dicen que son comparables si x y o y x. Un conjunto
parcialmente ordenado en el cual cualquier par de elementos son comparables es llamado un
conjunto totalmente (o linealmente) ordenado y a dicho orden se le denomina un orden lineal o
total. Una cadena en un conjunto parcialmente ordenado es un subconjunto que está totalmente
ordenado. En un conjunto parcialmente ordenado ( X, ) la relación x ≺ y significa que x y
pero x 6= y. Con frecuencia escribiremos y x (respectivamente, y ≻ x) como sinónimo de
x y (respectivamente, x ≺ y).
Sea ( X, ) un conjunto parcialmente ordenado y sea A ⊆ X. Un elemento x ∈ X es una
cota superior de A si a x para todo a ∈ A. Si x0 es una cota superior de A y si cualquier
otra cota superior x de A satisface x0 x, entonces se dice que x0 es el supremo de A. En este
caso escribiremos x0 = sup A. Si, además, x0 ∈ A, entonces se dice que x0 es el máximo o
el elemento más grande de A. Por otro lado, un elemento x0 ∈ X se dice que es un elemento
maximal en X si no existe y ∈ X para el cual x0 ≺ y; es decir, si existe un elemento x ∈ X que
satisface x0 x, entonces x = x0 .
Observe que un elemento maximal no tiene porque ser, en el orden dado, el más grande de
todos. Por ejemplo, sea X = { x ∈ R2 : k x k2 ≤ 1}, donde k · k2 es la norma euclidiana:
q
x12 + x22 para cada x = ( x1 , x2 ) ∈ R2 .
k x k2 =
Sobre X defina el siguiente orden parcial : si x, y ∈ X, x y si, y sólo si, x ∈ Iy , donde Iy es el
segmento radial que va desde el origen al punto y.
•
o
x •y
•
Es claro que cualquier par de vectores x, y ∈ X no son comparables si ellos están sobre segmentos
radiales distintos. De esto se sigue que cualquier vector v ∈ { x ∈ R2 : k x k2 = 1} es maximal
pero no es un máximo.
Sec. 1.3 El Axioma de Elección y sus Aliados
51
Las nociones de ínfimo, mínimo y minimal se definen de modo enteramente similar. La
demostración del próximo resultado se puede ver, por ejemplo, en [71].
Lema 1.3.4 (Lema de Zorn). Sea ( X, ) un conjunto parcialmente ordenado. Si cualquier cadena en
X posee una cota superior, entonces X posee un elemento maximal.
Con mucha frecuencia el Lema de Zorn se utiliza cuando F es una familia de subconjuntos de
un conjunto dado X ordenado
por la relación de inclusión ⊆ con
S
S la propiedad de que cualquier
cadena C ⊆ F, su unión C, también esté en F. En este caso, C es una cota superior para C
con respecto a ⊆. En este caso particular, el Lema de Zorn se expresa del modo siguiente:
Corolario 1.3.5 (Principio Maximal de Hausdorff). Sea F una familia de subconjuntos no vacíos de
un conjunto no vacío X. Suponga que los elementos de F están
S ordenados por la relación de inclusión ⊆
y que para cualquier cadena C ⊆ F, se cumple que su unión C también está en F. Entonces F posee
un elemento maximal.
Una de las aplicaciones clásicas del Lema de Zorn es la demostración de la existencia de una
base de Hamel en cualquier espacio vectorial no trivial. Recordemos que si X es un espacio
vectorial sobre un cuerpo F, entonces cualquier expresión de la forma a1 x1 + · · · + an xn , donde
x j ∈ X y a j ∈ F para todo j = 1, . . . , n es llamada un combinación lineal de los elementos
x1 , . . . , xn . Un conjunto de vectores, digamos { x1 , . . . , xn }, se dicen que son linealmente dependientes si existen escalares no todos nulos a1 , . . . , an en F tal que a1 x1 + · · · + an xn = 0. En
caso contrario se dice que los vectores { x1 , . . . , xn } son linealmente independientes, es decir, si
la única solución de la ecuación a1 x1 + · · · + an xn = 0 es la nula, esto es, a1 = · · · = an = 0. De
modo más general, diremos que un subconjunto no vacío B de X es linealmente independiente
si cualquier subconjunto no vacío y finito de B es linealmente independiente. Se dice también
que B genera a X si cualquier vector en X es combinación lineal de algún subconjunto finito
de B. En este caso, escribiremos [B] = X.
Definición 1.3.6. Sea X un espacio vectorial no trivial sobre un cuerpo F. Un subconjunto no vacío
B de X es un base de Hamel de X si B es linealmente independiente y genera a X.
Observe que si B es una base de Hamel de X, entonces el vector 0 6∈ B.
Teorema 1.3.7 (Base de Hamel). Si X es un espacio vectorial no trivial sobre un cuerpo F, entonces
X posee una base de Hamel.
Prueba. Considere la familia
F =
F ⊆ X : F es linealmente independiente .
Puesto que X 6= {0}, cualquier conjunto F = {a}, con a 6= 0, es linealmente independiente.
Luego, F 6= ∅. Definamos el siguiente orden parcial sobre F: si F, G ∈ F, declaramos que
F G
si, y sólo si
F ⊆ G.
( 1)
S
Suponga ahora que C es una cadena arbitraria en F y sea F0 = C. Veamos que F0 ∈ F. En
efecto, sea A un subconjunto finito de F0 , digamos A = { x1 , . . . , xn }. Entonces existen conjuntos
C1 , . . . , Cn en C tales que xi ∈ Ci para i = 1, . . . , n, y como C es una cadena, existe un i0 en
{1, . . . , n} tal que Ci ⊆ Ci0 para i = 1, . . . , n. Esto prueba que A = { x1 , . . . , xn } ⊆ Ci0 y como
52
Cap. 1 Preliminares
Ci0 es linealmente independiente, se sigue que A también es linealmente independiente y, por lo
tanto, F0 ∈ F. Un llamado al Lema de Zorn (o al Principio Maximal de Hausdorff) nos revela
que F posee un elemento maximal, digamos B ∈ F. Queda por demostrar que B genera a X.
En efecto, suponga por un momento que B no genera a X. Esto significa que algún x0 ∈ X no
se puede representar como una combinación lineal de elementos de B. Si ahora definimos B0 =
{ x0 } ∪ B, resulta que hemos encontrado un nuevo conjunto que es linealmente independiente y,
además, contiene propiamente a B, violando la maximalidad de B. Esto termina la prueba. Fijemos un conjunto linealmente independiente F ⊆ X, donde X un espacio vectorial no
trivial sobre F. Un argumento enteramente similar al resultado anterior, pero ahora trabajando
con la familia
F F = L ⊆ X : L es linealmente independiente y F ⊆ L ,
conduce a la existencia de una base de Hamel B con F ⊆ B.
Corolario 1.3.8. Sea X un espacio vectorial no trivial sobre un cuerpo F. Si F ⊆ X es linealmente
independiente, entonces existe una base de Hamel B en X tal que F ⊆ B.
Prueba. Considere, como en la prueba del resultado anterior, la familia
FF =
L ⊆ X : L es linealmente independiente y F ⊆ L .
Observe que F F 6= ∅ ya que F ∈ F F . El mismo argumento dado en la prueba del Teorema 1.3.7
muestra que cualquier cadena C en F F , en el orden dado por (1), posee una cota superior. Por
el Lema de Zorn existe un elemento maximal en F F , es decir, un conjunto linealmente independiente en X, digamos B, el caul contiene a F y es maximal con respecto al orden establecido en
F. Falta por demostrar que B genera a X, sin embargo, el mismo procedimiento utilizado en la
prueba del resultado anterior nos conduce a que B genera a X y termina la prueba.
Finalizamos esta sección con otro resultado útil sobre la existencia de bases de Hamel que usa
de nuevo el Lema de Zorn.
Corolario 1.3.9. Sea X un espacio vectorial no trivial sobre un cuerpo F. Si F ⊆ X genera a X,
entonces existe una base de Hamel B en X tal que B ⊆ F.
Prueba. Sea
S =
G ⊆ X : G es linealmente independiente y G ⊆ F .
Puesto que F genera a X, resulta que F 6= {0}. Seleccionando cualquier x ∈ F con x 6= 0 se
tiene que { x} ∈ S lo cual prueba que S es no vacío. Usando de nuevo el orden dado por (1)
en S, resulta que cada cadena en S posee una cota superior, por lo que una nueva aplicación
del Lema de Zorn nos garantiza la existencia de un elemento maximal B en S. Por supuesto,
B ⊆ F y como B es linealmente independiente, entonces un argumento enteramente similar a la
demostración del resultado anterior conduce a que B genera a X y termina la prueba.
Sec. 1.3 El Axioma de Elección y sus Aliados
53
1.3.3. Principio del Buen-Orden
Entre los conjuntos infinitos, el conjunto de los números naturales, con su orden natural,
(N, ≤) es un conjunto que disfruta de la siguiente propiedad, conocida como el Principio del
Buen-Orden: cualquier subconjunto no vacío de N contiene un primer elemento, es decir, el elemento
más pequeño (o mínimo) del subconjunto. Si pudiéramos extender dicho principio a cualquier
conjunto no-numerable para algún tipo de orden, abrigaríamos la esperanza de poder trabajar
con cualquier conjunto con tal orden del mismo modo conque trabajamos con N y, por supuesto,
eso nos conduciría a extender nuestra manera tradicional de contar más allá de los naturales
y, también, dispondríamos de una extensión del proceso de inducción matemática en cualquier
conjunto. Por tales motivos, el principio del buen-orden es una propiedad que pudiéramos pensar
como altamente deseada. Éste principio fue introducido por G. Cantor para desarrollar algunos de
sus resultados sobre la teoría de los subconjuntos infinitos de R.
Sea ( X, ) un conjunto parcialmente ordenado y suponga que A es un subconjunto no vacío
de X. Recordemos que un elemento a0 ∈ A se dice que es el primer elemento, o el elemento
mínimo o más pequeño en A, si a0 a para todo a ∈ A. El primer elemento de un conjunto
A, si existe, es único.
Definición 1.3.10. Sea ( X, ) un conjunto parcialmente ordenado. Diremos que es un buen-orden
en (o sobre) X, o que ( X, ) es un conjunto bien-ordenado, si cualquier subconjunto no vacío A de X
posee un primer elemento.
De la definición anterior se pueden derivar al menos tres consecuencias importantes:
( a) Todo buen-orden sobre un conjunto no vacío X automáticamente convierte a dicho conjunto en
un conjunto totalmente ordenado. En efecto, si x, y ∈ X, entonces el conjunto A = { x, y} posee,
por ser un buen-orden sobre X, un primer elemento, es decir, o bien x y, o bien y x.
Por esta razón, siempre supondremos que el orden en un conjunto bien-ordenado es total.
(b) Si ( X, ) es un conjunto infinito bien-ordenado, entonces sus elementos se pueden etiquetar en
orden creciente. En efecto, sea x0 es el primer elemento de X. Como X es infinito, X \ { x0 } es
no vacío. Sea x1 el primer elemento de X \ { x0 } y observe que x0 ≺ x1 . En general, si para cada
n ∈ N, xn es el primer elemento de X \ { x0 , . . . , xn−1 }, entonces
y continúe.
x0 ≺ x1 ≺ x2 ≺ · · · ≺ x n
(c) En conjuntos bien-ordenados no existen sucesiones estrictamente decrecientes. Para ver esto,
sea ( X, ) un conjunto bien-ordenado y suponga que existe una sucesión ( xn )∞
n =0 en X tal que
x0 ≻ x1 ≻ x2 ≻ · · · . Entonces el subconjunto no vacío A = { x0 , x1 , x2 , . . .} de X no tendría
primer elemento lo cual daría lugar a una contradicción.
El orden lexicográfico es un ejemplo de un buen-orden en el producto cartesiano de dos
conjuntos bien-ordenados. Recordemos su definición.
Definición 1.3.11 (El Orden Lexicográfico). Sean ( A, 4 A ) y ( B, 4B ) dos conjuntos parcialmente ordenados. El orden lexicográfico, también conocido como el orden del diccionario, es una relación de
orden definida sobre el producto cartesiano A × B del modo siguiente: para todo ( a, b), ( a′ , b′ ) ∈ A × B,

 a 4 A a′ , o
′ ′
( a, b) ( a , b ) ⇔
 a = a′ ∧ b 4 B b′
54
Cap. 1 Preliminares
Nótese que la regla que define a es la misma regla que se utiliza para ordenar las palabras
en cualquier diccionario. De allí su nombre.
Ejemplo 1.3.1. Sean ( A, 4 A ) y ( B, 4B ) conjuntos bien-ordenados. Si el producto cartesiano A × B está
provisto del orden lexicográfico , entonces ( A × B, ) es un conjunto bien-ordenado.
Prueba. Sea X un subconjunto no vacío de A × B. Observe que
X1 = a ∈ A : ( a, b) ∈ X
es un subconjunto no vacío de A y, en consecuencia, como ( A, 4 A ) está bien-ordenado él posee
un primer elemento, llamémoslo a0 . De modo similar, el conjunto
X2 = b ∈ B : ( a 0 , b ) ∈ X
posee, en B, un primer elemento, digamos b0 . Resulta claro, por la definición del orden lexicográfico, que ( a0 , b0 ) es el primer elemento de X y, por lo tanto, A × B con el orden lexicográfico
es un conjunto bien-ordenado.
Por ejemplo, el orden lexicográfico en N × N viene dado por:
(0, 0)
< (1, 0)
< (2, 0)
..
<
.
<
<
<
..
.
(0, 1)
(1, 1)
(2, 1)
..
.
<
<
<
..
.
(0, 2)
(1, 2)
(2, 2)
..
.
<
<
<
..
.
(0, 3)
(1, 3)
(2, 3)
..
.
<
<
<
..
.
···
···
···
···
En el siguiente resultado se muestra que cualquier conjunto admite un buen-orden. Este resultado, al que llamaremos Principio del Buen-Orden, fue formulado por G. Cantor pero demostrado por E. Zermelo en 1904 haciendo uso del Axioma de Elección. La prueba que se muestra a
continuación se basa en una de las formas equivalentes de dicho axioma: el Lema de Zorn.
Teorema 1.3.12 (Principio del Buen-Orden). Si X es cualquier conjunto infinito, entonces X puede
ser bien-ordenado.
Prueba. Sea X un conjunto infinito y considere la familia
n
o
F = ( A, 4 A ) : A ⊆ X y 4 A es un buen-orden sobre A .
Puesto que cualquier conjunto finito está bien-ordenado por cualquier orden lineal, resulta que
F 6= ∅. Sobre F se define el orden parcial - declarando que: ( A, 4 A ) - ( B, 4B ) si, y sólo si,
(1) A ⊆ B,
(2) 4 A y 4B coinciden sobre A y,
(3) si x ∈ B \ A, entonces a 4B x para todo a ∈ A.
S
Sea ahora C una cadena en F y definamos C = { A : ( A, 4 A ) ∈ C}. Sobre C conviene definir el
siguiente orden: x 4C y si, y sólo, x 4 A y para algún conjunto ( A, 4 A ) ∈ C tal que x, y ∈ A.
Observe que un tal conjunto A siempre existe. En efecto, sean x, y ∈ C. Entonces x ∈ A′ ,
y ∈ A′′ para ciertos A′ , A′′ ∈ C. Como C es una cadena, entonces A′ ⊆ A′′ o A′′ ⊆ A′ . Sea A
Sec. 1.3 El Axioma de Elección y sus Aliados
55
el conjunto de C que contiene al otro. Entonces x, y ∈ A y, por lo tanto, x 4 A y. Claramente
4C está bien definido y constituye un buen-orden sobre C. Por esto, (C, 4C ) ∈ F y es claro
que (C, 4C ) es una cota superior para C. Se sigue del Lema de Zorn que el conjunto F posee
un elemento maximal, digamos ( A0 , 4). Afirmamos que A0 = X. En efecto, suponga por un
momento que A0 6= X y sea x cualquier elemento en X \ A0 . Ordene el conjunto B0 = A0 ∪ { x}
con el mismo orden que posee A0 estipulando, además, que a 4 x para todo a ∈ A0 . Entonces
( B0 , 4) es un elemento de F tal que ( A0 , 4) - ( B0 , 4), lo que evidentemente contradice la
maximalidad de ( A0 , 4). Por esto A0 = X y 4 es un buen-orden sobre X.
Nota Adicional 1.3.3 Es un hecho ya establecido que en la Teoría de Conjuntos ZF el Axioma de
Elección, el Lema de Zorn y el Principio del Buen-Orden son todos equivalentes entre sí (véase,
por ejemplo, [74]). Esto significa que en la Teoría de Conjuntos ZFC, el Lema de Zorn y el
Principio del Buen-Orden siempre se cumplen. En tal sentido, y en lo que sigue, asumiremos
que nuestra Teoría de Conjuntos es la que se obtiene del sistema ZFC por lo que el Axioma de
Elección será usado libremente en esta notas.
Definición 1.3.13. Sea ( X, ) un conjunto bien-ordenado. Para cada x ∈ X, al subconjunto de X,
Seg( x) =
a∈X : a≺x ,
se le llama el segmento inicial determinado por x.
Por ejemplo, la definición moderna de los números naturales N0 = {0, 1, 2, . . . } usa tales
segmentos en la siguiente forma:
0 = Seg(0) = ∅,
1 = Seg(1) = {0},
2 = Seg(2) = {0, 1},
y, en general,
n = Seg(n) = {0, 1, 2, . . . , n − 1}.
Un par de observaciones son pertinentes referentes a los conjuntos Seg( x) de la definición
anterior.
( a) x 6∈ Seg( x) para todo x ∈ X.
(b) Cada par de segmentos iniciales en X son ⊆-comparables. En efecto, sean x, y ∈ X. Sin
x = y no hay nada que probar. Suponga que x 6= y. Por ser un orden total, se tiene que
x ≺ y o y ≺ x y, por consiguiente,
Seg( x) ⊆ Seg(y)
o
Seg(y) ⊆ Seg( x).
Si ( X, ) y (Y, ′ ) son conjuntos bien-ordenados, escribiremos, si fuese necesario, SegX ( x)
y SegY (y) para denotar segmentos iniciales de X y de Y respectivamente. En general, si A ⊆ X,
entonces definimos
Seg A ( x) = Seg( x) ∩ A = a ∈ A : a ≺ x .
La existencia de conjuntos bien-ordenados permite obtener la siguiente versión del principio
de inducción en N, llamado el Principio de Inducción Transfinita.
56
Cap. 1 Preliminares
Teorema 1.3.14 (Inducción Transfinita). Sea ( X, ) un conjunto bien-ordenado. Si A es un subconjunto no vacío de X verificando las siguientes dos condiciones:
( a) el primer elemento de X pertenece a A, y
(b) para cada x ∈ X, la condición: “Seg( x) ⊆ A implica que x ∈ A,”
entonces A = X.
Prueba. Suponga que A 6= X. El subconjunto B = X \ A de X es no vacío y, gracias al hecho
de X está bien-ordenado, B posee un primer elemento, llamémoslo x0 . Por ( a) tenemos que x0
no es el primer elemento de X. Ahora bien, por nuestra elección de x0 vemos que si y ≺ x0 ,
entonces y ∈ A, lo cual significa que Seg( x0 ) ⊆ A. Un llamado a la condición (b) nos revela
x0 ∈ A, lo que contradice el hecho de que x0 6∈ A. Por esto, A = X.
Hemos visto que los elementos de todo conjunto bien-ordenado se pueden disponer en orden
creciente. La siguiente definición, la cual es fundamental para describir lo que llamaremos número ordinal, permite identificar conjuntos bien-ordenados respetando, además, el orden en el cual
sus elementos están dispuestos.
Definición 1.3.15. Sean ( X, ) y ( X ′ , ′ ) dos conjuntos bien-ordenados. Una función f : X → X ′ se
dice que es un orden-isomorfismo si f es biyectiva y preserva el orden, es decir, f ( x) ′ f (y) siempre
que x y. En este caso diremos que los conjuntos X y Y son orden-isomorfos y lo escribiremos como
f : ( X, ) ∼
=0 ( X ′ , ′ ), o simplemente como ( X, ) ∼
=0 ( X ′ , ′ ).
Observe que si f es un orden-isomorfismo entre dos conjuntos bien-ordenados ( X, ) y
( X ′ , ′ ), entonces f envía el primer elemento de X en el primer elemento de X ′ , el segundo
elemento de X en el segundo elemento de X ′ , y así sucesivamente. Similarmente, por ser f −1
también un orden-isomorfismo, él envía el primer elemento de X ′ en el primer elemento de X, el
segundo elemento de X ′ en el segundo elemento de X, etc. Por esta razón, la afirmación ( X, )∼
=0 ( X ′ , ′ ) significa que X y X ′ son, esencialmente, lo mismo, o como se dice frecuentemente,
X y X ′ poseen el mismo tipo de orden. Por supuesto, si f : X → Y y g : Y → Z son ordenisomorfismos, también lo es g ◦ f .
Algunas de las propiedades de los conjuntos bien-ordenados se presentan a continuación.
Teorema 1.3.16. Sean ( X, ) y ( X ′ , ′ ) conjuntos bien-ordenados. Si f : ( X, ) → ( X ′ , ′ ) es
un orden-isomorfismo, entonces se cumple que
f SegX ( a) = SegX ′ f ( a) .
para todo a ∈ X.
Prueba. Sea a ∈ X. Si y ∈ f (SegX ( a)), entonces existe algún x ∈ SegX ( a) tal que y = f ( x).
Puesto x ∈ SegX ( a), resulta que x ≺ a y como f preserva el orden, entonces y = f ( x) ≺ f ( a),
es decir, y ∈ SegX ′ ( f ( a)). Esto prueba que f (SegX ( a)) ⊆ SegX ′ ( f ( a)). Para demostrar la otra
inclusión, suponga que y ∈ SegX ′ ( f ( a)). Puesto que SegX ′ ( f ( a)) ⊆ X ′ = f ( X ), resulta que existe
algún x ∈ X tal que y = f ( x). Veamos que x ∈ SegX ( a). En efecto, admitir que x 6∈ SegX ( a),
significa que a x y, por lo tanto, f ( a) ′ f ( x) = y lo que contradice el hecho de que y ≺′ f ( a).
Por esto SegX ′ ( f ( a)) ⊆ SegX ( a)) y termina la prueba.
Un hecho simple, pero fundamental, es el siguiente.
Sec. 1.3 El Axioma de Elección y sus Aliados
57
Teorema 1.3.17. Sean ( X, ) un conjunto bien-ordenado, Y ⊆ X y f : X → Y un orden-isomorfismo. Entonces x f ( x) para todo x ∈ X.
Prueba. Sea A = { x ∈ X : f ( x) ≺ x}. Vamos a demostrar que A = ∅. Suponga, para generar
una contradicción, que A 6= ∅. Entonces A posee un primer elemento al que denotaremos por
x0 . Puesto que x0 ∈ A se sigue que f ( x0 ) ≺ x0 . Sea x1 = f ( x0 ). Teniendo en cuenta que x1 ≺ x0
resulta, aplicando f , que f ( x1 ) ≺ f ( x0 ) = x1 lo cual demuestra que x1 ∈ A y, en consecuencia,
como x0 es el elemento más pequeño de A se tiene que x0 ≺ x1 . Esta contradicción establece
que A = ∅ y concluye la prueba.
Hemos convenido en definir que dos conjuntos bien-ordenados son orden-isomorfos si existe
al menos una función biyectiva entre ellos que preserva el orden. En el siguiente resultado se
establece que, en realidad, existe un único orden-isomorfismo entre ellos.
Teorema 1.3.18. Sean ( X, ) y ( X ′ , ′ ) conjuntos bien-ordenados. Si f : X → X ′ es un ordenisomorfismo, entonces f es único.
Prueba. Suponga que g : X ∼
=0 X ′ es otro orden-isomorfismo y considere, en primer lugar,
la aplicación h : X → X definida por h = f −1 ◦ g. Es fácil establecer que h es un ordenisomorfismo. Se sigue del Teorema 1.3.17 que x h( x) para todo x ∈ X. Si ahora aplicamos f
a lo anterior, vemos que f ( x) ′ f (h( x)) = g( x). Similarmente, definiendo h′ = g−1 ◦ f , resulta,
como antes, que h′ es un orden-isomorfismo verificando que x h′ ( x) para todo x ∈ X. De
esto se sigue que g( x) ′ g(h′ ( x)) = f ( x) y, por lo tanto, f = g. Fin de la prueba.
Otra consecuencia del Teorema 1.3.17 es que ningún segmento inicial de un conjunto bienordenado ( X, ) puede ser orden-isomorfo a dicho conjunto.
Corolario 1.3.19. Sea ( X, ) un conjunto bien-ordenado. Entonces para cualquier x ∈ X, el segmento inicial Seg( x) no es orden-isomorfo a X.
Prueba. Suponga f : ( X, ) ∼
=0 (Seg( a), ) es un orden-isomorfismo para algún a ∈ X. Por el
Teorema 1.3.17 sabemos que x f ( x) para todo x ∈ X. En particular, a f ( a). Por otro lado,
como f es sobreyectiva, entonces f ( X ) = Seg( a), de donde resulta que f ( a) ∈ Seg( a) y, por lo
tanto, f ( a) ≺ a. Esta contradicción termina la prueba.
1.3.4. Números Ordinales
El objetivo fundamental de esta sección es la de introducir un criterio que asigne a cada
conjunto bien-ordenado X un único objeto de la Teoría de Conjuntos, denotado por ord( X ), de
modo que
X∼
(∗)
=0 Y ⇔ ord( X ) = ord(Y ).
Tal vez un buen indicio para aproximarnos a ese objeto es el siguiente argumento. Suponga
que ( X, ) es un conjunto bien-ordenado y considere la siguiente colección de conjuntos
Seg( X ) = Seg( x) : x ∈ X .
Puesto que X es un conjunto bien-ordenado, cualquier par de elementos x, y ∈ X son comparables y, por lo tanto, también lo son los segmentos Seg( x) y Seg(y). Afirmamos que (Seg( X ), ⊆)
58
Cap. 1 Preliminares
es un conjunto bien-ordenado. Para ver esto, sea S un subconjunto no-vacío de Seg(X). Esto
significa que
S = Seg( x) : x ∈ A
para algún subconjunto no vacío A de X y como X es un conjunto bien-ordenado resulta
que A posee un primer elemento, llamémoslo x0 . Entonces Seg( x0 ) es el menor elemento de
S y termina la prueba de nuestra afirmación. Veamos que ( X, ) y (Seg( X ), ⊆) son ordenisomorfos. En efecto, la función
f ∗ : ( X, ) → (Seg( X ), ⊆),
definida por
f ∗ ( x) = Seg( x)
para todo x ∈ X
( 2)
es biyectiva y, por supuesto, preserva el orden. Se sigue del Teorema 1.3.18 que f ∗ es el único
orden-isomorfismo que cumple (2). Podemos proponer tomar ord( X ) = f ∗ ( X ). En el transcurso
de esta sección veremos una manera precisa de formalizar esta idea.
Siguiendo a John von Neumann (1903-1957) podemos extender la definición de número natural a cualquier conjunto bien-definido del modo siguiente.
Definición 1.3.20. Un número ordinal es un conjunto bien-ordenado ( X, ) tal que Seg( x) = x para
todo x ∈ X.
Usualmente usaremos el término “ordinal” en lugar de “número ordinal”. Los ordinales finitos son esencialmente los números naturales (junto con el 0) que se construyen partiendo del
conjunto vacío ∅ por una aplicación repetida de la “operación sucesor”, esto es,
0 = ∅ = Seg(0),
1 = {0} = {∅} = Seg(1),
2 = {0, 1} = {∅, {∅}} = Seg(2),
3 = {0, 1, 2} = {∅, {∅}, {∅, {∅}}} = Seg(3),
..
.
n = {0, 1, 2, . . . , n − 1} = Seg(n),
..
.
ω0 = {0, 1, 2, . . . } = Seg(N0 )
ω0 + 1 = {0, 1, 2, . . . , ω0 }
..
.
Estos números, los ordinales, son usados para etiquetar los pasos de cualquier proceso inductivo transfinito.
Ya hemos visto que si ( X, ) y (Y, ′ ) son conjuntos bien-ordenados y si ellos son ordenisomorfos, entonces dicho isomorfismo es único. Lo que resulta interesante es que si ellos también
son ordinales, entonces X = Y como se muestra en el siguiente:
Sec. 1.3 El Axioma de Elección y sus Aliados
59
Teorema 1.3.21. Si ( X, ) y ( X ′ , ′ ) son números ordinales tales que ( X, ) ∼
=0 ( X ′ , ′ ), entonces
′
X=X.
Prueba. Sea f : ( X, ) ∼
=0 ( X ′ , ′ ) el único orden-isomorfismo dado por el Teorema 1.3.18.
Vamos a demostrar que f = Id. Para ver esto, considere el conjunto
A = x ∈ X : f ( x) 6= x
y veamos que A = ∅. En efecto, suponga por un momento que A 6= ∅ y sea a el primer
elemento de A. Sea x ∈ SegX ( a). Entonces x ≺ a y como x 6∈ A resulta que f ( x) = x, de
donde se sigue que x = f ( x) ≺′ f ( a). Esto prueba que SegX ( a) ⊆ SegX ′ ( f ( a)). Recíprocamente,
sea y ∈ SegX ′ ( f ( a)). Como SegX ′ ( f ( a)) = f (SegX ( a)), existe un x ∈ SegX ( a) tal que y = f ( x).
Ya que x ∈ SegX ( a), se sigue de la primera parte que x = f ( x) = y y, así, y ∈ SegX ( a), es decir,
SegX ′ ( f ( a)) ⊆ SegX ( a) y, por lo tanto,
SegX ( a) = SegX ′ ( f ( a)).
Sin embargo, como X y Y son ordinales, resulta que a = SegX ( a) = SegX ′ ( f ( a)) = f ( a),
contrario al hecho de que a ∈ A. Esta contradicción establece que A = ∅ y termina la prueba.
Corolario 1.3.22. Si ( X, ) es un conjunto bien-ordenado y ( X ′ , ′ ) es un ordinal con X ∼
=0 X ′ ,
entonces X = X ′ .
Prueba. En vista al resultado anterior es suficiente demostrar que ( X, ) es un ordinal. Sea
f : ( X, ) ∼
=0 (Y, ′ ) el único orden-isomorfismo entre ellos y sea x ∈ X. Entonces
x = f −1 ( f ( x))
= f −1 SegX ′ ( f ( x)) por ser X ′ un ordinal
= SegX f −1 ( f ( x)) por el Teorema 1.3.16
= SegX ( x),
lo cual finaliza la prueba.
Dos observaciones importantes podemos derivar de la noción de número ordinal.
(1) Si ( X, ) es un número ordinal, entonces se cumple que:
x∈X
⇒
x ⊆ X.
Esto sigue directamente del hecho de que x = Seg( x) ⊆ X.
(2) La relación de orden de cualquier número ordinal se puede sustituir por la relación de subconjunto.
Para ver esto, sea ( X, ) un número ordinal y sean x, y ∈ X. Entonces
x y
⇔
Seg( x) ⊆ Seg(y)
⇔
x ⊆ y.
La primera equivalencia siempre se cumple en cualquier conjunto bien-ordenado, mientras que
la segunda x = Seg( x) ⊆ Seg(y) = y es válida por ser X un número ordinal. Por consiguiente,


( X, ⊆) es un conjunto bien-ordenado y
( X, ) es un número ordinal ⇔
(BO)


x = a ∈ X : a ⊆ x para todo x ∈ X.
60
Cap. 1 Preliminares
Por esta razón, cuando escribamos: “sea X un número ordinal” sin mencionar el buen-orden,
siempre se podrá suponer, cuando convenga, que el orden de éste es ⊆.
Para alcanzar el objetivo propuesto al comienzo de esta sección, debemos comprobar que
cualquier conjunto bien-ordenado es orden-isomorfo a un único número ordinal. Esto, sin embargo,
tomará un poquito de tiempo. Comencemos.
Teorema 1.3.23. Sea ( X, ) un número ordinal. Si a ∈ X, entonces a = Seg( a) es un número
ordinal.
Prueba. Fijemos a ∈ X. Puesto que todo subconjunto de un conjunto bien-ordenado hereda dicha
propiedad, resulta que (SegX ( a), ) está bien-ordenado. Pongamos Y = SegX ( a) y veamos que
SegY (b) = b para cualquier b ∈ Y. En efecto, si b ∈ Y, entonces b ≺ a y, por lo tanto,
SegX (b) ⊆ SegX ( a). De esto se sigue que
z ∈ SegY (b)
⇔
⇔
⇔
⇔
z ∈ Y ∧ z ∈ SegX (b)
z ∈ SegX ( a) ∧ z ≺ b
z≺a ∧ z≺b
z ∈ SegX ( a) ∩ SegX (b) = SegX (b) = b,
donde la última igualdad es válida por el hecho de ser X un número ordinal. Esto nos muestra
que SegX ( a) es un número ordinal y termina la prueba.
El siguiente resultado estable que cualquier subconjunto de un número ordinal el cual también
es un número ordinal, es un segmento inicial.
Teorema 1.3.24. Sea ( X, ) un número ordinal. Si Y $ X es un número ordinal, entonces Y =
Seg( a) para algún a ∈ X.
Prueba. Sea a el primer elemento de X \ Y. Entonces SegX ( a) ⊆ Y. Para demostrar que Y ⊆
SegX ( a), seleccione un elemento arbitrario b ∈ Y. Como Y y X son ambos ordinales, resulta
que
SegY (b) = b = SegX (b).
De aquí se deduce que b a. En efecto, si fuera a ≺ b, entonces a ∈ SegX (b) y por lo anterior
tendríamos que a ∈ SegY (b) y, en consecuencia, a ∈ Y lo cual es imposible. Así, b a. Más
aun, como b ∈ Y resulta que b 6= a y, por consiguiente, b ≺ a. Esto último nos muestra que
b ∈ SegX ( a) y, por lo tanto, Y ⊆ SegX ( a). Así Y = SegX ( a) y finaliza la prueba.
En lo que sigue, el símbolo Ord se usará para denotar la colección de todos los números ordinales.
Del último resultado se observa que: si X, Y ∈ Ord con X 6= Y, entonces
X⊆Y
⇔
⇔
⇔
X = SegX ( a)
para algún a ∈ Y
X = a
puesto que SegX ( a) = a
X ∈ Y
puesto que a ∈ Y
Por consiguiente,
Hecho 1. El orden de subconjunto ⊆ y el orden de pertenencia ∈ considerados sobre Ord son
equivalentes
Sec. 1.3 El Axioma de Elección y sus Aliados
61
y, por lo tanto, la clase Ord está bien-ordenada por ⊆, o equivalentemente, por ∈. Esta observación, combinada con (BO) de la página 59, permite la siguiente formulación equivalente de
número ordinal.
Definición 1.3.25. Un conjunto bien-ordenado X es un número ordinal, que denotaremos por ord( X ),
si, y sólo si,
( a) X es transitivo, esto es, ( x ∈ X ⇒ x ⊆ X ), y
(b) X está bien-ordenado por ∈.
De la definición anterior resulta claro que: si X y X ′ son conjuntos bien-ordenados, entonces
X∼
=0 X ′
⇔
ord( X ) = ord( X ′ ).
Observe que si tenemos dos números ordinales, digamos ( X, ) y (Y, ′ ), y si X ∩ Y 6= ∅,
entonces y ′ coinciden sobre X ∩ Y y, en consecuencia, X ∩ Y está bien-ordenado (con uno
cualquiera de los dos ordenes anteriores). Más aun, se tiene que:
Teorema 1.3.26. Si ( X, ) y (Y, ′ ) son números ordinales, entonces X ∩ Y es un número ordinal.
Prueba. Claramente X ∩ Y está bien-ordenado. Sea a ∈ X ∩ Y. Por definición, SegX ( a) = a =
SegY ( a) y en consecuencia,
a = SegX ( a) ∩ SegY ( a) = z ∈ X ∩ Y : z ≺ a = SegX ∩Y ( a).
La prueba es completa.
Si bien es cierto que ningún conjunto bien-ordenado es orden-isomorfo a ninguno de sus
segmentos iniciales resulta, sin embargo, que siempre es cierto, para cualquier par de números
ordinales, lo siguiente.
Teorema 1.3.27. Sean ( X, ) y (Y, ′ ) números ordinales. Entonces se cumple una, y sólo una, de
las siguientes afirmaciones:
( a) X = Y.
(b) X ∼
=0 SegY (y) para algún y ∈ Y.
(c) Y ∼
=0 SegX ( x) para algún x ∈ X.
Prueba. En primer lugar observe que ( a) y (b) no pueden ocurrir al mismo tiempo. En efecto,
si lo anterior fuese cierto, entonces Y = X ∼
=0 SegY (y) para algún y ∈ Y lo cual es imposible
gracias al Corolario 1.3.19. El mismo argumento nos revela que tampoco puede ser cierto que
( a) y (c) se cumplan a la vez. Veamos que tampoco (b) y (c) son posibles. Para ver esto,
suponga lo contrario y considere los orden-isomorfismos f : X ∼
=0 SegY (y) para algún y ∈ Y
y g : Y ∼
=0 SegX ( x) para algún x ∈ X. Entonces la aplicación g ◦ f : X → SegX ( x) es un
orden-isomorfismo, lo que de nuevo contradice el Corolario 1.3.19.
Suponga ahora que X 6= Y y veamos que (b) o (c) se cumplen. Puesto que X 6= Y,
entonces X ⊆ Y o Y ⊆ X y el resultado sigue del Teorema 1.3.24. Suponga, para construir una
contradicción, que ni (b) ni (c) se cumplen, es decir, que X ≇ SegY (b) para todo b ∈ Y y
también que Y ≇ SegX ( a) para todo a ∈ X. Puesto que X ∩ Y ⊆ X y X ∩ Y ⊆ Y se sigue del
62
Cap. 1 Preliminares
Teorema 1.3.26 que X ∩ Y es un número ordinal y, así, gracias al Teorema 1.3.24, X ∩ Y = SegX ( a)
para algún a ∈ X y, similarmente, X ∩ Y = SegY (b) para algún b ∈ Y. Usando ahora el hecho
de que X y Y son números ordinales, resulta que
a = SegX ( a) = X ∩ Y = SegY (b) = b.
Afirmamos que a ∈ SegX ( a). En efecto, como a ∈ X y a = b ∈ Y resulta que a ∈ X ∩ Y =
SegX ( a), es decir, a ∈ SegX ( a) lo cual, como sabemos, es imposible. Esta contradicción establece
el resultado.
En lo sucesivo, un número ordinal será denotado, siguiendo la tradición, por una de las letras
griegas α, β, etc. El Teorema 1.3.27 permite comparar cualquier par de números ordinales del
modo siguiente: si α y β son números ordinales y si definimos
α ≤ β
si, y sólo si,
α ∈ β
ó
α = β,
resulta que:
Definición 1.3.28 (Tricotomía de Ordinales). Para cualesquiera dos números ordinales α y β, se cumple una, y sólo una, de las siguiente tres posibilidades: α < β, α = β ó β < α.
La relación de orden ≤ que acabamos de definir sobre la colección Ord de los números
ordinales la llamaremos el orden canónico de los números ordinales.
Similar a la definición de sucesión en un conjunto X, ahora generalizamos dicha noción a
conjunto de índices que son números ordinales.
Definición 1.3.29. Sea X un conjunto no-vacío y θ un ordinal infinito. Cualquier aplicación L :
Seg(θ ) → X se llama una sucesión transfinita en X.
Identificaremos, como siempre, la aplicación L de la definición anterior con el conjunto de
sus imágenes { xα : α < θ }, donde xα = L(α) para cualquier α < θ. Siguiendo la tradición,
escribiremos ( xα )α<θ en lugar de { xα : α < θ }. Si en lugar de puntos se considera una colección
A de subconjuntos de X, entonces estaremos hablando de una sucesión transfinita de conjuntos
que denotaremos por ( Aα )α<θ . La sucesión transfinita de conjuntos ( Aα )α<θ se dice
( a) no decreciente si Fα′ ⊆ Fα siempre que α′ < α < θ y
(b) no creciente si Fα′ ⊇ Fα siempre que α′ < α < θ.
Sea ( xα )α<θ una sucesión transfinita en un conjunto X. Diremos que la sucesión ( xα )α<θ es
estrictamente creciente si xα < xυ siempre que α < υ < θ. Si ocurre que xα > xυ para cualquier
α < υ < θ, entonces diremos que la sucesión ( xα )α<θ es estrictamente decreciente.
Teorema 1.3.30. Sea A un conjunto arbitrario de números ordinales. Entonces (A, ≤) es un conjunto
bien-ordenado.
Prueba. Suponga que (A, ≤) no está bien-ordenado. Se sigue de la observación (c) de la página 53, que A contiene una sucesión (αn )∞
n =0 estrictamente decreciente. Por definición, esto
significa que,
α0 ∋ α1 ∋ · · · ∋ α n ∋ · · ·
Sec. 1.3 El Axioma de Elección y sus Aliados
63
lo cual es equivalente, gracias al Hecho 1, a que
α0 ⊃ α1 ⊃ · · · ⊃ α n ⊃ · · ·
Esto último nos revela que (αn )∞
n =1 es una sucesión estrictamente decreciente contenida en el
conjunto bien-ordenado α0 lo cual es imposible.
Corolario 1.3.31. Sea A un conjunto de números ordinales. Las siguientes condiciones son equivalentes:
(1) A es un número ordinal.
(2) Para cada α ∈ A, si β es un número ordinal con β < α, entonces β ∈ A.
Prueba. (1) ⇒ (2) sigue de la definición de número ordinal. Para ver que (2) ⇒ (1), observe,
en primer lugar, que gracias al Teorema 1.3.30, A es un conjunto bien-ordenado. Sólo resta
demostrar que α = Seg(α) para cada α ∈ A. Veamos esto. Sea α ∈ A. Como α es un número
ordinal, también lo es Seg(α), de modo que si β ∈ Seg(α), entonces el Teorema 1.3.23 no dice que
β es un número ordinal satisfaciendo β < α y, por lo tanto, β ∈ α. Esto prueba que Seg(α) ⊆ α.
Para demostrar la otra inclusión, es decir, α ⊆ Seg(α), sea β ∈ α. Por el Teorema 1.3.23, β es un
número ordinal tal que, por definición, β < α. Nuestra hipótesis ahora nos garantiza que β ∈ A
y, por lo tanto, β ∈ Seg(α). Con esto se concluye que α = Seg(α) y, por consiguiente, A es un
número ordinal.
El siguiente resultado es uno de los más importantes en la obtención de números ordinales.
Teorema 1.3.32. Sea A un conjunto de números ordinales. Entonces existe un número ordinal α0
con las siguientes propiedades:
( a) α ≤ α0 para todo α ∈ A, y
(b) si β es otro número ordinal tal que α ≤ β para todo α ∈ A, entonces α0 ≤ β.
Prueba. Cada elemento de A es un conjunto de ordinales que verifica la condición del Corolario 1.3.31. De allí que
[
α
α0 =
α ∈A
es un conjunto de ordinales y como tal satisface la condición del Corolario 1.3.31. De allí que α0
es un número ordinal. Por otro lado, para cada α ∈ A, se tiene que α ⊆ α0 , lo cual es equivalente
a decir que α ∈ α0 y, así, por definición, α ≤ α0 . Para terminar la prueba, suponga que β es un
número ordinal tal que α ≤ β para todo α ∈ A. Entonces α ⊆ β para todo α ∈ A, de donde se
sigue que α0 ⊆ β y, por lo tanto, α0 ≤ β.
El número ordinal α0 del resultado anterior se llama el supremo de A y será denotado, en
lo sucesivo, por α0 = sup A. Así,
[
α0 = sup A =
α
α ∈A
y α0 no es, necesariamente, un elemento de A. Por ejemplo, si
α0 = sup N = {1, 2, . . . }
64
Cap. 1 Preliminares
resulta que α0 6∈ N.
La siguiente definición permitirá la construcción de una colección indescriptiblemente inmensa de ordinales, todos con la misma cardinalidad.
Definición 1.3.33. Sea α un ordinal. Llamaremos sucesor inmediato de α al número ordinal α ∪ {α}
al que denotaremos por α+ o α + 1. Si α y β son ordinales y β+ = α, entonces diremos que β es el
predecesor inmediato de α. Un ordinal sin un predecesor inmediato es llamado un ordinal límite, esto
es, α es un ordinal límite si
α = sup{ β : β < α}.
Nótese que, para cualquier ordinal α siempre existe α+ y se cumple que α < α+ . Sin
embargo, no todo ordinal posee un predecesor inmediato. Por lo tanto, un ordinal α es un
ordinal límite si α no es sucesor de ningún otro ordinal.
A partir de este momento, usaremos el símbolo ω para designar el ordinal de los números
naturales, esto es,
ω = ord(N ).
Observe que ω es el primer ordinal infinito numerable y, en consecuencia, el primer ordinal límite.
Usando la definición anterior podemos comenzar a producir ordinales infinitos. En efecto, el siguiente número ordinal después ω es ω + y se puede continuar generando ordinales numerables
del modo siguiente:
ω + = ω + 1,
(ω + 1)+ = ω + 2,
(ω + 2)+ = ω + 3, · · ·
En esta escala, después de ω, ω + 1, ω + 2, . . . viene
ω + ω = ω2 = {1, 2, . . . , ω, ω + 1, ω + 2, . . .}.
Similarmente, después de ω2, ω2 + 1, ω2 + 2, . . . se consigue
ω2 + ω = ω3 = {1, 2, . . . , ω, ω + 1, ω + 2, . . . , ω2, ω2 + 1, ω2 + 2, . . . }.
Más allá de ω2, ω3, . . . está ω 2 y después de ω 2 , ω 3 , . . . se obtiene ω ω . Si se continúa indefinidamente con este proceso se logra construir una gigantesca cantidad de números ordinales
ω, . . . , ω2, . . . , ω3, . . . , ω 2 , . . . , ω 2 + ω, . . . , ω 2 + ω2, . . . , ω 3 , . . . ,
ω
ωω , . . . , ωω , . . .
Esto ordinales son sólo una brevísima muestra de los así llamados ordinales numerables. Es costumbre definir
n
o
ω
ǫ = sup ω, ω ω , ω ω , . . .
ǫ
y, en consecuencia, formar ǫ + 1, ǫ + ω, ǫǫ , ǫǫ , etc. Es importante destacar que la lista de los
ordinales nunca termina y que ninguno de los ordinales: ω, ω2, . . . , ω 2 , . . . , ω ω , . . . , ǫ, . . . posee
un predecesor inmediato. Cada uno de ellos es, por supuesto, un ordinal límite.
Si ahora consideramos la colección Ord(ω ) de todos los ordinales numerables, entonces el
Teorema 1.3.32 permite definir el ordinal
ω1 = sup Ord(ω )
Sec. 1.3 El Axioma de Elección y sus Aliados
65
Nótese que ω1 es no-numerable. En efecto, si ω1 fuese numerable, entonces ω1 ∈ ω1 lo cual
está prohibido en ZFC. De hecho, ω1 es el primer ordinal no-numerable ya que si α < ω1 , entonces
α ∈ ω1 y, en consecuencia, α es numerable.
De este modo, los ordinales numerables ofrecen un camino distinto para producir conjuntos
no-numerables. Por supuesto, podemos, como antes, continuar definiendo
ω1 + 1, ω1 + 2, . . . , ω1 + ω, . . . , ω1 + ω2, . . .
Los dos ejemplos siguientes permiten visualizar, a vuelo de pájaros, que todos los ordinales
construidos anteriormente, con excepción de ω1 y sus seguidores, son numerables.
Ejemplo 1.3.2. Si α es un ordinal con α ≥ ω, entonces la aplicación f : α → α+ definida por
f (1) = α,
f (n + 1) = n,
f ( β) = β,
para n < ω
si ω ≤ β < α
es una biyección. Por inducción, se comprueba que ω, ω + 1, ω + 2, . . . todos son numerables.
Ejemplo 1.3.3. Similarmente, la aplicación g : ω → ω2 dada por

n/2
si n es par
f (n) =
ω + (n − 1)/2
si n es impar
también es una biyección. Por lo tanto, usando ejemplo anterior, se prueba que ω2, ω2 + 1, ω2 + 2, . . .
son numerables. Continúe.
La importancia del siguiente resultado reside, precisamente, en impedir que la inmensa colección Ord sea un conjunto en ZFC.
Teorema 1.3.34. Sea A un conjunto de números ordinales. Entonces existe un β0 ∈ Ord \ A tal que
α < β0 para todo α ∈ A.
Prueba. Por el Teorema 1.3.32 existe el número ordinal α0 = sup A. Es claro que el número
ordinal β0 = α0+ satisface la conclusión del teorema.
Del resultado anterior se concluye que Ord no es un conjunto. En efecto, suponer que Ord es
un conjunto implicaría, gracias al Teorema 1.3.34, que existe un ordinal fuera de Ord lo cual es
absurdo.
Ya vimos que en ZFC la colección U de todos los conjuntos no es un conjunto. Sin embargo, se
puede probar que U es una jerarquía acumulativa, es decir, cualquier conjunto pertenece a algún
Vα para algún ordinal α, donde los Vα son definidos como sigue:
V0 = ∅.
Vα+1 = P (Vα ).
[
Vλ =
Vα , si λ es un ordinal límite.
α<λ
Entonces U =
[
α∈Ord
Vα .
66
Cap. 1 Preliminares
Uno de los resultados fundamentales que conduce a definir con claridad la noción de número
cardinal es el que se muestra en el próximo teorema. Sin embargo, su demostración se sustenta
sobre un axioma llamado el Axioma de Sustitución o Esquema de Reemplazo que reza así:
Axioma de Sustitución. Sea P(u, v) una propiedad tal que para cada objeto u existe un único
objeto v para el cual P(u, v) se satisface. Entonces, para cada conjunto A, existe un conjunto B
con la siguiente propiedad: para cada a ∈ A, existe b ∈ B para el cual P( a, b) se cumple.
Sea F la operación definida por la propiedad P, esto es, F( a) es el único b para el cual
P( a, b) se cumple. Entonces el Axioma de Sustitución puede ser establecido como sigue:
Para cualquier conjunto A, existe un conjunto B tal que: para todo a ∈ A, F( a) ∈ B.
Por supuesto, B puede contener elementos que no son de la forma F( a) para algún a ∈ A. Sin
embargo, siempre se puede sustituir el conjunto B por el conjunto
b ∈ B : P( a, b) para algún a ∈ A
al que llamaremos la imagen de A por F y denotado por F( A) = {F( a) : a ∈ A}. En resumen,
el Axioma de Sustitución permite, dado el conjunto A, construir una función F : A → B tal que
Dom(F) = A, Im(F) = F( A) y F( a) sea el único b ∈ B para el cual P( a, b) se satisface.
Teorema 1.3.35. Sea ( X, ) un conjunto bien-ordenado. Entonces, X es orden-isomórfico a único
número ordinal.
Prueba. La prueba la haremos en dos pasos. El primero consiste en demostrar que: para cada
x ∈ X, existe un ordinal α tal que Seg( x) es orden-isomorfo a α. Para ver esto, considere el conjunto
A = x ∈ X : Seg( x) ∼
=0 α para algún α ∈ Ord
Vamos a demostrar, usando el Principio de Inducción Transfinita, que A = X. Observe que si X
es vacío, entonces A = ∅ y no hay nada que probar. Suponga que X 6= ∅. Queremos demostrar
que:
(i) el primer elemento de X está en A y
(ii) para todo x ∈ X, si Seg( x) ⊆ A, entonces x ∈ A.
Sea x0 el primer elemento de X. Puesto que Seg( x0 ) = ∅ y ∅ es el ordinal 0, resulta que
x0 ∈ A. Esto prueba (i). Para demostrar (ii), suponga que x ∈ X es tal que Seg( x) ⊆ A,
donde x 6= x0 . Elija cualquier x′ ∈ Seg( x) y observe que como x′ ∈ A, entonces existe un
ordinal β para el cual Seg( x′ ) ∼
=0 β. El Teorema 1.3.21 nos garantiza entonces que β es único
′
para cada x ∈ Seg( x). Lo anterior permite que podamos considerar el conjunto Seg( x) y la
propiedad
P( x, β) : si x′ ≺ x, entonces β es el único número ordinal tal que β ∼
=0 Seg( x′ ).
Por el Axioma de Sustitución, existe un conjunto B y una función f : Seg( x) → B tal que f ( x′ )
es el único ordinal β orden-isomorfo a Seg( x′ ) para cada x′ ∈ Seg( x). Uno puede suponer que
B = β ∈ Ord : β ∼
=0 Seg( x′ ) para algún x′ ∈ Seg( x) .
Sec. 1.3 El Axioma de Elección y sus Aliados
67
Resulta del Corolario 1.3.31 que α = f (Seg( x)) = B es un número ordinal y como f es estrictamente creciente, se concluye que f es un orden-isomorfismo, esto es, Seg( x) ∼
=0 α. Esto prueba
x ∈ A y así, gracias al Principio de Inducción Transfinita, resulta que A = X.
El segundo paso consiste en aplicar, de nuevo, el Axioma de Sustitución al conjunto X y a la
propiedad (justificada en el paso anterior):
P( x, β) : β es un número ordinal tal que β ∼
=0 Seg( x)
para cada x ∈ X. Entonces existe un conjunto B′ y una función g : X → B′ tal que g( x) es
el único número ordinal β orden-isomorfo al segmento inicial Seg( x). Un argumento similar al
desarrollado en el paso anterior nos revela que X es orden-isomorfo al número ordinal α = f ( X ).
El hecho de que X es orden-isomorfo a un único ordinal sigue del Teorema 1.3.21. Esto termina
la prueba.
1.3.5. Números Cardinales
Una vez definido el número ordinal de cualquier conjunto bien-ordenado, estamos en condiciones de terminar nuestra tarea: definir el número cardinal de cualquier conjunto X, en realidad,
de cualquier conjunto bien-ordenado.
Definición 1.3.36. Un número ordinal α es llamado un ordinal inicial si α no es equipotente a ningún
ordinal β < α.
Por ejemplo, cualquier número natural es un ordinal inicial. ω es un ordinal inicial ya que él
no es equipotente a ningún número natural. Sin embargo, ω + 1 no es un ordinal inicial por el
simple hecho de que card(ω ) = card(ω + 1), pero ω < ω + 1. De modo similar, ninguno de los
ordinales ω + 2, ω + 3, . . . , ω + ω, . . . son iniciales.
Que a todo conjunto se le puede asignar un único número cardinal es consecuencia del siguiente resultado.
Teorema 1.3.37. Cualquier conjunto no vacío X es equipotente a un único ordinal inicial.
Prueba. Sea X un conjunto no vacío. El Principio del Buen-orden nos garantiza la existencia de
un buen-orden sobre X. Por el Teorema 1.3.35 existe un único ordinal α que es orden-isomorfo
a X. Sea
Fα = β ∈ Ord : β ≈ α .
Entonces Fα es un conjunto bien-ordenado y, por lo tanto, el más pequeño de los elementos de
Fα es un ordinal inicial equipotente a X.
Lo que acabamos de probar permite justificar, de modo simple, la siguiente definición.
Definición 1.3.38. Sea X un conjunto. El número cardinal, o cardinal de X, denotado por card( X ),
es el único ordinal inicial equipotente a X.
Nótese que card( X ) es el ordinal más pequeño que es equipotente con X. Dicho de otro
modo, κ es un número cardinal si él no es equipotente a ningún ordinal α < κ. Por ejemplo, el ordinal
más pequeño que es equipotente con N es ω. Por consiguiente, card(ω ) es un número cardinal
al que llamaremos el cardinal de los números naturales y que denotaremos por ℵ0 . Así,
ℵ0 = card(ω ).
68
Cap. 1 Preliminares
Es interesante observar que N puede ser pensado de dos maneras: como ω, el primer ordinal
infinito y también como ℵ0 , el primer cardinal infinito.
Aunque estamos usando el sistema de los números ordinales para “medir” conjuntos, no
todos ellos sirven para ese propósito. Por ejemplo, ningún ordinal numerable α > ω puede ser
usado para definir un número cardinal puesto que, en este caso, card(ω ) = card(α) y entonces
se puede determinar una biyección entre ambos conjuntos.
Por supuesto, la definición de número cardinal que acabamos de suministrar cumple la receta:
si X, Y son conjuntos, entonces
X≈Y
⇔
card( X ) = card(Y ).
Claramente cualquier número natural es un número cardinal finito.
1.3.6. ℵ1 y el Primer Ordinal No-numerable
Este es otro modo de visualizar el primer ordinal no-numerable. Considere la colección Fc de
todos los números ordinales no-numerables orden-isomorfos a R; es decir,
Fc = β ∈ Ord : β ≈ ord(R ) .
Por lo visto anteriormente, Teorema 1.3.30, Fc es un conjunto bien-ordenado y, en consecuencia, posee un primer elemento al que denotaremos por ω1 . Este número ordinal ω1 posee las
siguientes propiedades:
(1) ω1 es el primer ordinal no-numerable. Por consiguiente, como ω1 es un ordinal inicial,
cualquier ordinal β < ω1 es un ordinal numerable y, en consecuencia, ω1 es el conjunto de todos los
ordinales numerables:
ω1 = β ∈ Ord : β ≈ ord(N ) = sup{α ∈ Ord : α < ω1 }.
(2) Ninguna sucesión en ω1 alcanza a ω1 , esto significa que si (αn )∞
n =1 es cualquier sucesión en
ω1 , entonces existe un ordinal α ∈ ω1 tal que αn ≤ α para cualquier entero n ≥ 1. En efecto,
basta tomar α = sup{αn : n ∈ N } y observar que α ∈ ω1 .
Definamos ahora
ℵ1 = card(ω1 ).
Observe que ℵ1 es el número cardinal no-numerable más pequeño mayor que ℵ0 . Un paso más. Sea
ω2 = β ∈ Ord : β ≈ ω1 = sup{α ∈ Ord : ω1 ≤ α < ω2 },
y defina
ℵ2 = card(ω2 ).
En general, si para cada n ∈ N, el número cardinal ℵn ha sido obtenido, entonces definimos
ℵn+1 = card(ωn+1),
donde ωn+1 es el conjunto de todos los números ordinales cuya cardinalidad es ℵn . De nuevo,
ℵn+1 es el número cardinal más pequeño mayor que ℵn . Para ordinales transfinitos, comenzando con
ω, definimos
[
∞
ℵω = card
ωn = card(sup{ωn : n ∈ N }),
n =1
Sec. 1.3 El Axioma de Elección y sus Aliados
69
y se continúa la construcción de cada ℵα para todo número ordinal α > ω. Cada cardinal ℵα ,
donde α es un ordinal arbitrario, será llamado un alef. Nótese que si α ≥ 1, entonces ℵα es
no-numerable.
Observe que todo cardinal infinito posee un cardinal sucesor inmediato, es decir, ℵ β es un
cardinal sucesor inmediato si y sólamente si el índice β es un ordinal sucesor inmediato. Un
cardinal que no es un cardinal sucesor inmediato es llamado un cardinal límite. Ejemplos de
cardinales límites son ℵ0 , ℵω , ℵω2 , ℵω1 . Así, la sucesión transfinita de cardinales infinitos es
estrictamente creciente:
ℵ 0 < ℵ 1 < ℵ 2 < · · · < ℵ ω < · · · < ℵ ω1 < · · · < ℵ ω ω < · · ·
Estos cardinales infinitos eran para Cantor algo sagrado: constituían los escalones que conducen
a Ω∗ , el infinito absoluto, el trono de Dios. Nótese que todo número cardinal es un número
natural, o un alef.
Lo antes expuesto nos permite ahora establecer una definición formal de los términos “finito”,
“numerable” y “no-numerable”:
( a) Un conjunto es finito si su cardinalidad es menor que ℵ0 .
(b) Un conjunto es numerable si su cardinalidad es igual a ℵ0 .
(c) Un conjunto es no-numerable si su cardinalidad es mayor o igual que ℵ1 .
Puesto que la cardinalidad de cualquier conjunto está en una de las categorías anteriores, la Ley
de Tricotomía de los Cardinales establece que cualquier par de cardinales, digamos a y b, son
comparables, esto es,
a < b,
a = b
o
a > b.
Una de las sorpresas de este principio ocurrió cuando Friedrich Hartogs demostró en el año 1915
que la Ley de Tricotomía implica el Axioma de Elección.
Nota Adicional 1.3.4 La siguiente observación será usada frecuentemente. Si un conjunto X tiene
cardinalidad ℵ1 entonces:
(1) X está bien-ordenado y
(2) Existe una biyección entre ω1 y X.
En consecuencia, cada elemento de X puede ser identificado con un único elemento de ω1
y viceversa. Por esta razón, siempre podemos representar a X en la forma:
X = xα : α < ω1 = xα α < ω .
1
1.3.7. La Aritmética de los Cardinales
En esta sección definiremos las operaciones aritméticas (suma, multiplicación y exponenciación) de números cardinales y algunas de sus propiedades, pero no así la de números ordinales
las cuales difiere sustancialmente de la aritmética cardinal para conjuntos infinitos. Por ejemplo,
2ω es un ordinal numerable, mientras que 2ℵ0 es un cardinal no-numerable.
La aritmética de los cardinales finitos es sencilla en el sentido de que si A y B son conjuntos
finitos y disjuntos tales que card( A) = m y card( B) = n, entonces
m + n = card( A ∪ B)
y
m · n = card( A × B).
70
Cap. 1 Preliminares
Más aun, las operaciones de resta, división y exponenciación se practican de la forma habitual.
Por otro lado, la aritmética de los cardinales transfinitos, aunque se basa sobre ideas similares a
la del caso finito, es bien distinta a ésta ya que, por ejemplo, no incluye operaciones como la resta
y la división, aunque sí la exponenciación. Sin embargo, no es imprescindible en su definición
que los conjuntos sean disjuntos.
Definición 1.3.39. Sean A y B conjuntos arbitrarios. Si card( A) = a y card( B) = b, definimos
a + b = card ( A × {0}) ∪ ( B × {1})
y
a · b = card( A × B).
La legitimidad de las operaciones anteriores se sustentan sobre el hecho de que a + b y a · b
no dependen de la elección de los conjuntos A y B. Se sigue de la definición anterior que
y
ℵ0 + ℵ0 = ℵ0
ℵ0 · ℵ0 = ℵ0 .
ya que (N × {0}) ∪ (N × {1}) ≈ N y N × N ≈ N. También
2ℵ 0 + 2ℵ 0 = 2ℵ 0
2ℵ 0 · 2ℵ 0 = 2ℵ 0 .
y
por un argumento similar. Véase también el próximo teorema. Por ejemplo, si JQ constituye la
colección de todos los intervalos abiertos con extremos racionales, entonces
card(JQ ) = ℵ0 .
En efecto, existen ℵ0 intervalos abiertos cuyo extremo inferior es un número racional. Una vez fijado un intervalo abierto cuyo extremo izquierdo es un número racional, existen ℵ0 posibilidades
de que su extremo derecho sea un racional. Por lo tanto,
card(JQ ) = ℵ0 · ℵ0 = ℵ0 .
Las operaciones de suma y producto de números cardinales son siempre conmutativas, asociativas y distributivas, esto es,
a·b = b·a
a+b = b+a
a · ( b · d) = ( a · b ) · d
a + ( b + d) = ( a + b ) + d
a · ( b + d) = a · b + a · d
Otro hecho que resulta contrario a la lógica de la aritmética de los números cardinales finitos
es el siguiente:
Teorema 1.3.40. Sean a y b números cardinales. Si b es infinito y a < b, entonces
a+b = b
y
a · b = b.
Prueba. Sean A y B conjuntos tales que card( A) = a y card( B) = b. Sin perder generalidad
asumiremos que A ∩ B = ∅. En este caso, card ( A × {0}) ∪ ( B × {1}) = card( A ∪ B). Como
a < b, existe una función inyectiva f : A → B que no es sobreyectiva. Si ahora definimos
F : A → f ( A) por
F ( x) = f ( x) para todo x ∈ A,
Sec. 1.3 El Axioma de Elección y sus Aliados
71
resulta que F es biyectiva, card( A) = card( F ( A)), F ( A) ∪ B = B y
a + b = card( A ∪ B) = card( F ( A) ∪ B) = card( B) = b.
La prueba de que a · b = b es similar y se invita al lector a realizarla.
Del resultado anterior se tiene que si a, b son cardinales infinitos, entonces se cumple que
a + b = a · b = máx{a, b}.
En particular, cualesquiera sean α, β ∈ Ord,
ℵα + ℵ β = ℵα · ℵ β = máx{ℵα , ℵ β }.
(1) Puesto que ℵ0 < 2ℵ0 , resulta de lo anterior que
ℵ 0 + 2ℵ 0 = 2ℵ 0
ℵ 0 · 2ℵ 0 = 2ℵ 0 .
y
(2) Similarmente, n + ℵ0 = ℵ0 y n · ℵ0 = ℵ0 para cualquier n ∈ N.
En general, si (κα )α<θ es una sucesión de números cardinales, su suma cardinal,
define como
[
X
κα = card
Aα ,
α<θ
P
α<θ
κα , se
α<θ
donde { Aα : α < θ } es cualquier colección disjunta de conjuntos con card( Aα ) = κα para todo
α < θ. Una definición similar sirve para el producto cardinal.
Para definir la exponenciación
de números cardinales, recordemos que para cualquier conjun
X
to X, card(P ( X )) = card 2 . Usando esta información podemos convenir en definir:
Definición 1.3.41. Si card( A) = a y card( B) = b, definimos
ab = card( A B ).
Como antes, se puede demostrar que esta definición de exponenciación no depende sobre la
elección de los conjuntos A y B. Mientras que la suma y multiplicación de números cardinales son relativamente simples, debemos advertir que la evaluación de la exponenciación es más
complicada. Por ejemplo, por el Teorema de Cantor, 2ℵα > ℵα , en otras palabras,
2ℵ α ≥ ℵ α + 1 .
Pero no hay mucho que pueda demostrarse de 2ℵα , excepto la siguiente propiedad:
2ℵ α ≤ 2
ℵβ
siempre que α ≤ β.
De la definición anterior se puede demostrar, sin mucha dificultad, que:
( a) a ≤ ab si b > 0.
(b) a ≤ ba si b > 1.
(c) Si a1 ≤ a2 y b1 ≤ b2 , entonces ab11 ≤ ab22 .
Más propiedades de la exponenciación viene dada por el siguiente resultado.
72
Cap. 1 Preliminares
Teorema 1.3.42. Sean a, b y γ números cardinales. Entonces,
(1) ab+d = ab · ad .
d
(2) ab = ab·d .
( 3 ) ( a · b ) d = a γ · bd .
Prueba. Sean A, B y C conjuntos tales que a = card( A), b = card( B) y d = card(C ). Para
demostrar (1), suponga que B y C son disjuntos. Vamos a construir una función inyectiva F
de A B × AC sobre A B∪C . Si ( f , g) ∈ A B × AC , defina F ( f , g) = h, donde h : B ∪ C → A viene
dada por
(
f ( x)
si x ∈ B
h( x ) =
g( x )
si x ∈ C.
Es claro que ϕ ∈ A B∪C y que F es inyectiva. Por supuesto, dada cualquier función h ∈ A B∪C ,
las funciones f = h| B y g = h|C satisfacen F ( f , g) = h y, por lo tanto, F es sobreyectiva.
Para demostrar (2) vamos a considerar la función F : A B×C → ( A B )C definida por F ( f ) = g,
donde cada f : B × C → A y g : C → A B se define, para todo c ∈ C y todo b ∈ B, por
g(c)(b) = f (b, c). Observe que como g(c) ∈ A B , la expresión g(c)(b) = f (b, c) siempre tiene
sentido. Dejamos a cargo del lector la tarea de comprobar que F es biyectiva y también la prueba
de (3).
Por ejemplo,
ℵ
22 0 · 22
ℵ0
= 22
ℵ 0 + 2ℵ 0
ℵ
= 22 0 .
Corolario 1.3.43. Si 2 ≤ b ≤ 2a y a es infinito, entonces b a = 2a .
Prueba. De los resultados anteriores se tiene que
a
2a ≤ ba ≤ 2a
= 2 a·a = 2a .
y, por lo tanto, b a = 2a .
En particular, tomando a = b = ℵ0 en el resultado anterior, resulta que
ℵ0ℵ0 = 2ℵ0 .
Nota Adicional 1.3.5 Fijemos un cardinal infinito κ. Si para cada λ < κ y cada α < λ existe un
conjunto Aα con card( Aα ) ≤ κ, entonces
[
card
Aα ≤ κ.
α<λ
En efecto, card(
S
α<λ
Aα ) ≤ κ · λ = κ · κ = κ.
Sea θ un ordinal límite. Si (α β ) β<θ es una sucesión estrictamente creciente de ordinales,
definimos
α = sup{α β : β < θ }.
A α lo llamaremos el límite de la sucesión creciente y lo denotaremos por α = lı́m α β .
Un cardinal infinito ℵα es un límite fuerte si 2
ℵβ
β→θ
< ℵα para todo β < α.
Sec. 1.3 El Axioma de Elección y sus Aliados
73
Definición 1.3.44. Un cardinal infinito κ se llama singular si existe una sucesión estrictamente
creciente (α β ) β<θ de ordinales, donde θ es un ordinal límite, tal que:
( a) θ < κ,
(b) α β < κ para todo β < θ y κ = lı́m α β .
β→θ
Un cardinal infinito que no es singular se llama regular.
Por ejemplo, ℵω es un cardinal singular, pues ω es un ordinal límite,
ℵω = lı́m ℵn ,
n→ω
ω < ℵω y ℵn < ℵn+1 para cada n < ω. Similarmente, los cardinales ℵω +ω , ℵω ·ω , ℵω1 son
singulares. Se puede demostrar que existen cardinales singulares arbitrariamente grandes.
Por ejemplo, fijemos un cardinal infinito, digamos ℵα . Entonces
ℵα+ω 0 lı́m ℵα+n
n→ω
es un cardinal singular mayor que ℵα .
Definición 1.3.45. Un cardinal no-numerable κ se llama inaccesible si él es un cardinal límite y
a la vez regular.
Otra manera de expresar lo anterior es como sigue: κ es un cardinal inaccesible si:
( 1) κ > ℵ 0 ,
(2) para todo cardinal a < κ, se tiene que 2a < κ, y
(3) para cualquier conjunto de índices I con card( I ) < κ y cualquier colección {ai : i ∈ I }
de cardinales tal que ai < κ para todo i ∈ I, se cumple que sup{ai : i ∈ I } < κ.
En otras palabras, un cardinal κ es inaccesible si no puede alcanzar por “debajo”; es decir,
si no puede obtenerse a partir de las operaciones básicas entre cardinales, utilizando únicamente cardinales menores que él mismo. Los cardinales inaccesibles forman una cofradía
de los así llamados los grandes cardinales los cuales no pueden demostrarse, en ZFC, su
consistencia y, en consecuencia, deben asumirse como un axioma adicional.
1.3.8. La Cardinalidad de R y otros Conjuntos Similares
.
En esta parte analizaremos la cardinalidad del conjunto R de los números reales y estudiaremos algunos otros ejemplos de conjuntos que poseen esa cardinalidad. Ya hemos visto que R es
un conjunto no-numerable y habíamos asignado el símbolo c al número de sus elementos. Ahora
es el momento de darle sentido a ese símbolo. De la definición de exponenciación de números
cardinales y el Teorema de Cantor, Teorema 1.2.17, se tiene que
card 2N = 2ℵ0 = card P (N ) .
Veamos ahora que:
74
Cap. 1 Preliminares
Teorema 1.3.46. card(R ) = 2ℵ0 .
Prueba. Puesto que toda sucesión de números racionales es una aplicación s : N → Q, resulta
que su gráfico es un subconjunto de N × Q por lo que el conjunto S(Q ), formado por todas las
sucesiones de números racionales, está contenido en P (N × Q ). Más aun, como cada número
real x es el límite de una sucesión perteneciente a S(Q ) se tiene, usando el Teorema de Cantor,
Teorema 1.2.17, y las propiedades de la exponenciación de cardinales, que
card(R ) ≤ card(S(Q )) ≤ card P (N × Q )
= 2card(N×Q) = 2ℵ0 ·ℵ0 = 2ℵ0 .
Esto prueba que card(R ) ≤ 2ℵ0 . Para demostrar la otra desigualdad, es decir, 2ℵ0 ≤ card(R )
considere la función f : 2N → R definida por
f ( an ) ∞
n =1 = 0.a1 a2 a3 . . .
donde an ∈ {0, 1} para todo n ≥ 1. Es fácil ver que f es inyectiva por lo que
2ℵ0 = card 2N ≤ card R .
La prueba es completa.
Por el resultado anterior tenemos que c = 2ℵ0 y, por lo tanto, haciendo uso del Teorema de
Cantor, Teorema 1.2.19, se tiene que
ℵ0 < 2ℵ0 < 22
ℵ0
2ℵ 0
< 22
< ···
En el siguiente resultado se muestran algunos conjuntos cuya cardinalidad es la del continuo.
Teorema 1.3.47. (1) card(C ) = 2ℵ0 , donde C es el conjunto de los números complejos.
(2) card R n = 2ℵ0 para cada n ∈ N.
(3) card NN = 2ℵ0 .
(4) card RN = 2ℵ0 .
(5) card C (R ) = 2ℵ0 , donde C (R ) consiste de todas las funciones continuas de R en R.
(6) card OR = 2ℵ0 , donde OR es la colección de todos los subconjuntos abiertos de R.
Prueba. (1) Puesto que la aplicación ϕ : R × R → C dada por ϕ( a, b) = a + ib es biyectiva,
resulta que
card(C ) = card(R × R ) = 2ℵ0 · 2ℵ0 = 2ℵ0 +ℵ0 = 2ℵ0 .
(2) Esto sigue de lo siguiente:
card(R n ) =
2ℵ 0
n
= 2n·ℵ0 = 2ℵ0 .
(3) El conjunto N ∞ tiene cardinalidad ℵ0ℵ0 . Se sigue del Corolario 1.3.43 que
card NN
= ℵ0ℵ0 = 2ℵ0 .
Sec. 1.3 El Axioma de Elección y sus Aliados
75
(4) Esto es consecuencia de (2) del Teorema 1.3.42:
ℵ
card RN = 2ℵ0 0 = 2ℵ0 ·ℵ0 = 2ℵ0 .
(5) Usaremos el siguiente hecho: Toda función continua f : R → R queda completamente determinada por sus valores en Q. En particular, si dos funciones continuas f , g : R → R son tales que
f (r) = g(r) para todo r ∈ Q, entonces f = g. Considere ahora la función Φ : C (R ) → RQ
definida por Φ( f ) = f |Q . De la observación anterior resulta que Φ es inyectiva y, por lo tanto,
ℵ
card(C (R )) ≤ card RQ = 2ℵ0 0 = 2ℵ0 .
Por otro lado, como C (R ) contiene a todas la funciones constantes, se tiene que
2ℵ0 ≤ card(C (R ))
y termina la prueba de (5).
(6) En primer lugar, observe que la función f : R → OR dada por f ( a) = ( a, +∞) es inyectiva,
de donde se sigue que
2ℵ0 = card(R ) ≤ card OR .
Para demostrar la otra desigualdad, nótese que todo conjunto abierto G es la unión de los intervalos abiertos con extremos racionales contenidos en G y como JQ , el conjunto de todos los
intervalos abiertos con extremos racionales, es numerable resulta que existen a lo sumo 2ℵ0 de
tales uniones. Por esto
card OR ≤ 2ℵ0
y termina la prueba.
Del Teorema 1.3.47 (6) se deduce que:
(7) La cardinalidad de F, la colección de todos los subconjuntos cerrados de R, es 2ℵ0 .
Esto sigue simplemente del hecho de que existe una biyección entre OR y F dada por f ( G ) = G c
para todo G ∈ OR . En particular, la colección Fc de todos los elementos de F que son no-numerables
posee cardinalidad 2ℵ0 . En efecto, como todo intervalo cerrado no degenerado es no-numerable,
entonces
2ℵ0 = card {[ x, 1] : x ∈ R, x < 1} ≤ card(Fc ) ≤ card(F ) = 2ℵ0 .
Si denotamos por Fσ la familia de todas las uniones numerables de conjuntos cerrados y por Gδ
la familia de todas las intersecciones numerables de conjuntos abiertos, resulta que
card(Gδ ) = 2ℵ0 = card(Fσ ).
(8) La cardinalidad de P, la colección de todos los subconjuntos perfectos de R, es 2ℵ0 .
Recordemos que un conjunto P ⊆ R es perfecto si él cerrado y todos sus puntos son puntos
de acumulación. Puesto que todo intervalo cerrado no degenarado es un conjunto perfecto (y
no-numerable) resulta que
2ℵ0 = card {[ x, 1] : x ∈ R, x < 1} ≤ card(P) ≤ card(Fc ) ≤ card(F ) = 2ℵ0 .
En la sección sobre cardinalidad habíamos informado que se podía demostrar que I, el conjunto de todos los números irracionales, tiene la misma cardinalidad que la de R. Aquí está una
prueba de ese hecho.
76
Cap. 1 Preliminares
Teorema 1.3.48. Si A es un subconjunto numerable de R, entonces
card(R \ A) = 2ℵ0 .
Prueba. Puesto que card(R × R ) = card(R ), podemos asumir que A ⊆ R × R. En este caso,
vamos a demostrar que
card (R × R ) \ A = 2ℵ0 .
Sea P : A → R la proyección sobre la primera coordenada, esto es, P( x, y) = x para todo
( x, y) ∈ A. Puesto que P es inyectiva, resulta que
ℵ0 = card( A) < card(R ) = 2ℵ0
y, por lo tanto, R \ P( A) 6= ∅.
A
X
P( A)
x0
R
Sea x0 ∈ R \ P( A). Claramente el conjunto X = { x0 } × R es disjunto al conjunto A y, en
consecuencia, X ⊆ (R × R ) \ A. Puesto que card( X ) = card(R ) = 2ℵ0 se tiene que
card(R × R \ A) ≥ 2ℵ0 .
Esto termina la prueba.
Una consecuencia inmediata del resultado anterior es que:
card(I ) = card(R \ Q ) = 2ℵ0 = card(R ).
1.3.9. La Hipótesis del Continuo
Con el descubrimiento de la existencia de infinitos niveles de infinitos: ℵ0 , ℵ1 , ℵ2 , . . . y que
ℵ0 < c, surgen dos preguntas fundamentales:
(1) ¿Es c el infinito no-numerable más pequeño?
(2) ¿Son el Método de la Diagonal de Cantor y los números ordinales los únicos modos de probar la
existencia de conjuntos no-numerables?
La respuesta a la primera pregunta persiste, hasta el sol de hoy, aun sin poder ni demostrarse,
ni refutarse, conociéndose dicho problema con el nombre de “la Hipótesis del Continuo”. Sin
embrago, como ya vimos anteriormente, el Método de la Diagonal y los números ordinales, no
son los únicos modos de probar la existencia de conjuntos no-numerables: el Teorema de Cantor,
la medida exterior de Lebesgue combinado con el Axioma de Elección, constituyen, entre otros,
medios para obtenerlos.
Sec. 1.3 El Axioma de Elección y sus Aliados
77
La primera formulación de Cantor de la Hipótesis del Continuo, conocida también como Hipótesis
del Continuo Débil, ocurrió en el año 1878 y es la siguiente: estando en conocimiento de que
ℵ 0 < 2ℵ 0 ,
¿existirá algún conjunto infinito A ⊆ R tal que ℵ0 < card( A) < c?
La Hipótesis del Continuo Débil afirma que un tal conjunto A no existe, en otras palabras:
cualquier subconjunto infinito de números reales, o es numerable, o posee la cardinalidad del continuo.
Hipótesis del Continuo Débil (CH). Si A es un subconjunto infinito de R, entonces,
card( A) = ℵ0
o
card( A) = c.
Algunos años más tarde, después de desarrollar su teoría de los números ordinales transfinitos, Cantor presenta esta otra forma de la Hipótesis del Continuo:
El conjunto R tiene la cardinalidad de todos los números ordinales numerables.
Finalmente, en 1890, después de desarrollar la noción de exponenciación entre números cardinales y su simbolismo: los alephs, y de demostrar que que ℵ0 < ℵ1 ≤ 2ℵ0 = c, él presenta su
tercera y última forma de la Hipótesis del Continuo:
Hipótesis del Continuo (CH). 2ℵ0 = ℵ1 .
Es decir, en la sucesión transfinita de cardinales no-numerables ℵ1 , ℵ2 . . ., la Hipótesis del Continuo afirma que 2ℵ0 = ℵ1 , es decir, c = 2ℵ0 es el primer cardinal no numerable.
0
1
···
ω
ω+1
···
ω+ω
· · · ω1
···
ω2
k
CH k
k
ℵ0
2ℵ 0 = ℵ 1
ℵ2
···
Trivialmente, la Hipótesis del Continuo implica la Hipótesis del Continuo Débil. La diferencia
entre ambas formas es relevante al Axioma de Elección: la Hipótesis del Continuo implica que el
conjunto de los números reales puede ser bien-ordenado, mientras que la Hipótesis del Continuo Débil no
la implica. De hecho, la Hipótesis del Continuo es equivalente a la Hipótesis del Continuo Débil
más la aceptación de la existencia de un buen-orden sobre R. Para efectos prácticos usaremos la
expresión “Hipótesis del Continuo” para referirnos a cualquiera de sus versiones.
Existe una versión generalizada de la Hipótesis del Continuo expresada del modo siguiente:
Hipótesis del Continuo Generalizada (GCH). 2ℵα = ℵα+1 para cualquier ordinal α.
La forma en que fue presentada la Hipótesis del Continuo Generalizada, supone ya al Axioma de
Elección, pero puede ser presentada sin hacer uso de ese axioma: Para cada cardinal infinito m, se
tiene que
si m < a < 2m entonces m = a o a = 2m .
78
Cap. 1 Preliminares
Una virtud de la Hipótesis del Continuo Generalizada, la cual hace la hace interesante, es que ella
da una solución completa al problema de computar am para cardinales infinitos simplificando
notablemente la exponenciación de los números cardinales. Por ejemplo, bajo la GCH, si a ≤ m,
entonces am = m+ .
1.3.10. Conjunto de Bernstein
El Principio del Buen-Orden en compañía de la Hipótesis del Continuo permiten construir
ciertos subconjuntos extraños en R. Por ejemplo, existe un subconjunto de R que tiene la
rara particularidad que tanto él, así como su complemento, intersectan a cualquier subconjunto
cerrado no-numerable de R. Tal conjunto se conoce con el nombre de Monstruo de Bernstein o,
simplemente, conjunto de Bernstein y su demostración se apoya en la Hipótesis del Continuo e
Inducción Transfinita.
Teorema 1.3.49 (Conjunto de Bernstein). En ZFC + CH existe un subconjunto no vacío B de R tal
que
F ∩ B 6= ∅
y
F ∩ (R \ B ) 6 = ∅
para cualquier subconjunto cerrado no-numerable F de R.
Prueba. Considere la familia Fc formada por todos los subconjuntos cerrados no-numerables de
R. Ya hemos visto que card(Fc ) = 2ℵ0 y como estamos asumiendo la Hipótesis del Continuo,
resulta que 2ℵ0 = ℵ1 . Esto nos indica que podemos indexar a dicho conjunto con los números
ordinales menores que ω1 , esto es, Fc = { Fα : α < ω1 }. Usaremos inducción transfinita para
construir a B. Para ello es necesario, invocando el Principio del Buen-Orden, asumir que R
está bien-ordenado y, por consiguiente, que cada Fα también lo está. Sean p1 , q1 los primeros
dos elementos de F1 . Fijemos un ordinal arbitrario α Scon 1 < α < ω1 y suponga que p β , q β
han sido construidos para todo β < α. Puesto que β<α { p β , q β } es numerable y Fα es noS
numerable, resulta que el conjunto Kα := Fα \ β<α { p β , q β } es no vacío y, por lo tanto, bienordenado. Seleccionemos ahora los dos primeros elementos de Kα , digamos pα , qα . El Principio
de Inducción Transfinita nos permite construir el conjunto { pα , qα : 1 ≤ α < ω1 }. Definamos
ahora B = { pα : α < ω1 }. Puesto que pα ∈ B ∩ Fα y qα ∈ (R \ B) ∩ Fα para cualquier α < ω1 y
como cualquier conjunto cerrado no-numerable es un Fα para algún α, resulta que el conjunto
B tiene las propiedades deseadas.
Observe que si B es conjunto de Bernstein también lo es R \ B. Más aun,
Corolario 1.3.50. Si B es conjunto de Bernstein, entonces cualquier conjunto cerrado F ⊆ B es,
necesariamente, numerable.
Prueba. Si F ⊆ B fuese no-numerable, entonces él debería contener puntos de R \ B lo que
resultaría imposible. Por esto, F es numerable.
En particular, B no contiene a ningún conjunto perfecto pues tales conjuntos son cerrados y
no-numerables (véase el Ejemplo TBC (4) en la página 139).
Nota Adicional 1.3.6 Similar al Axioma de Elección, la Hipótesis del Continuo es otro axioma
muy popular, importante y de gran impacto pues varios resultados fundamentales en Matemáticas sólo pueden ser demostrados si se acepta dicho axioma. Tal vez su popularidad
Sec. 1.3 El Axioma de Elección y sus Aliados
79
se deba a estos dos factores: el primero es la sencillez de su formulación, y el segundo por
ser el primero de los 23 problemas propuestos por David Hilbert en el famoso congreso de
matemáticas celebrado en París en el año 1900. Aun que esto último le confirió un privilegio
excepcional, dicha hipótesis también ha resultado ser muy polémica: ¿por qué c debe ser el
primer cardinal no numerable? La Hipótesis del Continuo no puede ser demostrada que es
verdadera ni tampoco que es falsa en el sistema ZFC. Por consiguiente, cualquier matemático tiene total y absoluta libertad de tomarla o dejarla, es decir, aceptarla como un axioma y
añadirselo al sistema ZFC para formar el nuevo sistema ZFC + CH, o rechazarla añadiendo
su negación a ZFC para obtener ZFC + ¬CH. Lo importante de esos dos sistemas es que en
1938 Kurt Gödel demostró, asumiendo la consistencia de ZFC, la consistencia del sistema
ZFC + CH y años más tarde Paul Cohen, en 1963, demostró la consistencia del sistema ZFC
+ ¬CH siempre que ZFC sea consistente. Sin embargo, ambos creían que dicha hipótesis
era falsa. Si bien es cierto que los trabajos de Gödel y Cohen permiten cierta tranquilidad en
cuanto a que una contradicción en uno de los dos sistemas produce de inmediato una contradicción en el otro, resulta que en definitiva la Hipótesis del Continuo aun sigue siendo
una materia pendiente.
¿Cuál es la relación entre GCH y AC? Se puede demostrar que AC no implica la CH ni la
GCH; sin embargo, vale la siguiente implicación: GCH ⇒ AC la cual fue demostrada por
primera vez por W. Sierpinski, aunque algunos años antes A. Tarski había anunciado la
misma implicación pero sin dar ningún indicio de su prueba (véase, por ejemplo, [62] para
una demostración de este hecho).
En 1883 Cantor introdujo la noción de conjunto bien-ordenado. Maravillado por las propiedades de tales conjuntos y, especialmente, por los “Alephs”, Cantor los concibe como una
“ley del pensamiento”, formulando su famoso Principio del Buen-Orden: Todo conjunto puede
ser bien-ordenado. Después de un tiempo y mucha reflexión Cantor cambia de opinión y cree
que dicho principio requiere de una demostración. Un pedacito de historia después del
Congreso en Paris en 1900 es la siguiente: en el Tercer Congreso de Matemáticas celebrado en Heidelberg en el año 1904, el matemático Gyula König quien también firmaba como
Julius König, ofreció una prueba, en presencia de Hilbert y el propio Cantor, que la Hipótesis del Continuo es falsa, es decir, que c no es un ℵ. En consecuencia, añadió König, la
afirmación de Cantor de que cualquier conjunto puede ser bien-ordenado también es falsa
ya que R no puede ser bien-ordenado. Cantor encontró devastador el argumento de König
pues utilizaba sólo herramientas cantorianas y no le fue posible encontrar ningún error en
esa demostración. Sin embargo, al día siguiente, según cuenta G. Kowaleswski, E. Zermelo
encontró un error en la demostración, aunque Ivor Grattan-Guinness y W. Purkert afirman
que fue Hausdorff, un tiempo después, quien encontró las fallas en la prueba ofrecida por
König. En cualquier caso, la conclusión es inequívoca: existía un error en la demostración
de König. Un mes después del Congreso de Heidelberg, Zermelo, quien también creía en la
afirmación de Cantor, escribió una carta a Hilbert, editor de la revista Mathematische Annalen para ese momento, en la cual demostraba el Teorema del Buen-Orden. Zermelo basó su
demostración sobre un nuevo postulado que, de inmediato, causó gran furor: el enigmático
Axioma de Elección o Axioma de Zermelo como también se le conoce. La demostración de
Zermelo generó una febril controversia en los siguientes cuatro años involucrando a matemáticos de Alemania, Inglaterra, Francia, Holanda, Hungría, Italia y los Estados Unidos de
América. Hilbert, sin embargo, le escribe a Borel pidiéndole que preparara una respuesta a
la prueba de Zermelo. La respuesta de Borel, la cual rechazaba la demostración de Zermelo,
80
Cap. 1 Preliminares
fue terminada el 1 de Diciembre de 1904. En ella Borel afirma lo siguiente: Lo que Zermelo
realmente muestra es que las siguientes dos proposiciones son equivalentes:
( A) El Teorema del Buen-Orden
( B) El Axioma de Elección
e insiste que Zermelo no ha demostrado que la equivalencia de ( A) y ( B) provee una solución
general al problema ( A).
1.4. Problemas
(1) Sean A, B, C, D conjuntos arbitrarios. Pruebe que
( a1 ) A △ B = B △ A
(b1 ) A △ ∅ = A
( c 1 ) A △ A = ∅.
( d1 ) A △ B = A c △ B c .
( e1 ) ( A △ B ) △ C = A △ ( B △ C ) .
( f 1 ) A ∩ ( B △ C ) = ( A ∩ B ) △ ( A ∩ C ).
( g1 ) ( A ∪ B ∪ C ) \ ( A ∩ B ∩ C ) = ( A △ B) ∪ ( B △ C ).
( h1 ) ( A ∪ B ) △ ( C ∪ D ) ⊆ ( A △ C ) ∪ ( B △ D ) .
(2) Sea A una familia arbitraria de conjuntos. Pruebe que
\ c
[ c
\
[
A
=
Ac
y
A
=
Ac
A ∈A
A ∈A
A ∈A
A ∈A
(3) Sean ( Aα )α∈ I y ( Bβ ) β∈ J familias de conjuntos. Demuestre que
[ [ [
Aα ×
Bβ =
Aα × Bβ ,
α∈ I
\
β∈ J
Aα
α∈ I
×
\
β∈ J
( α,β)∈ I × J
Bβ
=
\
( α,β)∈ I × J
Aα × Bβ .
(4) Sean f : X → Y una función y A una familia arbitraria de subconjuntos de X. Pruebe que
[ \ [
\
f
A =
f ( A)
y
f
A ⊆
f ( A ).
A ∈A
A ∈A
Demuestre que si f es inyectiva, entonces
\ \
f
A =
f ( A ).
A ∈A
A ∈A
A ∈A
A ∈A
Sec. 1.4 Problemas
81
(5) Sean f : X → Y una función. Pruebe que para cualquier conjunto A ⊆ X, f −1 ( f ( A)) = A
si, y sólo f es inyectiva. Similarmente, f es sobreyectiva si, y sólo si, f ( f −1 ( B)) = B para
todo B ⊆ Y.
(6) Sea A un conjunto numerable. Pruebe que la aplicación ϕ : Pfin ( A) → N definida por
j
j
j
ϕ({a j1 , . . . , a jn }) = p11 p22 · · · pnn
es biyectiva, donde {a j1 , . . . , a jn } ∈ Pfin ( A) y los números p1 , . . . , pn son los primeros n
números primos.
(7) Muestre que la aplicación ϕ : N × N → N dada por
ϕ(m, n) = 2m 3n
es inyectiva. Concluya, usando el Teorema 1.2.6, que N × N es numerable. La misma
conclusión se obtiene si definimos ϕ1 (m, n) = 2m−1 (2n − 1).
(8) Sea A ⊆ R n un conjunto numerable. Pruebe que cada uno de los siguientes conjuntos
x+A = x+a : a ∈ A
y
λ·A = λ·a : a ∈ A
es numerable para cada x ∈ R n y cada λ ∈ R.
(9) Sea I una familia disjunta de intervalos no-degenerados, es decir, ningún punto x = [ x, x]
pertenece a la familia. Demuestre que I es a lo más numerable.
(10) Pruebe que [0, 1] ∪ S es no-numerable para cualquier subconjunto S ⊆ R.
(11) Pruebe que el conjunto
E =
es numerable.
n
mn : m ∈ N, n ∈ Z
o
(12) Sea X un subconjunto numerable de R. ¿Existe algún a ∈ R tal que
( a + X ) ∩ X = ∅?
(13) Sea X un conjunto infinito. Si A es cualquier subconjunto finito de X, pruebe que X y
X \ A son equipotentes y, en consecuencia, card( X ) = card( X \ A).
(14) Demuestre que si X es un conjunto no-numerable y A es un conjunto a lo más numerable,
entonces card( X ) = card( X \ A).
(15) Pruebe que el conjunto Pol(R ) de todos los polinomios reales con coeficientes enteros es
numerable.
Q
ℵ0 es no-numerable.
(16) Pruebe que ∞
n =1 {0, 1} = 2
Q∞
(17) Demuestre que, si para cada n ∈ N, card( An ) = c, entonces card
n =1 A n = c.
(18) Sea A ⊆ R un conjunto no-numerable. Pruebe que existe un x ∈ R tal que A ∩ ( x, +∞) y
A ∩ (−∞, x) son ambos no-numerables.
82
Cap. 1 Preliminares
(19) Dos conjuntos A y B se dice que son casi-disjuntos si A ∩ B es finito. Pruebe que si X es un
conjunto numerable, entonces la familia Cdisj ( X ), formada por todos los subconjuntos de X que
son dos a dos casi-disjuntos, es no-numerable.
(20) El Hotel de Hilbert. Ya hemos podido constatar que con los conjuntos infinitos se está permito
hacer ciertas “operaciones” que no son posibles hacerlas con ningún conjunto finito. Veamos este
otro ejemplo. En una cierta ciudad nombrada ℵα , existe un famoso hotel llamado el Hotel
de Hilbert que dispone de infinitas habitaciones numeradas en el orden habitual: 1, 2, 3, . . .
Cierta noche llega a la ciudad un turista y se dirige raudo al Hotel de Hilbert en busca de
una habitación. Al llegar solicita al recepcionista (que no era matemático) una habitación y
éste inmediatamente le responde: - Lo sentimos mucho caballero, el hotel está “totalmente lleno”.
Cantor, quien para ese momento era el gerente del hotel, al oír al recepcionista le dice al
turista: Disculpe ud. al caballero, de inmediato lo ubicaremos en una habitación. El recepcionista,
sorprendido e incrédulo por la respuesta de su jefe, se pregunta a asimismo: ¿y cómo diablos
le va a dar una habitación a ese caballero si todas las habitaciones están ocupadas? A lo
mejor echa a la calle a alguien. Cantor toma el micrófono de la recepción y gentilmente le
informa a sus huéspedes, pidiendo las disculpas de rigor, que deben abandonar su actual
habitación y alojarse en la siguiente. De este modo, el huésped que ocupaba la habitación
número 1 se muda a la 2, el que ocupaba la habitación número 2 se mueve a la número
3 y así sucesivamente. Completada la orden queda la habitación número 1 desocupada y
Cantor, esbozando una picara sonrisa, le hace entrega de dicha habitación al turista quien
muy complacido por la forma en que Cantor había resuelto el problema le extiende la mano
en agradecimiento. No habían transcurrido 5 minutos cuando por el lobby del hotel aparecen
30 nuevos turistas solicitando cada uno de ellos una habitación y el recepcionista vuelve a
responder: el hotel está lleno, pero permítanme llamar a mi jefe que él es matemático y a lo mejor sabe
cómo darle habitaciones a todos ustedes. Así fue, llegó Cantor y de nuevo resolvió el problema
sin “echar a nadie a la calle” y dándole habitación a cada uno de los 30 turistas. Pues bien,
el problema no para allí. Una hora después aparecieron infinitos turistas (por supuesto, en
una cantidad numerable) solicitando habitaciones. De nuevo hace su aparición Cantor y le
da habitaciones a todos los recién llegados sin dejar sin habitación a los anteriores inquilinos.
¿Sabe ud. cómo lo hizo Cantor?
(21) Demuestre que si α y β son cardinales, entonces:
( a) α ≤ α β si β > 0.
(b) α ≤ βα si β > 1.
β
β
(c) Si α1 ≤ α2 y β1 ≤ β2 , entonces α1 1 ≤ α2 2 .
(22) Demuestre que en ZF el Axioma de Elección, el Lema de Zorn y el Principio del Buen-Orden
son equivalentes.
(23) Use el Principio del Buen-Orden para dar una prueba del Teorema Fundamental de la Aritmética.
(24) Demuestre que el Axioma de Elección no implica la Hipótesis del Continuo.
CAPÍTULO
2
Los Números Reales
2.1. Algunas Propiedades de los Números Reales
Confiamos en que el lector posee cierta experiencia con el sistema de los números reales R
por lo que no le dedicaremos tiempo a su construcción. En particular, asumiremos familiaridad
con el conjunto de todos los números enteros,
Z = . . . , −3, −2, −1, 0, 1, 2, 3, . . . ,
con el conjunto de todos los números naturales, también llamado, enteros positivos,
N = 1, 2, 3, . . . ,
con el conjunto de todos los números racionales
Q = p/q : p ∈ Z, q ∈ N ,
y su complemento, I = R \ Q, el conjunto de todos los números irracionales. En lo que sigue
escribiremos N0 = N ∪ {0}. También asumiremos el conocimiento de las propiedades del orden
en R.
2.1.1. Principio de Arquímedes
Recordemos que, dado cualquier número real x, llamamos la parte entera de x al único
entero [ x] definido por:
[ x] = máx Z ∩ (−∞, x] = máx z ∈ Z : z ≤ x ,
es decir, [ x] es el mayor entero menor o igual a x. Observe que [ x] queda completamente determinado por las dos propiedades siguientes:
[ x] ∈ Z
y
x − 1 < [ x] ≤ x,
( 1)
84
Cap. 2 Los Números Reales
o de modo equivalente,
y
[ x] ∈ Z
así,
[ x] ≤ x < [ x] + 1.
Fijemos un x ∈ R y considere cualquier n ∈ N. Se sigue de (1) que nx − 1 < [nx] ≤ nx y
1
[nx]
<
≤ x.
n
n
De esto último, tomando límite cuando n → ∞, se tiene que
x−
x = lı́m
n→∞
[nx]
.
n
Puesto que x fue elegido de modo arbitrario y la sucesión ([nx]/n)∞
n =1 es una sucesión de
números racionales convergiendo a x, resulta que Q es denso en R.
Teorema 2.1.1 (Principio de Arquímedes). Si a y b son números reales positivos, entonces existe
un entero positivo n tal que na > b.
Prueba. Puesto que b/a > 0, resulta que 1 + b/a > 1 y, por consiguiente,
b
n = 1+
a
es un entero ≥ 1. Se sigue de la definición de parte entera que
b
b
n > 1+
−1 =
a
a
y puesto que a > 0, resulta entonces que na > b y termina la prueba.
Cuando a y b son enteros positivos, el Principio del Buen-Orden también puede ser usado
para dar otra demostración del Principio de Arquímedes. En efecto, suponga que la conclusión
es falsa. Entonces na ≤ b para todo n ∈ N. Considere el conjunto
S = b − na : n ∈ N .
Resulta que S consiste sólo de enteros positivos y, en consecuencia, por el Principio del BuenOrden él posee un primer elemento el cual denotaremos por k. De esto se sigue que existe un
único m ∈ N tal que
k = b − ma
y
b − ma < b − na
para todo n 6= m.
Puesto que b − (m + 1) a ∈ S, se tiene que
b − (m + 1) a = (b − ma) − a < b − ma
lo cual contradice la elección de b − ma. Esta contradicción establece el resultado.
Corolario 2.1.2. Si ε > 0, entonces existe un entero positivo n tal que 1/n < ε.
Prueba. Basta tomar a = ε y b = 1 en el teorema anterior.
Teorema 2.1.3. Sean x, y ∈ R. Si para cada ε > 0 ocurre que x < y + ε, entonces x ≤ y.
Prueba. Si suponemos que x > y, entonces el número ε = x − y > 0 debería satisfacer la
desigualdad x < y + ε = y + ( x − y) = x, lo que resulta ser un disparate. Por esto, x ≤ y.
Sec. 2.1 Algunas Propiedades de los Números Reales
85
2.1.2. Conjuntos Acotados
Sean a, b ∈ R con a < b. Recordemos que un intervalo
conjunto de la forma
( a, b) = x ∈ R : a < x < b
[a, b] = x ∈ R : a ≤ x ≤ b
( a, b] = x ∈ R : a < x ≤ b
[a, b) = x ∈ R : a ≤ x < b
con extremos a y b es cualquier
,
,
,
.
A tales intervalos los llamaremos intervalos de longitud finita o, simplemente, intervalos finitos.
Algunas veces también los denominaremos intervalos acotados. Por otro lado, los intervalos no
acotados o de longitud infinita se definen como
( a, +∞) = x ∈ R : a < x ,
[a, +∞) = x ∈ R : a ≤ x ,
(−∞, b] = x ∈ R : x ≤ b ,
(−∞, b) = x ∈ R : x < b .
También se acostumbra a escribir R = (−∞, +∞). Convenimos en definir ( a, a) = ( a, a] =
[a, a) = ∅ para cualquier a ∈ R. Un intervalo finito y cerrado se llama degenerado si es de
la forma [ a, a] = {a} para algún a ∈ R. Un intervalo finito I con extremos a y b es nodegenerado si a < b o b < a. La longitud de cualquier intervalo acotado I con extremos a y b,
se define como
ℓ( I ) = b − a.
Si I no es acotado pondremos ℓ( I ) = +∞. Suponga que G = I1 ∪ · · · ∪ In es la unión de n
intervalos acotados disjuntos dos a dos, entonces convenimos en definir la longitud de G como:
ℓ( G ) = ℓ( I1 ) + · · · + ℓ( In ).
Si algún ℓ( Ii ) = +∞, entonces escribiremos ℓ( G ) = +∞.
Definición 2.1.4. Un subconjunto A de R se dice que está acotado superiormente si existe una constante M tal que A ⊆ (−∞, M ], es decir, a ≤ M para todo a ∈ A.
Cualquier número real M para el cual a ≤ M para todo a ∈ A, se llama una cota superior
de A. Observe que el número M puede o no estar en A. Similarmente, si existe un número
N tal que N ≤ a para todo a ∈ A, entonces diremos que A está acotado inferiormente. A un
tal N se le llama una cota inferior de A. Si el conjunto A está acotado tanto inferiormente así
como superiormente, entonces diremos que A está acotado. En este caso, existen m, M ∈ R
tal que A ⊆ [m, M ]. Si A no está acotado superiormente (respectivamente, no está acotado
inferiormente), escribiremos sup A = + ∞ (respectivamente, ı́nf A = − ∞).
Sea X un conjunto no vacío y sea f : X → R una función. Diremos que f está acotada sobre
X si el conjunto f ( X ) está acotado. Observe que si f está acotada sobre X, entonces, por lo
dicho anteriormente, existen m, M ∈ R tales que f ( X ) ⊆ [m, M ], esto es,
m ≤ f ( x) ≤ M
para todo x ∈ X.
86
Cap. 2 Los Números Reales
Equivalentemente, decir que f está acotada sobre X significa que existe una constante K > 0 tal
que | f ( x)| ≤ K para todo x ∈ X. En lo que sigue, el símbolo B∞ ( X ) lo usaremos para denotar
el conjunto de todas las funciones f : X → R que están acotadas sobre X; esto es:
B∞ ( X ) = f ∈ R X : f está acotada sobre X .
Es fácil ver que si f , g ∈ B∞ ( X ) y a ∈ R, entonces f + g y a · f permanecen en B∞ ( X ); es
decir, B∞ ( X ) es un espacio vectorial sobre R.
Definición 2.1.5. Sea A un subconjunto no vacío de R. Un número real a0 se dice que es el supremo
de A, que escribiremos a0 = sup A, si las siguientes dos condiciones se cumplen:
(sup1 ) x ≤ a0 para todo x ∈ A, y
(sup2 ) si M ∈ R es tal que x ≤ M para todo x ∈ A, entonces a0 ≤ M.
Observe que si a0 = sup A, entonces la condición (sup1 ) de la definición anterior dice que A
está acotado superiormente, mientras que la condición (sup2 ) establece que a0 es la menor de todas
las cotas superiores de A. Si el número a0 = sup A pertenece al conjunto A, entonces diremos que
a0 es el máximo, el mayor o el más grande elemento de A.
La notación
sup x = sup x : x ∈ A = sup A
x∈ A
se usará indistintamente en estas notas. Por ejemplo, si An = { xn , xn+1 , . . . }, escribiremos
sup x j = sup An .
j≥ n
Una manera sencilla de identificar el supremo de un conjunto (cuando éste existe) es por
medio del siguiente resultado.
Teorema 2.1.6. Sea A un subconjunto de R no vacío y acotado superiormente. Entonces a0 = sup A
si, y sólo si,
( a) x ≤ a0 para todo x ∈ A, y
(b) dado ε > 0, existe x ∈ A tal que a0 − ε < x.
Prueba. Suponga que a0 = sup A es finito. Entonces, por la definición de supremo, se sigue que
( a) se cumple. Para demostrar (b), asuma que la conclusión es falsa, es decir, que a0 − ε ≥ x
para todo x ∈ A. Esto último significa que a0 − ε es una cota superior y se sigue, usando (sup2 ),
que a0 < a0 − ε, lo cual es imposible. Por esto, (b) también se cumple.
Recíprocamente, suponga que ( a) y (b) se satisfacen y sea a1 una cota superior de A, esto
es, x ≤ a1 para todo x ∈ A. Vamos a demostrar que a0 ≤ a1 . En efecto, dado ε > 0, usemos
(b) para obtener un x ∈ A tal que a0 − ε < x. Ahora bien, como x ≤ a1 , resulta que a0 < a1 + ε
y, en consecuencia, por el Teorema 2.1.3 tenemos que a0 ≤ a1 .
El ínfimo de un subconjunto A no vacío y acotado inferiormente de R, ı́nf A, se define de
manera similar a la del supremo, es decir, b0 = ı́nf A ∈ R significa que se cumplen las siguientes
condiciones:
Sec. 2.1 Algunas Propiedades de los Números Reales
87
(Inf1 ) b0 ≤ x para todo x ∈ A, es decir, A está acotado inferiormente, y
(Inf2 ) si b ∈ R es tal que b ≤ x para todo x ∈ A, entonces b ≤ b0 . Esto último significa que b0 es
la mayor de todas las cotas inferiores de A.
Si b0 = ı́nf A pertenece al conjunto A, entonces diremos que b0 es el mínimo, el menor o
el más pequeño elemento de A. Similar al caso del supremo también escribiremos, en algunos
casos, ı́nfa∈ A a en lugar de ı́nf A.
Teorema 2.1.7. Sea A un subconjunto de R no vacío y acotado inferiormente. Entonces b0 = ı́nf A
si, y sólo si,
( a) b0 ≤ x para todo x ∈ A, y
(b) dado ε > 0, existe x ∈ A tal que x < b0 + ε.
Prueba. Es similar a la del Teorema 2.1.6 y, por consiguiente, se omite.
De modo similar al supremo de un conjunto, si b0 = ı́nf A, entonces existe una sucesión
( xn ) ∞
n =1 en A tal que
b0 = lı́m xn .
( 3)
n→∞
Se sigue de la definición que, si A y B son subconjuntos no vacíos y acotados de R, entonces
A ⊆ B
⇒
−∞ < ı́nf B ≤ ı́nf A ≤ sup A ≤ sup B < +∞.
Definición 2.1.8. Sean A y B subconjuntos no vacíos de R. Diremos que ellos que están ordenadamente separados si
a ≤ b para todo a ∈ A y todo b ∈ B.
Por ejemplo, si α ≤ β, entonces A = (−∞, α) y B = ( β, +∞) están ordenadamente separados. Un resultado que es fundamental, entre otras cosas, para definir la integral de Riemann por
medio de las sumas de Darboux es el siguiente.
Teorema 2.1.9. Sean A y B subconjuntos no vacíos y acotados de R ordenadamente separados.
Entonces
( a) sup A ≤ ı́nf B.
(b) sup A = ı́nf B si, y sólo si, para cada ε > 0, existen aε ∈ A y bε ∈ B tales que
bε − aε < ε.
Prueba. ( a) Fijemos a ∈ A. Entonces, por la hipótesis, a ≤ b para todo b ∈ B lo cual significa
que a es una cota inferior para B y, así, a ≤ ı́nf B para cualquier a ∈ A. Esto, por supuesto,
significa que ı́nf B es una cota superior para A y, en consecuencia, sup A ≤ ı́nf B.
(b) Suponga que sup A = ı́nf B y sea ε > 0. Puesto que sup A − ε/2 < sup A, se sigue de las
propiedades del supremo que existe un aε ∈ A tal que sup A − ε/2 < aε ≤ sup A. Similarmente,
de las propiedades del ínfimo, podemos elegir un bε ∈ B tal que ı́nf B ≤ bε < ı́nf B + ε/2.
Finalmente, si definimos δ = ı́nf B = sup A, tendremos que
δ ≥ aε > δ −
ε
2
y
ε
δ ≤ bε < δ + ,
2
88
Cap. 2 Los Números Reales
de donde se sigue que 0 < bε − aε < (δ + ε/2) − (δ − ε/2) = ε.
Sea ε > 0 y suponga que existen aε ∈ A y bε ∈ B tal que bε − aε < ε. Puesto que bε ≥ ı́nf B
y aε ≤ sup A, resulta que
ı́nf B − sup A ≤ bε − aε < ε.
Como ε > 0 es arbitrario, resulta que ı́nf B ≤ sup A y así, gracias a la primera parte, se concluye
que sup A = ı́nf B y termina la prueba.
Definición 2.1.10. Sean ahora A y B subconjuntos no vacíos de R y definamos la suma y el producto
algebraico de A y B como:
A + B = a + b : a ∈ A, b ∈ B
AB = ab : a ∈ A, b ∈ B
Si A = {λ} para algún λ ∈ R, escribiremos λB en lugar de {λ} B y − B en lugar de (−1) B.
Similarmente, escribiremos A − B en lugar de A + (− B). Observe que por la conmutatividad
de la suma y el producto en R, se tiene que
y
A+ B = B+ A
AB = BA.
Teorema 2.1.11. Sea A ⊆ R no vacío y acotado. Entonces
sup(− A) = − ı́nf A
y
ı́nf(− A) = − sup A.
Prueba. Suponga que a0 = ı́nf A y sea ε > 0 elegido arbitrariamente. Escojamos un a ∈ A tal
que a < a0 + ε. Entonces − a > − a0 − ε y puesto que − a ∈ − A, resulta que sup(− A) ≥ − a >
− a0 − ε. Esto prueba que − sup(− A) < a0 + ε para cada ε > 0, de donde se sigue, invocando
al Teorema 2.1.3, que − sup(− A) ≤ ı́nf A, esto es,
sup(− A) ≥ − ı́nf A.
Por otro lado, a ∈ − A implica que − a ∈ A y, en consecuencia, − a ≥ ı́nf A, es decir, a ≤ − ı́nf A,
de donde se deduce que
sup(− A) ≤ − ı́nf A.
La demostración de la segunda afirmación es inmediata si se intercambia A por − A en la prueba
de la igualdad anterior.
Diremos que A ⊆ R es un conjunto no-negativo si a ≥ 0 para todo a ∈ A.
Teorema 2.1.12. Si A y B subconjuntos no vacíos y acotados superiormente de R, entonces A + B
y AB también son acotados superiormente y se cumple que:
(11 ) sup ( A + B) = sup A + sup B.
(22 ) sup ( AB) = sup A sup B si A y B son no-negativos. En particular,
sup (λA) = λ sup A.
siempre que λ ∈ R + .
Sec. 2.1 Algunas Propiedades de los Números Reales
89
Prueba. Sean a0 = sup A y b0 = sup B y notemos que, por definición,
a ≤ a0
para todo a ∈ A
y
b ≤ b0
para todo b ∈ B.
(2.1.1)
( a) De las dos desigualdades anteriores se sigue que
a + b ≤ a0 + b0
para todo a ∈ A y todo b ∈ B lo cual implica que a0 + b0 es una cota superior de A + B. Por
consiguiente,
sup ( A + B) ≤ a0 + b0 = sup A + sup B.
Fijemos ε > 0 y escojamos, haciendo uso del Teorema 2.1.6, un a ∈ A y un b ∈ B de modo tal
que
ε
ε
a0 −
< a
y
b0 −
< b.
2
2
Entonces a + b ∈ A + B y se cumple que
ε
ε
a0 + b0 − ε = a0 −
+ b0 −
< a + b.
2
2
Un nuevo llamado al Teorema 2.1.6 nos revela que sup ( A + B) = sup A + sup B.
(b) Si a0 b0 = 0, entonces entonces uno de ellos es cero. Suponga que a0 = 0. Como A es
no-negativo resulta que 0 ≤ a ≤ a0 para todo a ∈ A y, en consecuencia, A = {0}. Por esto,
AB = {0} y, así, sup ( AB) = 0 = (sup A)(sup B). Consideremos ahora el caso cuando a0 b0 > 0.
Por (2.1.1) tenemos que ab ≤ a0 b0 para todo a ∈ A y todo b ∈ B de modo que a0 b0 es una
cota superior de AB. Fijemos ε > 0 y escojamos un δ > 0 que satisfaga 0 < δ < ε/( a0 + b0 ).
Invoquemos de nuevo al Teorema 2.1.6 para escoger un a ∈ A y un b ∈ B que cumplan
a0 − δ < a
Ahora,
y
b0 − δ < b.
ab > ( a0 − δ)(b0 − δ) = a0 b0 − ( a0 + b0 )δ + δ2 > a0 b0 − ε
de donde se sigue, gracias al Teorema 2.1.6, que sup( AB) = (sup A)(sup B). En el caso particular
cuando B = {λ}, se tiene que sup (λA) = λ sup A.
Observe que si A y B son subconjuntos de R acotados inferiormente, entonces (imitando la
prueba del resultado anterior) se cumple que
ı́nf ( A + B) = ı́nf A + ı́nf B
y, en consecuencia, si A y B son subconjuntos acotados de R, entonces A + B también es acotado.
Es importante destacar que si A ⊆ R es acotado, entonces por lo que acabamos de ver, el
conjunto A − A también lo es y 0 ∈ A − A. Más aun, A − A es un conjunto simétrico en el
sentido de que
z ∈ A − A ⇔ −z ∈ A − A.
En efecto, x − y ∈ A − A si, y sólo si, −( x − y) = y − x ∈ A − A cualesquiera sean x, y ∈ A. De
esto se sigue que x − y ∈ A − A si, y sólo si, | x − y| ∈ A − A y, por lo tanto,
sup( A − A) = sup | x − y| : x, y ∈ A .
90
Cap. 2 Los Números Reales
Corolario 2.1.13. Si A ⊆ R es no vacío y acotado, entonces
sup A − ı́nf A = sup | x − y| : x, y ∈ A .
Prueba. Por la observación anterior, el Teorema 2.1.11 y el Teorema 2.1.12, tenemos que
sup | x − y| : x, y ∈ A = sup( A − A)
= sup A + (− A)
= sup A + sup(− A)
= sup A − ı́nf A.
La prueba es completa.
El siguiente axioma, conocido como el Axioma de Completitud de R, o también como el
Axioma del Supremo, es el que permite que R sea, realmente, un conjunto extraordinariamente
especial.
Definición 2.1.14 (Axioma del Supremo). Cualquier subconjunto no vacío A de R acotado superiormente posee un supremo.
Por ejemplo, si consideramos el conjunto A = { x ∈ R : x2 < 2}, entonces A 6= ∅ ya que,
por ejemplo, 1 ∈ A. Además, A está acotado superiormente por 2. Se sigue
√ del Axioma del
Supremo que a0 = sup A existe. Es un ejercicio cotidiano verificar que a0 = 2. Sin embargo,
si reemplazamos a R por Q, el Axioma del Supremo no es válido. En efecto, si tomamos
A = { x ∈ Q : x2 < 2}, resulta que A es no vacío y acotado superiormente, pero sup A no existe
en Q.
Puesto que la relación sup(− A) = − ı́nf A se cumple para cualquier conjunto no vacío
A ⊆ R, y ya que el conjunto A está acotado inferiormente si, y sólo si, − A está acotado
superiormente, se sigue entonces del Axioma del Supremo que:
Corolario 2.1.15 (Axioma del Ínfimo). Cualquier subconjunto no vacío A de R acotado inferiormente posee un ínfimo.
Una bonita aplicación del Axioma del Supremo la constituye la siguiente caracterización de
los intervalos de R.
Lema 2.1.16. Sea I ⊆ R. Si para cada x, y ∈ I con x < y, ocurre que el intervalo abierto ( x, y) ⊆ I,
entonces I es un intervalo.
Prueba. Suponga, en primer lugar, que I es acotado y sean
a = ı́nf I
y
b = sup I.
Entonces I ⊆ [ a, b]. Vamos a demostrar que ( a, b) ⊆ I. En efecto, sea c ∈ ( a, b). Puesto que
ı́nf I = a < c, se sigue del Teorema 2.1.7 que existe un x ∈ I tal que a ≤ x < c. Similarmente,
como c < b = sup I, el Teorema 2.1.6 nos revela la existencia de un y ∈ I tal que c < y ≤ b.
La combinación de los dos hechos anteriores nos dice que x, y ∈ I con x < y y, así, invocando
nuestra hipótesis tenemos que c ∈ ( x, y) ⊆ I. Esto prueba que ( a, b) ⊆ I ⊆ [ a, b] y, entonces I es
un intervalo.
Los otros casos, por ejemplo, si I está acotado inferiormente pero no superiormente o viceversa, o si I no está acotado, se dejan como ejercicio al lector.
Como una consecuencia del resultado anterior se tiene que
Sec. 2.1 Algunas Propiedades de los Números Reales
91
Corolario
2.1.17. Si ( Iα )α∈S
D es una familia de intervalos de R y si existe al menos un a ∈ R tal que
T
a ∈ α∈ D Iα , entonces I = α∈ D Iα es un intervalo.
Prueba. Sean x, y ∈ I arbitrarios con x < y. De acuerdo al Lema 2.1.16 es suficiente demostrar
que ( x, y) ⊆ I. Ahora bien, como x, y ∈ I, existen α, β ∈ D tales que x ∈ Iα y y ∈ Iβ .
Consideremos los siguientes casos:
( a) Si y ≤ a, entonces ( x, y) ⊆ ( x, a) ⊆ Iα ⊆ I.
(b) Si a ≤ x, entonces ( x, y) ⊆ ( a, y) ⊆ Iβ ⊆ I.
(c) Si x < a < y, entonces ( x, y) ⊆ ( x, a] ∪ [a, y) ⊆ Iα ∪ Iβ ⊆ I.
En cualquier caso ( x, y) ⊆ I y termina la prueba.
2.1.3. Límites
La noción de límite es la noción básica del Análisis. Es esa noción la que separa el Análisis del
Álgebra. Intuitivamente, decir que una sucesión ( xn )∞
n =1 de números reales converge a un límite
L significa que eventualmente casi-todos los términos de la sucesión están, tanto como se desee,
muy próximos al número L.
Definición 2.1.18. Un número real L es el límite de una sucesión de números reales ( xn )∞
n =1 si, para
cada ε > 0, existe un entero N ≥ 1 tal que
xn − L < ε
para todo n ≥ N.
En este caso se dice que la sucesión converge a L y se escribe lı́m xn = L.
n→∞
Una sucesión ( xn )∞
n =1 se dice que diverge si ella no converge. Es conocido y fácil de establecer
que el límite de una sucesión es único.
∞
Teorema 2.1.19. Sea ( xn )∞
n =1 una sucesión de números reales. Si ( xn ) n =1 converge, entonces el conjunto { xn : n ∈ N } es acotado.
Prueba. Sea L = lı́mn→∞ xn . Tomando ε = 1, resulta de la definición de límite, que existe un
N ∈ N tal que | xn − L| < 1 para todo n ≥ N. En otras palabras,
L − 1 < xn < L + 1 para todo n ≥ N.
Si ahora definimos M = máx{ x1 , . . . , x N −1 , L + 1} y m = mı́n{ x1 , . . . , x N −1 , L − 1}, resultará que
m ≤ xn ≤ M
para todo n ∈ N.
Fin de la prueba.
Las propiedades algebraicas básicas de las sucesiones de números reales son las siguientes:
92
Cap. 2 Los Números Reales
∞
Teorema 2.1.20. Sean ( xn )∞
xn = L y
n =1 y ( yn ) n =1 sucesiones en R tales que nlı́m
→∞
Entonces
lı́m yn = M.
n→∞
( a) lı́m ( xn + yn ) = L + M,
n→∞
(b) lı́m αxn = αL para cualquier α ∈ R,
n→∞
(c) lı́m xn yn = LM, y
n→∞
(d) lı́m
n→∞
xn
L
=
siempre que M 6= 0.
yn
M
Prueba. Los detalles se dejan a cargo del lector.
Teorema 2.1.21. Sea A un subconjunto de R no vacío y acotado superiormente. Si a0 = sup A,
entonces existe una sucesión ( xn )∞
n =1 en A tal que
a0 = lı́m xn .
n→∞
Prueba. Por cada entero n ≥ 1, seleccione, usando el Teorema 2.1.6, un punto xn ∈ A tal que
a0 − 1/n < xn . De esto se sigue que
a0 −
1
1
< x n ≤ a0 < a0 +
n
n
y, así, | xn − a0 | < 1/n para todo n ≥ 1. Tomando límite cuando n → ∞ queda establecido el
resultado.
2.1.4. El Teorema de Bolzano-Weierstrass
Recordemos que una sucesión ( xn )∞
n =1 en R está acotada si el conjunto { x1 , x2 , . . . } está
acotado, es decir, si existe una constante M > 0 tal que | xn | ≤ M para todo n ≥ 1.
Definición 2.1.22. Una sucesión ( xn )∞
n =1 se dice que es monótona creciente, o simplemente, creciente,
si
x1 ≤ x2 ≤ · · · ≤ x n ≤ · · ·
y es monótona decreciente, o decreciente, si
x1 ≥ x2 ≥ · · · ≥ x n ≥ · · ·
Si las desigualdades son estrictas en ambos casos, en la definición anterior, entonces diremos que la sucesión es estrictamente creciente y estrictamente decreciente, respectivamente. En
ocasiones se usará la expresión ( xn )∞
n =1 es monótona no-decreciente en lugar de monótona creciente. Similarmente, ( xn )∞
es
monótona
no-creciente se usa como sinónimo de monótona
n =1
decreciente. Una sucesión se dice que es monótona si ella es monótona creciente o monótona
decreciente.
Uno de los resultados fundamentales que garantiza la convergencia de una sucesión acotada
es el siguiente.
Sec. 2.1 Algunas Propiedades de los Números Reales
93
∞
Teorema 2.1.23. Sea ( xn )∞
n =1 una sucesión acotada en R. Si ( xn ) n =1 es monótona, entonces ella
converge. En particular,
(i) lı́m xn = sup xn si ( xn )∞
n =1 es creciente.
n→∞
n ≥1
(ii) lı́m xn = ı́nf xn si ( xn )∞
n =1 es decreciente.
n→∞
n ≥1
Prueba. (i). Suponga que ( xn )∞
n =1 es acotada y monótona creciente. Sea a = sup A, donde
hemos puesto A = { xn : n ∈ N }. Dado ε > 0, por el Teorema 2.1.6, existe un xn0 ∈ A tal
que a − ε < xn0 . Ahora bien, como nuestra sucesión es creciente, resulta que xn0 ≤ xn para todo
n ≥ n0 y entonces, haciendo uso del hecho de que xn ≤ a = sup A para todo n ∈ N, podemos
concluir que
a − ε < xn0 ≤ xn ≤ a < a + ε para todo n ≥ n0 ,
es decir, | xn − a| < ε para todo n ≥ n0 . Esto prueba que la sucesión ( xn )∞
n =1 converge a a y,
por lo tanto,
lı́m xn = a = sup xn .
n→∞
n ∈N
Si la sucesión
es acotada y monótona decreciente, entonces (− xn )∞
n =1 es una sucesión
monótona creciente y se sigue de lo anterior y el Teorema 2.1.11 que
( xn ) ∞
n =1
− lı́m xn = lı́m (− xn ) = sup(− xn ) = − ı́nf xn .
n→∞
n→∞
n ∈N
n ∈N
y termina la prueba.
∞
Si ( xn )∞
n =1 es una sucesión en R y si ( n k ) k=1 es una sucesión estrictamente creciente de enteros
positivos
n1 < n2 < · · · < n k < · · ·
∞
entonces la sucesión ( xnk )∞
k=1 se llama una subsucesión de ( xn ) n =1 . Resulta interesante observar
que:
( a) Si (nk )∞
k=1 es una sucesión estrictamente creciente de enteros positivos, entonces n k ≥ k para
todo k ≥ 1.
(b) Si ( xn )∞
n =1 es una sucesión monótona acotada, entonces cualquier subsucesión de ella hereda
esa propiedad.
(c) Si ( xn )∞
n =1 es una sucesión que converge a un punto a ∈ R, entonces cualquier subsucesión
de ella también converge y lo hace hacia el mismo punto a.
Teorema 2.1.24. Cualquier sucesión ( xn )∞
n =1 en R posee una subsucesión monótona.
Prueba. Considere el siguiente conjunto
D =
n ∈ N : xn ≤ xk para todo k ≥ n .
Por supuesto, sólo existen dos posibilidades para el conjunto D: que sea finito o infinito.
94
Cap. 2 Los Números Reales
( a) Si D es finito, sea n0 = máx D. Observe que si n es cualquier número natural tal que
n > n0 , entonces n 6∈ D y, en consecuencia, por la definición de D, existe un kn ≥ n tal que
xn > xkn . Esto es,
para cada n > n0 , existe kn ≥ n tal que xn > xkn .
(∗)
Vamos a usar lo anterior para obtener de ( xn )∞
n =1 una subsucesión decreciente. En efecto, como
n0 + 1 6∈ D, existe, por (∗), un n1 > n0 + 1 tal que xn0 +1 > xn1 . De nuevo, como n1 > n0 ,
existe un n2 > n1 tal que xn1 > xn2 . Suponga que hemos construido n1 < n2 < · · · < nk tal que
xn j > xn j+1 para todo j < k. Una vez más, como nk 6∈ D, existe, por (∗), un nk+1 > nk tal que
∞
xnk > xnk +1 . Es claro que (nk )∞
k=1 es una sucesión estrictamente creciente y que ( xn k ) k=1 es una
subsucesión decreciente de ( xn )∞
n =1 .
(b) Suponga que D es infinito. Se sigue del Teorema 1.2.5 que D se puede representar por una
sucesión estrictamente creciente, digamos,
n1 < n2 < · · · < n k < · · ·
∞
Es claro, por la definición de D, que ( xnk )∞
k=1 resulta ser una subsucesión creciente de ( xn ) n =1 .
La prueba es completa
El siguiente resultado es poderosamente importante ya que establece una condición suficiente
para la existencia de subsucesiones convergentes.
Teorema 2.1.25 (Bolzano-Weierstrass). Si ( xn )∞
n =1 es una sucesión acotada en R, entonces ella posee una subsucesión convergente.
Prueba. Usemos el Teorema 2.1.24 para seleccionar una subsucesión monótona ( xnk )∞
k=1 , de la
∞
sucesión acotada ( xn )∞
.
Como
(
x
)
también
es
acotada,
necesariamente
ella
converge
n
k k=1
n =1
gracias al Teorema 2.1.23.
Definición 2.1.26. Una sucesión ( xn )∞
n =1 en R se dice que es una sucesión de Cauchy si, para cada
ε > 0, existe un N ∈ N tal que
| xn − xm | < ε para todo m, n ≥ N.
Teorema 2.1.27. Si ( xn )∞
n =1 es una sucesión de Cauchy en R, entonces ella es acotada.
Prueba. Para ε = 1, existe un N ∈ N tal que | xn − xm | < 1 para todo m, n ≥ N. En particular,
| xn − x N | < 1 para todo n ≥ N.
de donde se obtiene que
| xn | < 1 + | x N | para todo n ≥ N.
Finalmente, si hacemos M = máx{| x1 |, | x2 |, . . . , | x N −1 |, 1 + | x N |} vemos que
| xn | ≤ M para todo n ∈ N
lo cual prueba que la sucesión ( xn )∞
n =1 es acotada.
Otro hecho interesante es el siguiente:
Sec. 2.1 Algunas Propiedades de los Números Reales
95
∞
Teorema 2.1.28. Si ( xn )∞
n =1 es una sucesión de Cauchy la cual posee una subsucesión ( xn k ) k=1 que
converge a algún punto x ∈ R, entonces xn → x.
Prueba. Sea ε > 0 y seleccione un k0 ∈ N, usando el hecho de que xnk → x, tal que
| xnk − x| < ε/2 para todo k ≥ k0 .
( 1)
Por otro lado, como ( xn )∞
n =1 es de Cauchy, existe un N ∈ N tal que
| xn − xm | < ε/2 para todo m, n ≥ N.
( 2)
Sea N1 = máx{ N, k0 } . Si k ≥ N1 , entonces k ≥ k0 y (1) implica que
| xnk − x| < ε/2.
También, como nk > k ≥ N1 ≥ N, entonces (2) implica que
| xk − xnk | < ε/2.
De estas dos últimas desigualdades se sigue que, para todo k ≥ N1 ,
| xk − x| ≤ | xk − xnk | + | xnk − x| < ε.
Esto termina la prueba.
Teorema 2.1.29 (R es completo). Una sucesión ( xn )∞
n =1 en R es convergente si, y sólo si, ella es de
Cauchy.
Prueba. Si ( xn )∞
n =1 es convergente, entonces claramente es de Cauchy. Recíprocamente, supon∞
ga que ( xn )n=1 es de Cauchy. Entonces ella es acotada y se sigue del Teorema de BolzanoWeierstrass que existe una subsucesión de ( xn )∞
n =1 que converge a un punto x ∈ R. Por el
Teorema 2.1.28, xn → x y termina la prueba.
El resultado anterior es interesante por dos razones: la primera es que en R las sucesiones de
Cauchy y las sucesiones convergentes son indistinguibles. La segunda es que cualquier sucesión
de Cauchy converge sin mencionar cuál es su límite, un hecho que puede resultar muy útil
en algunas circunstancias. También es importante tener presente que si ( xn )∞
n =1 es de Cauchy,
entonces se puede determinar la existencia una subsucesión estrictamente creciente de enteros positivos,
digamos (nk )∞
k=1 , tal que
xnk − xnk +1 < 2−k para todo k ∈ N.
Se invita al lector a llenar los detalles de esa afirmación.
2.1.5. Los Números Reales Extendidos
El Sistema de los Números Reales Extendidos, al que también se le llama Recta Extendida,
se define como
R = R ∪ {− ∞, + ∞},
donde − ∞ y + ∞ son dos objetos que no pertenecen a R. Un elemento a ∈ R se dice que es
finito si a ∈ R, en caso contrario se llama infinito.
96
Cap. 2 Los Números Reales
La naturaleza de los objetos − ∞ y + ∞ es totalmente irrelevante. Lo que es importante, en
realidad, es cómo dichos objetos se integran con los números reales a través de las operaciones
algebraicas usuales y las relaciones de orden. Comencemos por extender el orden de R a R
declarando que:
−∞ < +∞
y
− ∞ < x < +∞
para todo x ∈ R.
Dados x, y ∈ R, escribiremos x < y y diremos que x es menor que y, cuando se satisface una de
las siguientes condiciones:
( a) x, y ∈ R y x < y en el orden usual de R,
(b) x 6= +∞ y y = +∞,
(c) x = −∞ y y 6= −∞.
Escribiremos x > y cuando y < x. El símbolo x ≤ y, que se lee x es menor o igual que y,
significa que x < y o bien x = y. Similarmente, escribiremos x ≥ y cuando y ≤ x.
La relación binaria < que acabamos de definir sobre R es, en realidad, una relación de orden
total, la cual permite introducir, de la manera usual, la noción de intervalos. Por ejemplo, para
cualesquiera a, b ∈ R con a < b,
[a, b] = x ∈ R : a ≤ x ≤ b .
De modo similar se definen los intervalos [ a, b), ( a, b] y ( a, b). En ocasiones escribiremos R =
[−∞, +∞]. Podemos introducir una topología sobre R declarando que: G es abierto en R si,
y sólo si, G es abierto en R o G es de la forma
( a, +∞]
o
[−∞, a)
para algún a ∈ R.
¿Cómo se han de sumar y multiplicar los símbolos − ∞ y + ∞ con los restantes elementos de
R? Ellos se harán de acuerdo a las siguientes reglas:
(1) Para todo x ∈ R,
x + (+ ∞) = (+ ∞) + x = + ∞
y
x + (− ∞) = (− ∞) + x = − ∞
y
x · (− ∞) = (− ∞) · x = − ∞.
y
x · (− ∞) = (− ∞) · x = + ∞.
y
(−1)(− ∞) = −(− ∞) = + ∞.
(2) Si x ∈ R con x > 0, entonces
x · (+ ∞) = (+ ∞) · x = + ∞
(3) Si x ∈ R con x < 0, entonces
x · (+ ∞) = (+ ∞) · x = − ∞
En particular,
(−1)(+ ∞) = −(+ ∞) = − ∞
El convenimiento más importante relativo a la aritmética de R es el siguiente:
Sec. 2.1 Algunas Propiedades de los Números Reales
97
(4) 0 · (+ ∞) = (+ ∞) · 0 = 0 · (− ∞) = (− ∞) · 0 = 0.
(5) Finalmente,
(+ ∞) + (+ ∞) = + ∞ = (− ∞) · (− ∞)
y
(− ∞) + (− ∞) = − ∞ = (+ ∞) · (− ∞).
Precaución: La relación a + (− a) = 0, la cual es válida para todo a ∈ R, no se extiende a los
elementos − ∞ y + ∞ de R, es decir, declaramos que las expresiones
y
(+ ∞) + (− ∞)
(− ∞) + (+ ∞),
no tienen significado en R y, por consiguiente, se prohíben. En efecto, cualquier “valor” que
se pretenda asignarle a tales expresiones conlleva a obtener resultados absurdos. Por ejemplo,
si intentamos definir ∞ − ∞ = 0, entonces, usando (1), tendríamos que 1 + ∞ = −1 + ∞ de
donde se obtendría que 1 = −1. Otro aspecto que se pierde en R es que el producto de dos
límites de sucesiones no es necesariamente igual al límite del producto. Por ejemplo, si tomamos
an = n y bn = 1/n para todo n ∈ N, entonces lı́mn→∞ an = +∞ y lı́mn→∞ bn = 0. Sin
embargo,
0 =
lı́m an · lı́m bn 6= lı́m an · bn = 1.
n→∞
n→∞
n→∞
Similarmente, la expresión x/0 con x ∈ R, carece de significado en R. Sin embargo, la expresión
x/ ± ∞ siempre tiene sentido para cualquier x ∈ R y su valor es cero, es decir, x/ ± ∞ = 0.
El siguiente resultado es una generalización en R del Teorema 2.1.3.
Teorema 2.1.30. Sean a, b ∈ R. Si para cada c ∈ R con c > b ocurre que a < c, entonces a ≤ b.
Prueba. Suponga, para obtener una contradicción, que a > b. Entonces a 6= −∞, y b 6= +∞.
Escojamos ahora un número real c tal que a > c > b. Como c > b, nuestra hipótesis nos dice que
a < c, lo cual contradice nuestra elección de c. Por esto, a ≤ b y termina la prueba.
Recordemos que si A es un subconjunto no vacío y acotado de R, hemos acordado en
definir el sup A como la menor de las cotas superiores de A y a ı́nf A como la mayor de las
cotas inferiores de A. Si A no está acotado, extendemos esta noción declarando que:
ı́nf A = −∞
sup A = +∞
si A no está acotado inferiormente,
si A no está acotado superiormente.
Por consiguiente, se cumple que
ı́nf A ≤ sup A
si, y sólo si
A 6 = ∅.
(2.1.2)
¿Qué ocurre cuando A = ∅? Hemos visto que si A y B son subconjuntos arbitrarios no vacíos
de R con A ⊆ B, entonces
ı́nf B ≤ ı́nf A ≤ sup A ≤ sup B.
98
Cap. 2 Los Números Reales
Puesto que ∅ ⊆ A es una relación válida para cualquier subconjunto A de R, si queremos que
exista concordancia con lo antes expuesto y que las desigualdades anteriores sigan siendo válidas
cualesquiera sean los conjuntos A y B con A ⊆ B, entonces se debe postular que:
ı́nf ∅ = + ∞
y
sup ∅ = − ∞.
Establecidas estas consideraciones vemos que ı́nf A y sup A siempre existen como elementos
de R cualquiera sea el conjunto A ⊆ R. En particular,
sup(− A) = − ı́nf A
y
ı́nf(− A) = − sup A.
2.1.6. Limites Superior e Inferior de una Sucesión
Cuando una sucesión ( xn )∞
n =1 de números reales converge, se pueden recopilar algunas buenas
propiedades de dicha sucesión. Por ejemplo, podemos tener información de cuál es su límite,
también sabemos que ella es acotada, que cualquiera de sus subsucesiones converge y todas lo
hacen hacia el mismo punto, etc. Si la sucesión no converge parte de la información anterior se
pierde, pero puede ser de interés explorar el comportamiento de sus subsucesiones. Para analizar
este caso, fijemos una sucesión ( xn )∞
n =1 en R y consideremos el siguiente conjunto:
L∗ ( xn ) =
n
∞
z ∈ R : z = lı́m xnk , para alguna subsucesión ( xnk )∞
k=1 de ( xn ) n =1
k→∞
o
Observe que nuestro conjunto L∗ ( xn ) consiste de todos los puntos de acumulación de la sucesión
( xn ) ∞
n =1 . Ahora analizaremos en profundidad esta situación.
(1) Si ( xn )∞
n =1 está acotada, pero no converge, el Teorema de Bolzano-Weierstrass nos garantiza la
existencia de al menos una subsucesión de ( xn )∞
n =1 que converge a algún número real, de donde
resulta que L∗ ( xn ) es un conjunto no vacío y, por supuesto, acotado. Esto último permite asegurar
que
m = ı́nf L∗ ( xn )
y
M = sup L∗ ( xn )
siempre existen en R. Por supuesto, los números m y M representan el menor y el mayor,
respectivamente, de los puntos límites de la sucesión ( xn )∞
n =1 . Esos números son llamados el
límite inferior y el límite superior, respectivamente, de la sucesión ( xn )∞
n =1 . Observe que, en este
caso, m < M y
m, M ⊆ L∗ ( xn ) ⊆ [m, M ].
Aunque la sucesión ( xn )∞
n =1 no converge, los números ı́nf L( xn ) y sup L( xn ), como veremos un
poco más abajo, permiten obtener información sobre la “distribución” de los puntos tanto de la
sucesión ( xn )∞
n =1 así como de sus subsucesiones convergentes.
∞
(2) ¿Qué ocurre si la sucesión ( xn )∞
n =1 no está acotada? Por ejemplo, si ( xn ) n =1 no está acotada
superiormente, resulta del Teorema 2.1.24 que ella posee una subsucesión creciente, digamos
( xn k ) ∞
k=1 , tal que
lı́m xnk = sup{ xnk : k ∈ N } = +∞ ∈ L∗ ( xn ).
k→∞
Esto prueba que sup L∗ ( xn ) = +∞. Similarmente, si ( xn )∞
n =1 no está acotada inferiormente,
entonces −∞ ∈ L∗ ( xn ) y, así, ı́nf L∗ ( xn ) = −∞. Todo lo anterior garantiza, por supuesto, que
Sec. 2.1 Algunas Propiedades de los Números Reales
99
L∗ ( xn ) siempre es un subconjunto no vacío de R independientemente si la sucesión ( xn )∞
n =1 es o
no acotada y, por lo tanto,
sup L∗ ( xn )
ı́nf L∗ ( xn )
y
existen en R.
Definición 2.1.31. Sea ( xn )∞
n =1 una sucesión en R. Definimos el límite superior y el límite inferior
∞
de la sucesión ( xn )n=1 , respectivamente, como
lı́m sup xn = sup L∗ ( xn )
lı́m inf xn = ı́nf L∗ ( xn ).
y
n→∞
n→∞
Algunas veces escribiremos lı́m sup xn en lugar de lı́m supn→∞ xn . Igual consideración haremos para lı́m infn→∞ xn . La notación
y
lı́m xn
n→∞
lı́m xn
n→∞
también se usa con mucha frecuencia para denotar, respectivamente, el límite inferior y el límite
superior de la sucesión ( xn )∞
n =1 . Observe que, por definición, existe al menos una subsucesión
∞
( xn k ) ∞
de
(
x
)
tal
que
n n =1
k=1
lı́m sup xn = lı́m xnk .
k→∞
n→∞
Lo mismo se cumple para el límite inferior.
Puesto que L∗ ( xn ) es no vacío para cualquier sucesión ( xn )∞
n =1 en R, resulta de (2.1.2) que
lı́m inf xn = ı́nf L∗ ( xn ) ≤ sup L∗ ( xn ) = lı́m sup xn .
n→∞
( 1)
n→∞
Más aun, si la sucesión ( xn )∞
n =1 converge a un punto z, entonces también converge cualquiera
de sus subsucesiones y, por supuesto, lo hace hacia el mismo punto z. Por esto,
lı́m xn = z ∈ R
n→∞
⇔
L∗ ( xn ) = {z}
⇔
lı́m inf xn = z = lı́m sup xn .
n→∞
n→∞
Dicho de otra manera:
Corolario 2.1.32. Una sucesión ( xn )∞
n =1 en R converge si, y sólo si,
lı́m inf xn = lı́m sup xn = lı́m xn ∈ R.
n→∞
n→∞
n→∞
Observe que gracias a (1) y la última igualdad del corolario anterior podemos concluir que:
Corolario 2.1.33. Una sucesión ( xn )∞
n =1 en R converge si, y sólo si lı́m inf xn y lı́m sup xn existen
n→∞
(en R ) y
lı́m sup xn ≤ lı́m inf xn .
n→∞
n→∞
n→∞
( 2)
100
Cap. 2 Los Números Reales
Dos de las propiedades importantes que relacionan directamente los límites inferior y superior, el cual es consecuencia del Teorema 2.1.11, son las siguientes:
lı́m sup (− xn ) = − lı́m inf xn
n→∞
n→∞
y
lı́m inf (− xn ) = − lı́m sup xn .
n→∞
n→∞
Si bien la definición de los límites superior e inferior es impecable desde el punto de vista
teórico, ellas no son muy adecuadas a la hora calcular los límites inferiores y superiores de una
sucesión en particular, pues habría que determinar, en primer lugar, todos los puntos límites de
dicha sucesión, una tarea que pudiera ser un tanto difícil, y luego elegir el ínfimo y el supremo
de tales puntos límites. La caracterización dada en el próximo teorema es, en muchos aspectos,
más practica y, por supuesto, más útil.
Suponga de nuevo que ( xn )∞
n =1 es una sucesión en R y defina, para cada entero n ≥ 1, los
siguientes números reales extendidos:
mn = ı́nf xn , xn+1 , . . .
y
Mn = sup xn , xn+1 , . . . .
Observe que:
(ι1 ) mn ≤ x j ≤ Mn para todo j ≥ n ∈ N,
y
( ι 2 ) m1 ≤ m2 ≤ · · · ≤ m n ≤ · · ·
( ι 3 ) M1 ≥ M2 ≥ · · · ≥ M n ≥ · · · .
Puesto que las sucesiones (mn )∞
n =1 y Mn
∞
n =1
son ambas monótonas en R, resulta que los límites
lı́m Mn = ı́nf Mn = ı́nf sup xn
n→∞
n ≥1
n ≥1 k≥ n
y
lı́m mn = sup mn = sup ı́nf xn .
n→∞
n ≥1
n ≥1 k≥ n
siempre existen en R.
Teorema 2.1.34. Sea ( xn )∞
n =1 una sucesión en R. Entonces
lı́m sup xn = ı́nf sup xn
n→∞
lı́m inf xn = sup ı́nf xn .
y
n→∞
n ≥1 k≥ n
n ≥1 k≥ n
Prueba. Sea M = lı́mn→∞ Mn , el cual, como acabamos de ver, siempre existe en R. Para demostrar que sup L∗ ( xn ) = M tomemos cualquier z ∈ L∗ ( xn ). Por definición, existe una subsucesión
∞
( xn j ) ∞
j=1 de ( xn ) n =1 tal que z = lı́m j→∞ xn j y entonces, por ( ι 1 ), xn j ≤ Mn j para todo j ≥ 1, de
donde se sigue que
z = lı́m xn j ≤ lı́m Mn j = M.
j→∞
j→∞
Esta desigualdad nos revela que M es una cota superior de L∗ ( xn ) y, por lo tanto,
sup L∗ ( xn ) ≤ M.
(2.1.3)
Sec. 2.1 Algunas Propiedades de los Números Reales
101
Para probar la otra desigualdad suponga, en primer lugar, que M1 = +∞. Esto significa que la
∗
sucesión ( xn )∞
n =1 no está acotada superiormente y, por consiguiente, + ∞ = sup L ( xn ). Se sigue
de (2.1.3) que M = +∞ y, así,
sup L∗ ( xn ) = M = +∞.
Suponga entonces que M1 < +∞. Por la propiedad del supremo, existe un xn1 tal que
M1 − 1 < x n 1 ≤ M1 .
Considere ahora Mn1 +1 = sup xn1 +1 , xn1 +2 , . . . y note que como Mn1 +1 ≤ M1 , entonces
Mn1 +1 < +∞. Usemos de nuevo la propiedad del supremo para hallar un xn2 tal que
Mn1 +1 −
1
< x n2 ≤ Mn1 +1 .
2
Observe que n2 > n1 . Una vez más. Considere Mn2 +1 = sup xn2 +1 , xn2 +2 , . . .
apliquemos la propiedad del supremo para hallar un xn3 tal que
Mn2 +1 −
y, como antes,
1
< x n3 ≤ Mn2 +1 .
3
Si se continúa indefinidamente con este procedimiento, se logra obtener una subsucesión ( xn j )∞
j=1
de ( xn )∞
tal
que,
para
todo
j
∈
N,
n =1
Mn j +1 −
1
< x n j +1 ≤ M n j + 1 .
1+j
Por el Teorema del Sandwich para límites se obtiene que
lı́m xn j = lı́m Mn j +1 = M ∈ L∗ ( xn ).
j→∞
j→∞
De esto se concluye que M ≤ sup L∗ ( xn ) y, por lo tanto, usando (2.1.3), vemos que M =
sup L∗ ( xn ). El caso del límite inferior es similar y se deja a cargo del lector.
La manera de expresar a los límites inferior y superior dada en el resultado anterior permite
asignarle una interpretación geométrica que resulta ser muy conveniente.
Teorema 2.1.35. Sea ( xn )∞
n =1 una sucesión en R. Entonces
lı́m sup xn = a0 ∈ R
n→∞
si, y sólo si, para cada ε > 0:
( a) existe un N ∈ N tal que xn < a0 + ε para todo n ≥ N, y
(b) n ∈ N : a0 − ε < xn es infinito.
Prueba. Suponga que lı́m supn→∞ xn = a0 ∈ R y sea ε > 0 elegido arbitrariamente.
Veamos que
( a) y (b) se cumplen. En efecto, puesto que a0 = lı́mn→∞ Mn , donde Mn = sup xn , xn+1 , . . .
para todo n ∈ N, entonces existe un entero N ∈ N tal que
M n − a0 < ε
para todo n ≥ N,
102
Cap. 2 Los Números Reales
es decir, a0 − ε < Mn < a0 + ε para todo n ≥ N, de donde se sigue que
Esto prueba que
xn ≤ sup xn , xn+1 , . . .
= Mn < a0 + ε para todo n ≥ N.
x n < a0 + ε
para todo n ≥ N
y ( a) se cumple. Para demostrar (b) recordemos que, por el Teorema 2.1.34, a0 = ı́nfn≥1 supk≥n xk
de donde resulta, por la definición de ínfimo, que
a0 ≤ sup xk , xk+1 , . . .
= Mk
para todo k ∈ N.
(2.1.4)
En particular, a0 ≤ M1 . Ahora bien, usando las propiedades del supremo, existe un entero n1 tal
que xn1 > M1 − ε, y, por consiguiente,
xn1 > a0 − ε.
Tomando k = n1 en (2.1.4), existe un n2 > n1 tal que
xn1 > Mn1 − ε > a0 − ε.
Procediendo indefinidamente con el mecanismo anterior, se obtiene una subsucesión ( xnk )∞
k=1 de
( xn ) ∞
tal
que
n =1
x n k > a0 − ε
para todo k ∈ N.
Puesto que nk > k para todo k ∈ N resulta de lo anterior que
n ∈ N : a0 − ε < x n
es infinito y así (b) también se cumple. Es claro que ( a) y (b) implican que lı́m sup xn = a0 . n→∞
Observe que la condición ( a) del resultado anterior establece que todos los términos de la
sucesión ( xn )∞
n =1 , salvo un número infinito ellos, están a la izquierda de a0 + ε, mientras que
la condición (b) expresa que siempre hay una infinidad de términos de la sucesión a la derecha de
a0 − ε.
Un argumento enteramente similar a la demostración del teorema anterior permite obtener el
siguiente resultado para el límite inferior.
Teorema 2.1.36. Sea ( xn )∞
inf xn = b0 ∈ R si, y sólo si, para cada
n =1 una sucesión en R. Entonces lı́m
n→∞
ε > 0,
( a) existe un N ∈ N tal que b0 − ε < xn para todo n ≥ N, y
(b) n ∈ N : xn < b0 + ε es infinito.
Prueba. Se omite por ser similar al resultado anterior.
Cuando el límite inferior, respectivamente, el límite superior es infinito se obtiene la siguiente
caracterización.
Sec. 2.1 Algunas Propiedades de los Números Reales
103
Teorema 2.1.37. Sea ( xn )∞
n =1 una sucesión en R. Son equivalentes:
(1) lı́m inf xn = +∞.
n→∞
(2) Para cada M > 0, existe un N ∈ N tal que xn ≥ M para todo n ≥ N.
Prueba. Sea M > 0. Entonces
lı́m inf xn = +∞ ⇔ sup mn = +∞
n→∞
n ≥1
⇔ existe un N ∈ N tal que m N ≥ M
⇔ existe un N ∈ N tal que ı́nf{ x N , x N +1 , . . .} ≥ M
⇔ existe un N ∈ N tal que xn ≥ M para todo n ≥ N.
Teorema 2.1.38. Sea ( xn )∞
n =1 una sucesión en R. Son equivalentes:
(1) lı́m sup xn = −∞.
n→∞
(2) Para cada M > 0, existe un N ∈ N tal que xn ≤ M para todo n ≥ N.
Prueba. Es similar al caso anterior y se omite.
Ejemplo 2.1.1. Si xn = n para todo n ∈ N, entonces mn = n y Mn = +∞, por lo que
lı́m inf xn = lı́m mn = +∞
n→∞
n→∞
lı́m sup xn = lı́m Mn = +∞.
y
n→∞
n→∞
Ejemplo 2.1.2. Si xn = (−1)n para todo n ∈ N, entonces
lı́m inf (−1)n = −1
lı́m sup (−1)n = 1.
y
n→∞
n→∞
Ejemplo 2.1.3. Si xn = (−1)n /n para todo n ∈ N, entonces
lı́m inf
n→∞
(−1)n
(−1)n
= 0 = lı́m sup
.
n
n
n→∞
∞
Teorema 2.1.39. Sean ( xn )∞
n =1 y ( yn ) n =1 sucesiones en R. Entonces se cumple que
( a) lı́m sup ( xn + yn ) ≤ lı́m sup xn + lı́m sup yn .
n→∞
n→∞
n→∞
(b) lı́m inf ( xn + yn ) ≥ lı́m inf xn + lı́m inf yn .
n→∞
n→∞
(c) lı́m sup xn ≤ lı́m sup yn
n→∞
n→∞
n→∞
y
lı́m inf xn ≤ lı́m inf yn
n→∞
n→∞
si xn ≤ yn ∀n ≥ 1.
104
Cap. 2 Los Números Reales
Prueba. Sólo demostraremos ( a), pues la prueba de (b) es muy similar y (c) es inmediata. Observe, en primer lugar, que si uno de los límites superiores de la derecha en ( a) es infinito, entonces
la igualdad se cumple trivialmente. Suponga entonces que el lado derecho es finito y definamos,
para cada n ∈ N,
y
Mn′ = sup yn , yn+1 , . . .
Mn = sup xn , xn+1 , . . .
Entonces, para todo k ≥ n,
y, en consecuencia,
yk ≤ Mn′
y
x k ≤ Mn
xk + yk ≤ Mn + Mn′
para todo k ≥ n. Esto prueba que Mn + Mn′ es una cota superior para el conjunto
A n = xn + yn , xn +1 + yn +1 , . . . ,
y, por lo tanto,
sup An = sup xn + yn , xn+1 + yn+1 , . . .
≤ Mn + Mn′ .
Como la sucesión (sup An )∞
n =1 es decreciente, resulta que
lı́m sup ( xn + yn ) = ı́nf sup An
n→∞
n ≥1 n ≥ k
≤ lı́m Mn + Mn′
n→∞
= lı́m Mn + lı́m Mn′
n→∞
n→∞
= lı́m sup xn + lı́m sup yn .
n→∞
n→∞
Para demostrar (c) observe que si xn ≤ yn para todo n ≥ 1, entonces
Mn ≤ Mn′
y
mn ≤ m′n
donde mn = ı́nf xn , xn+1 , . . . y m′n = yn , yn+1 , . . . . Tomando el límite cuando n → ∞ en
las desigualdades anteriores se obtienen los resultados deseados.
Nota Adicional 2.1.1 La relación de orden impuesta sobre R hace que −∞ sea el elemento
más pequeño y +∞ el elemento más grande. Esta relación de orden es compatible con la
topología puesto que los conjuntos abiertos son uniones de intervalos. Si se considera la
aplicación ϕ = R → [−1, 1] definida por

x

√
si x ∈ R
1 + x2
ϕ( x) =

 ±1
si x = ±∞
entonces es fácil ver que ϕ es un homeomorfismo que es compatible con la relación de
orden, es decir, para todo x, y ∈ R,
x < y
⇒
ϕ ( x ) < ϕ ( y).
( 1)
De esta información se sigue que si
es una sucesión monótona en R, entonces ella
converge. En efecto, de (1) se sigue que ( ϕ( xn ))∞
n =1 es una sucesión monótona en [−1, 1]
y, en consecuencia, converge. Puesto que ϕ−1 es continua, resulta que ( xn )∞
n =1 converge en
R. Estas consideraciones permiten que la noción de limite superior y limite inferior puedan
ser tratados en [−1, 1] en lugar de R.
( xn ) ∞
n =1
Sec. 2.1 Algunas Propiedades de los Números Reales
105
2.1.7. Límites Superior e Inferior de Conjuntos
Las nociones de límites superiores e inferiores de conjuntos es importante en la Teoría de la
Medida. En lo que sigue X denotará un subconjunto arbitrario no vacío.
∞
Definición 2.1.40. Sea X un conjunto no vacío. Dada una sucesión An n=1 de subconjuntos de X,
∞
definimos las sucesiones ( A n )∞
n =1 y ( An ) n =1 por
∞
\
An =
Ak
y
An =
k= n
para n = 1, 2, . . . Los conjuntos
lı́m inf An =
n→∞
∞
[
An =
n =1
∞ \
∞
[
∞
[
Ak
k= n
Ak
y
lı́m sup An =
n→∞
n =1 k= n
∞
\
An =
n =1
lı́m An
y
n→∞
Ak
n =1 k= n
los llamaremos, respectivamente, el límite inferior y el límite superior de la sucesión An
La notación
∞ [
∞
\
∞
n =1
.
lı́m An
n→∞
se usan frecuentemente
para denotar a los límites inferior y superior, respectivamente, de la suce∞
sión An n=1 . En ocasiones, escribiremos lı́m inf An en lugar de lı́m infn→∞ An y similarmente
para el límite superior. De las Leyes de Morgan se sigue que
c
c
lı́m sup Acn = lı́m inf An
y
lı́m inf Acn = lı́m sup An .
n→∞
n→∞
n→∞
n→∞
La siguiente caracterización de los conjuntos lı́m inf An y lı́m sup An resulta conveniente para
ciertos propósitos.
∞
Teorema 2.1.41. Sea An n=1 una sucesión de subconjuntos de X. Entonces
( a) x ∈ lı́m inf An si, y sólo si, existe un N ∈ N tal que, para todo n ≥ N, x ∈ An , es decir,
n→∞
lı́m inf An = x : x ∈ An excepto para un número finito de n’s .
n→∞
(b) x ∈ lı́m sup An si, y sólo si, para cada N ∈ N existe n ≥ N tal que x ∈ An , es decir,
n→∞
lı́m sup An =
n→∞
x : x ∈ An para infinitos n’s .
S∞
Prueba.
(
a
)
Sea
x
∈
lı́m
inf
A
=
n
→
∞
n
n =1 A n . Entonces existe un N ∈ N tal que x ∈ A N =
T∞
n = N A n . Por esto, x ∈ A n para todo n ≥ N. Recíprocamente, sean x ∈ X y N ∈ N de modo
que x ∈ An para todo n ≥ N. Entonces
x∈
∞
\
n= N
An = A N ⊆ lı́m inf An .
n→∞
(b) Es similar a la anterior y, por lo tanto, se deja a cargo del lector.
Algunas de las propiedades de los conjuntos lı́m infn→∞ An y lı́m supn→∞ An se detallan a
continuación.
106
Cap. 2 Los Números Reales
Teorema 2.1.42. Sea An
( a)
An
∞
n =1
∞
una sucesión de subconjuntos de X. Entonces
n =1
es creciente y
An
∞
n =1
es decreciente.
(b) A n ⊆ Am para cualesquiera m, n ∈ N.
(c) lı́m inf An ⊆ lı́m sup An .
n→∞
Prueba. ( a)
n→∞
An
∞
n =1
es monótona creciente pues, para cualquier n ∈ N,
∞
\
An =
Ak = An ∩
k= n
∞
\
Ak ⊆
∞
[
Ak ⊇
k= n +1
∞
\
A k = A n +1 .
∞
[
A k = A n +1
k= n +1
Similarmente, para cualquier n ∈ N,
An =
∞
[
k= n
lo cual prueba que
An
∞
n =1
Ak = An ∪
k= n +1
k= n +1
es monótona decreciente.
(b) Sean m, n ∈ N y suponga que n < m. Entonces, por la primera parte,
A n ⊆ A m ⊆ Am ⊆
∞
[
Ak = A m .
k= m
(c) Sea n ∈ N. Por (2) tenemos que A n ⊆ Am para m = 1, 2, . . . y, en consecuencia,
An ⊆
∞
\
Am = lı́m sup An ,
m =1
n→∞
Puesto que esta última desigualdad es válida para todo n ∈ N, resulta que
lı́m inf A =
n→∞
∞
[
n =1
A n ⊆ lı́m sup An .
n→∞
Definición 2.1.43. Sea An
∞
n =1
una sucesión arbitraria de subconjuntos de X. Si
lı́m sup An = lı́m inf An ,
n→∞
n→∞
entonces a éste conjunto lo denotaremos por lı́mn→∞ An y lo llamaremos el límite de la sucesión An
∞
n =1
.
∞
Cuando la sucesión de conjuntos An n=1 es monótona, los límites superiores e inferiores
adoptan formas muy sencillas tal como lo muestra el siguiente resultado.
Sec. 2.1 Algunas Propiedades de los Números Reales
107
∞
∞
Teorema 2.1.44. Sea An n=1 una sucesión monótona de subconjuntos de X. Si An n=1 es decreciente (respectivamente, creciente), entonces
lı́m An =
n→∞
An
(respectivamente, lı́m An =
n→∞
n =1
Prueba. Suponga que An
consiguiente,
A n = An ∩
∞
\
∞
\
∞
n =1
A n ).
n =1
es decreciente. Entonces An−1 ∩ An = An para todo n ≥ 2 y, por
Ak =
k= n +1
∞
[
A n −1 ∩ A n ∩
∞
\
Ak =
k= n +1
∞
\
k= n −1
Ak = · · · =
∞
\
Ak .
k=1
De aquí se sigue que
∞
[
lı́m inf An =
n→∞
An =
n =1
∞
\
Ak .
k=1
∞
De modo similar, usando de nuevo el hecho de que An n=1 es monótona decreciente, resulta
que
∞
[
An =
Ak = An
k= n
y, en consecuencia,
lı́m sup An =
n→∞
∞
\
An =
n =1
∞
\
An .
n =1
Esto termina la prueba de la primera parte. La prueba de la segunda parte es similar a la primera
y, por lo tanto, se omite.
2.1.8. Series Absolutamente Convergentes y Familias Sumables
Sea ( xn )∞
nP
=1 una sucesión de números reales y para cada entero n ≥ 1 considere la suma
parcial sn = ni=1 xi . A la expresión
∞
X
n =1
xn = lı́m sn
n→∞
( α1 )
se le llama la serie asociada a la sucesión ( xn )∞
n =1 . Observe que dicho límite puede
P∞o no existir.
Si él existe, diremos
entonces
que
la
serie
converge,
lo
cual
escribiremos
como
n =1 xn < ∞,
P∞
o también como
n =1 xn = a para algún a ∈ R. Por ejemplo, si los términos de la sucesión
( xn ) ∞
son
no-negativos
y si la sucesión (sn )∞
n =1
n =1 está acotada superiormente, resulta del Teorema 2.1.23, que ella converge ya que es una sucesión creciente. En este caso se tiene que
( n
)
∞
n
X
X
X
xn := lı́m
xi = sup
xi : n ∈ N .
n =1
n→∞
i=1
i=1
Si el límite en (α1 ) no existe, se dirá entonces que la serie diverge.
108
Cap. 2 Los Números Reales
Teorema 2.1.45. Si la serie
∞
X
xn converge, entonces lı́m xn = 0.
n→∞
n =1
P
∞
∞
Prueba. Sea a = ∞
n =1 xn . si ( sn ) n =1 es la sucesión de las sumas parciales de ( xn ) n =1 , entonces
xn = sn − sn−1 para todo n ≥ 2 y por lo tanto,
lı́m xn = lı́m sn − lı́m sn−1 = a − a = 0.
n→∞
n→∞
n→∞
La prueba es completa.
Es fácil establece que si
( a)
∞
X
P∞
n =1
xn y
( xn + yn ) converge y
P∞
n =1 yn
son series convergentes, entonces:
n =1
∞
X
( xn + yn ) =
n =1
(b)
∞
X
n =1
∞
X
xn +
n =1
∞
X
yn .
n =1
a xn converge para cualquier a ∈ R y
∞
X
a xn = a
n =1
∞
X
xn .
n =1
(c) Si xn ≤ yn para todo n ∈ N, entonces
∞
X
n =1
xn ≤
∞
X
yn .
n =1
El siguiente criterio, conocido como el Criterio de Cauchy para Series, es una elegante, útil y
práctica forma de caracterizar serie s convergentes a través de la rigurosa forma del ε − N.
Teorema P
2.1.46 (Criterio de Cauchy para Series). Las siguientes condiciones son equivalentes para
∞
una serie
n =1 xn .
(1) La serie converge.
(2) Para cada ε > 0, existe un N ∈ N tal que
∞
X
xk < ε
k= n +1
para todo n ≥ N.
(3) Para cada ε > 0, existe un N ∈ N tal que
m
X
k= n +1
xk < ε
para todo m > n ≥ N.
Sec. 2.1 Algunas Propiedades de los Números Reales
109
P∞
Prueba. (1) ⇒ (2). Suponga que la serie converge, digamos
n =1 xn = a para algún a ∈ R y
∞ . Entonces, para cada ε > 0, existe un
sea (sn )∞
la
sucesión
de
las
sumas
parciales
de
(
x
)
n n =1
n =1
entero positivo N tal que
|a − sn | < ε para todo n ≥ N.
Puesto que
a − sn = lı́m sm − sn = lı́m
m→∞
m→∞
m
X
∞
X
xk =
k= n +1
k= n +1
se obtiene que (1) ⇒ (2).
(2) ⇒ (3). Si (2) se cumple, entonces existe un N ∈ N tal que
∞
X
xk < ε
k= n +1
para todo n ≥ N.
Si m > n ≥ N, entonces
m
X
k= n +1
xk ≤
∞
X
k= n +1
xk −
∞
X
xk
xk
k= m +1
≤ máx
(
∞
X
xk ,
k= n +1
∞
X
k= m +1
xk
)
< ε
y (3) se cumple.
(3) ⇒ (1). Suponga que (3) es verdadero. Entonces
sm − sn =
m
X
xk < ε
k= n +1
para todo m > n ≥ N
lo cual prueba que la sucesión (sn )∞
n =1 es de Cauchy en R. La completitud de R nos garantiza
que la serie converge.
2.1.9. Caracterizando Series Absolutamente Convergentes
Definición 2.1.47. SeaP
( xn ) ∞
n =1 una sucesión en R. La serie
∞
convergente si la serie
n =1 | xn | converge.
P∞
n =1
xn se dice que es absolutamente
¿Cuál es la relación entre una serie absolutamente convergente y la serie original? El siguiente
resultado, válido en cualquier espacio de Banach, establece que toda serie absolutamente convergente, converge.
P∞
∞
)
Teorema
2.1.48.
Sea
(
x
una
sucesión
en
R.
Si
n
n =1 | xn | converge, entonces también converge
n
=
1
P∞
la serie
n =1 xn .
P∞
Prueba. Suponga que
n =1 | xn | converge. Puesto que
0 ≤ x n + | x n | ≤ 2| x n |
P∞
se sigue que la serie
n =1 ( xn + | xn |) converge y, en consecuencia, por la propiedad de la suma
de dos series, se tiene que
∞
∞
∞
X
X
X
xn =
( xn + | xn |) −
| xn |
n =1
n =1
n =1
110
Cap. 2 Los Números Reales
converge.
El recíproco
anterior no es, en general, válido. Por ejemplo, es bien conocido
P∞ del resultado
n
que la serie
n =1 (−1) /n converge, pero ella no es absolutamente convergente.
P∞
P∞
Definición 2.1.49. Un reordenamiento de una serie
n =1 xn es otra serie de la forma
n =1 xπ ( n ) ,
donde π : N → N es cualquier biyección, es decir, una permutación de N.
P∞
Observe que un reordenamiento de
n =1 xn es otra serie con los mismos términos pero
dispuesto en un orden diferente. Un concepto que es de importancia fundamental en la Teoría de
Series y donde el orden de los términos no altera la convergencia de la serie es el siguiente.
P
Definición 2.1.50. Una serie ∞
n =P
1 xn se dice que es incondicionalmente convergente si para cualquier
∞
permutación π : N → N, la serie
n =1 xπ ( n ) converge y
∞
X
xn =
n =1
∞
X
xπ ( n ) .
n =1
P
Es decir, una serie ∞
n =1 xn es incondicionalmente convergente si no importa cómo reordenes
los términos de la sucesión ( xn )∞
nunca
n =1 siempre obtienes una serie convergente que,
Pademás,
∞
cambia su valor. Observe que, tomando la permutación identidad, vemos que
x
convern =1 n
ge. Uno de los ejemplos más simple de una serie
incondicionalmente
convergente
se obtiene
P∞
cuando se considera cualquier serie convergente
x
cuyos
términos
son
no-negativos.
Éste
n
n =1
hecho es consecuencia de un resultado sorprendente demostrado por Weierstrass y Riemann. La
implicación (1) implica (2) en el siguiente resultado se debe a Weierstrass y la otra a Riemann.
Teorema 2.1.51 (Weierstrass-Riemann). Sea ( xn )∞
n =1 una sucesión de números reales. Las siguientes condiciones son equivalentes:
P
( 1) ∞
n =1 xn es absolutamente convergente.
P∞
(2) n=1 xn es incondicionalmente convergente.
Prueba. (1) ⇒ (2). Suponga que
M =
∞
X
n =1
| xn |
P∞
n =1 | xn |
y
< ∞ y sea π una permutación de N. Hagamos
mn = sup{π (k) : 1 ≤ k ≤ n}, n = 1, 2, . . .
Para cada n ∈ N se verifica:
Sn =
n
X
k=1
| xπ ( k) | ≤
mn
X
k=1
≤ M
Este hecho nos muestra que la sucesión de términos no-negativos (Sn )∞
n =1 es creciente y acotada
y, por lo tanto, converge. Además,
∞
X
n =1
| xπ ( n ) | ≤ M =
∞
X
n =1
| x n |.
Sec. 2.1 Algunas Propiedades de los Números Reales
111
Si P
se considera la permutación inversa π −1 de π e invirtiendo los papeles de las series
∞
y
n =1 | xπ ( n ) | se obtiene la desigualdad:
∞
X
n =1
de donde
∞
X
n =1
Falta verificar que
∞
X
| xn | ≤
| xn | =
∞
X
n =1
∞
X
n =1
xn =
n =1
n =1 | xn |
| xπ ( n ) |,
| xπ (n) | = M.
∞
X
P∞
( α2 )
xπ ( n ) .
n =1
Para demostrar esto, considere, para cada n ∈ N, el conjunto
Λn =
×
1
×
2
π ( 4)
•
p ∈ N : p < mn , p 6∈ {π (1), . . . , π (n)} .
×
4
π ( 1) π ( 3)
•
•
···
×
7
mn
•
×
Λn
···
Observe que
mn
X
k=1
y
xk −
X
k∈Λ n
n
X
xπ ( k) =
k=1
k∈Λ n
| xk | =
Pm n
X
mn
X
| xk | −
k=1
Pn
xk ≤
n
X
k=1
X
k∈Λ n
| xk |
| x π ( k ) |.
Se sigue entonces P
de (α2 ) que
k=1 | xπ ( k) | tienen el mismo límite M cuando
Pn k =1 | x k | y
mn
n → +∞. Luego,
x
−
x
tiende
a
cero
y, se verifica que
k=1 π ( k)
k=1 k
∞
X
xn =
n =1
P∞
∞
X
xπ ( n ) .
n =1
(2) ⇒ (1). Sea n=1 xn una serie incondicionalmente convergente y P
suponga, para generar una
∞
contradicción, que ella no es absolutamente convergente, es decir,
n | = + ∞. Lo que
n =1 | xP
∞
vamos a hacer es construir una permutación π sobre N tal que la serie
n =1 xπ ( n ) diverja,
lográndose, de este modo, una contradicción.
Para cada n ∈ N, sean
pn =
| xn | + xn
2
y
qn =
| xn | − xn
.
2
112
Cap. 2 Los Números Reales
Observe que, para cualquier n ∈ N,
pn ≥ 0,
qn ≥ 0,
y
pn − qn = xn
p n + q n = | x n |.
( α3 )
∞
Sin perder generalidad, asumiremos que pn , qn > 0 para todo n ≥ 1. Siendo ( pn )∞
n =1 y ( q n ) n =1
∞
subsucesiones de ( xn )n=1 , existen sucesiones estrictamente crecientes en N:
y
i1 < i2 < · · · < i n < · · ·
j1 < j2 < · · · < jn < · · ·
tales que pn = xin y qn = x jn para todo n ≥ 1. Observe que gracias a (α3 ) se tiene que
N = {in : n ∈ N } ∪ { jn : n ∈ N }
y
{in : n ∈ N } ∩ { jn : n ∈ N } = ∅.
La construcción de π será efectuada en dos pasos, el primero de los cuales es el siguiente:
( a1 ) Las series
∞
X
pn y
n =1
∞
X
qn son ambas divergentes.
n =1
P∞
P∞
P∞
En efecto, si ambas series fueran convergentes, entonces
n =1 pn +
n =1 q n =
n =1 | xn | sería
convergente, lo que resulta contrario a nuestra
suposición.
Suponga
ahora
que
una
P∞
P∞ de las series
converge y, para fijar idea, suponga
que
q
<
+
∞.
Puesto
que
la
serie
n =1 xn converge,
P∞
P∞ n =1 n
por hipótesis, resulta
que
n =1 xn +
n =1 qn también converge. Sin embargo, por la primera
P∞
parte sabemos que
p
diverge
y
entonces
se obtiene la siguiente contradicción
n =1 n
+∞ >
∞
X
xn +
n =1
∞
X
qn =
n =1
∞
X
pn = +∞.
n =1
∞
( a2 ) Existen subsucesiones estrictamente crecientes (mn )∞
n =1 y ( k n ) n =1 de N tales que la serie
p1 + · · · + p m 1 − q 1 + · · · + q k 1 + p m 1 + 1 + · · · + p m 2 − q k 1 + 1 + · · · + q k 2 + · · ·
(∗)
no
P∞converge. Ésta serie, como se demuestra a continuación, resulta ser un reordenamiento de
n =1 xn lo que producirá la contradicción que andamos buscando.
Fijemos un par de números reales α, β con 1 < α < β y escoja sucesiones en R, digamos
∞
(αn )∞
n =1 y ( β n ) n =1 con α n < β n , n = 1, 2, . . ., tales que
lı́m αn = α
y
n→∞
lı́m β n = β.
n→∞
Para demostrar ( a2 ) usaremos, en primer lugar, el hecho de que
entero positivo más pequeño, llamémoslo m1 , tal que
y
p1 + · · · + p m 1 > β 1
P∞
n =1
pn = +∞, para elegir el
p1 + · · · + p m 1 − 1 ≤ β 1
De esto se sigue que
p1 + · · · + p m 1 − 1 + p m 1 ≤ β 1 + p m 1 .
β 1 < p1 + · · · + p m 1 =
p
Definiendo S1 = p1 + · · · + pm1 , resulta que
p
S1 − β 1 ≤ p m 1 .
Sec. 2.1 Algunas Propiedades de los Números Reales
113
Vamos a definir los primeros m1 valores de nuestra permutación π declarando que:
π ( 1) = i 1 ,
π ( 2) = i 2 , . . . , π ( m 1 ) = i m 1 .
P∞
Similarmente, siendo divergente la serie
n =1 qn , existe un k1 ∈ N, que de nuevo elegiremos
como el entero positivo más pequeño, de modo tal que
q 1 + · · · + q k 1 > p1 + · · · + p m 1 − α 1 ,
y
q 1 + · · · + q k 1 − 1 ≤ p1 + · · · + p m 1 − α 1 .
De allí que
y, por lo tanto,
α 1 − q k 1 ≤ p1 + · · · + p m 1 − q 1 + · · · + q k 1 − 1 − q k 1 < α 1
q
S1 − α 1 ≤ q k 1 ,
q
donde hemos puesto S1 = p1 + · · · + pm1 − q1 + · · · + qk1 . Los siguientes valores de π, comenzando desde m1 + 1 hasta k1 , se obtienen definiendo
π (m1 + 1) = j1 , π (m1 + 2) = j2 , . . . , π (k1 ) = jk1 .
P
P∞
Usando de nuevo el hecho de que las series ∞
n =1 pn y
n =1 qn son divergentes podemos, como
antes, escoger los enteros positivos más pequeños, digamos m2 y k2 , con k2 > k1 y m2 > m1 ,
tales que
p1 + · · · + p m 1 + p m 1 + 1 + · · · + p m 2 > q 1 + · · · + q k 1 + β 2 ,
y
q 1 + · · · + q k 1 + q k 1 + 1 + · · · + q k 2 > p1 + · · · + p m 1 + p m 1 + 1 + · · · + p m 2 − α 2 .
De esto se desprende, por las elecciones de m2 y k2 , que si definimos
p
S2 = p1 + · · · + p m 1 − q 1 + · · · + q k 1 + p m 1 + 1 + · · · + p m 2 > β 2
y
q
S2 = p1 + · · · + p m 1 − q 1 + · · · + q k 1 + p m 1 + 1 + · · · + p m 2 − q k 1 + 1 + · · · + q k 2 < α 2 ,
entonces,
Hagamos
p
S2 − β 2 ≤ p m 2
π ( k 1 + 1) = i m 1 + 1 , . . . , π ( m 2 ) = i m 2 ,
y
q
S2 − α 2 ≤ q k 2 .
π (m2 + 1) = jk1 +1 , . . . , π (k2 ) = jk2 .
El procedimiento anterior, que se puede llevar a cabo indefinidamente gracias al hecho ( a1 ),
∞
∞
culmina con la obtención de las dos sucesiones
P∞ (mn )n=1 y (kn )n=1 de N tal que la serie (∗) es,
por construcción, un reordenamiento de
n =1 xn . Veamos ahora que dicha serie diverge. En
efecto, para cada n ∈ N, sean
p
S n = p1 + · · · + p m 1 − q 1 + · · · + q k 1 + p m 1 + 1 + · · · + p m 2 − q k 1 + 1 + · · · + q k 2 + · · · +
p m n −1 + 1 + · · · + p m n ,
q
S n = p1 + · · · + p m 1 − q 1 + · · · + q k 1 + p m 1 + 1 + · · · + p m 2 − q k 1 + 1 + · · · + q k 2 + · · · +
p m n −1 + 1 + · · · + p m n − q k n −1 + 1 + · · · + q k n .
114
Cap. 2 Los Números Reales
las sumas parciales de la serie (∗). Resulta entonces, por el procedimiento antes descrito, que
para cada n ∈ N,
p
Sn − β n ≤ pm n
y
q
Sn − α n ≤ q k n .
P∞
Ahora bien, como la serie
n =1 xn es convergente, entonces lı́mn →∞ xn = 0, de donde se sigue
que lı́mn→∞ pn = 0 = lı́mn→∞ qn . Por esto,
p
lı́m Sn = β
n→∞
y
q
lı́m Sn = α.
n→∞
Puesto que α 6= β, se concluye que la serie (∗) no converge contradiciendo, como habíamos
afirmado, nuestra hipótesis. La prueba es completa.
2.1.10. Familias Sumables
Del Teorema de Weierstrass-Riemann se concluye que el orden de los términos de una serie
que no es absolutamente convergente afecta tanto a su convergencia así como a su suma. En vista
de esto, es razonable formularse la siguiente pregunta: ¿es posible tener una definición alternativa
para la suma de una serie donde el orden de los términos no sea importante? La respuesta, la
cual es afirmativa, se desarrolla a través de una teoría de sumas sin orden.
Siguiendo
P la idea de la convergencia de series, intentaremos darle significado a expresiones
del tipo
i∈ I xi , donde ( xi ) i∈ I es una familia arbitraria no-numerable de números reales. Para
alcanzar ese objetivo aprovecharemos la existencia del supremo en R de cualquier subconjunto
A de R.
En lo que sigue, supondremos que I es un conjunto infinito, el cual puede ser numerable o
no-numerable y, como antes, denotemos por Pfin ( I ) la colección de todas las partes finitas de I,
esto es,
Pfin ( I ) = F ⊆ I : F es finito .
Suponga, en primer lugar, que ( xi )i∈ I es una familia de números reales no-negativos. Para cada
F ∈ Pfin ( I ), defina
X

xi
si F 6= ∅

i∈ F
s( F ) =

 0
si F = ∅.
Observe que la aplicación s : Pfin ( I ) → [0, +∞] es creciente en el siguiente sentido: si F, G ∈
Pfin ( I ), entonces
F ⊆ G ⇒ s ( F ) ≤ s ( G ).
Más aun, si F ∩ G = ∅, entonces s( F ∪ G ) = s( F ) + s( G ).
Definición 2.1.52. Sea ( xi )i∈ I una familia de números reales no-negativos. Si el conjunto de números
no-negativos {s( F ) : F ∈ Pfin ( I )} está acotado superiormente, entonces diremos que la familia ( xi )i∈ I
es sumable y escribiremos
X
xi = sup s( F ) : F ∈ Pfin ( I ) .
i∈ I
Sec. 2.1 Algunas Propiedades de los Números Reales
115
Si la familia {s( F ) : F ∈ Pfin ( I )}, en la definición anterior, no está acotada superiormente,
pondremos
X
xi = +∞.
i∈ I
En el siguiente resultado veremos que cuando I = N las nociones de serie convergente y de
familia sumable coinciden.
Teorema 2.1.53. Sea ( xn )n∈N una sucesión de números reales no-negativos. Son equivalentes:
(1) La familia ( xn )n∈N es sumable.
P
(2) La serie ∞
n =1 xn converge.
Prueba. (1) ⇒ (2). Suponga que ( xn )n∈N es sumable y sea M tal que
X
xn = sup{s( F ) : F ∈ Pfin (N )} = M.
n ∈N
∞
Pn
Claramente la sucesión
i=1 xn n =1 es creciente y acotada por M. Se sigue del Teorema 2.1.23
que ella converge. Esto prueba (2).
P∞
P∞
(2) ⇒ (1) Suponga que
n =1 xn converge y sea
n =1 xn = M para algún M ≥ 0. Considere
cualquier F ∈ Pfin (N ) y sea n F = máx{n : n ∈ F }. Tenemos entonces que
F ⊆ {1, 2, . . . , n F }
y, por lo tanto, se verifica que
X
i∈ F
xi ≤
nF
X
i=1
xi ≤ M.
De esto se sigue que sup s( F ) : F ∈ Pfin (N ) ≤ M por lo que la familia ( xn )n∈N es sumable.
La prueba es completa.
Para poder extender la noción de familia sumable a cualquier colección ( xi )i∈ I de números
reales, no necesariamente no-negativos, debemos verificar lo siguiente.
Corolario 2.1.54. Sea ( xi )i∈ I una familia sumable de números reales no-negativos. Entonces, para cada
ε > 0, existe un conjunto Fε ∈ Pfin ( I ) con la siguiente propiedad:
x−
X
xi
< ε
i∈F
para cualquier conjunto finito F ⊇ Fε .
P
Prueba. Pongamos x = i∈ I xi y sea ε > 0. De las propiedades del supremo, existe un conjunto
finito Fε ⊆ I tal que
X
X
x−ε =
xi − ε <
xi .
i∈ I
i∈ Fε
Ahora bien, en virtud de que la aplicación s es creciente, se tiene que s( Fε ) ⊆ s( F ) para cualquier
F ∈ Pfin ( I ) con F ⊇ Fε y, por consiguiente,
X
X
x−ε <
xi ≤
xi < x + ε.
i∈ Fε
i∈ F
116
Cap. 2 Los Números Reales
De esto se sigue que
x−
X
xi
( 1)
< ε
i∈ F
para cualquier conjunto finito F ⊇ Fε . Fin de la prueba.
El siguiente resultado expresa una condición similar a la Condición de Cauchy para series
convergentes.
Teorema 2.1.55 (Criterio de Cauchy). Sea ( xi )i∈ I una familia sumable de números reales no-negativos. Entonces, para cada ε > 0, existe un conjunto Fε ∈ Pfin ( I ) con la siguiente propiedad: para cualquier
G ∈ Pfin ( I ) con G ∩ Fε = ∅ se cumple que
X
xi < ε.
i∈ G
Prueba. Sea ε > 0 y use el corolario anterior para hallar un conjunto Fε ∈ Pfin ( I ) tal que
x−
X
xi
< ε
i∈ F
P
para cualquier conjunto finito F ⊇ Fε , donde x = i∈ I xi . Seleccione ahora cualquier conjunto
G ∈ Pfin ( I ) con G ∩ Fε = ∅. Entonces F = G ∪ Fε ⊇ Fε y, por lo anterior,
X
X
X
xi =
xi −
xi
i∈ G
i∈ G ∪ Fε
=
X
i∈ G ∪ Fε
≤
X
i∈ Fε
xi − x −
i∈ G ∪ Fε
xi − x +
X
i∈ Fε
xi − x
X
i∈ Fε
!
xi − x
< ε + ε = 2ε.
La prueba es completa.
Un aspecto importante que hay que destacar del Criterio de Cauchy anterior y que era de
esperarse es que casi-todos los términos de una familia sumable son ceros, en otras palabras:
Corolario 2.1.56. Si ( xi )i∈ I una familia sumable de números reales no-negativos, entonces el conjunto
I ∗ = {i ∈ I : x i > 0}
es a lo más numerable.
Prueba. Si el conjunto I es numerable, no hay nada que demostrar. Suponga entonces que I es
no-numerable y por cada n ∈ N, considere el conjunto
1
In = i ∈ I : xi ≥
.
n
Sec. 2.1 Algunas Propiedades de los Números Reales
117
S
S∞
∗
Afirmamos que I ∗ = ∞
n =1 In . Para ver esto, observe, en primer lugar, que
n =1 In ⊆ I . Para
∗
demostrar la otra inclusión, sea i ∈ I . Entonces xi > 0 y se sigue del Principio
de Arquímedes
S∞
que existe un entero m ≥ 1 tal que xi > 1/m y, por lo tanto, i ∈ Im ⊆ n=1 In . Veamos ahora
que cada uno de los conjuntos In es finito. En efecto, como la familia ( xi )i∈ I es sumable, por el
Criterio de Cauchy, Teorema 2.1.55, resulta que, por cada entero n ≥ 1, existe un Fn ∈ Pfin ( I ) tal
que
1
i 6∈ Fn ⇒ xi < .
n
(Aquí hemos tomado G = {i} de modo que G ∩ Fn = ∅). Por consiguiente, In ⊆ Fn para
n = 1, 2, . . .. Esto prueba que In es finito y, en consecuencia, I ∗ es a lo más numerable.
Estamos listo para dar, de forma general, una definición de suma para cualquier familia ( xi )i∈ I
de números reales no necesariamente no-negativos.
Definición 2.1.57. Una familia ( xi )i∈ I de números reales se llama sumable si, dado ε > 0, existe un
conjunto Fε ∈ Pfin ( I ) con la siguiente propiedad: para cualquier conjunto finito F ⊇ Fε
x−
X
xi
< ε.
i∈ F
P
Como antes, escribiremos x = i∈ I xi si la familia ( xi )i∈ I es sumable. Una pequeña aclaratoria es necesaria con respecto a la definición de una familia sumable ( xi )i∈N , cuando los xi
son números reales arbitrarios. En este caso, no es verdad que la noción de serie convergente
coincide con la de familia sumable. En la literatura sobre series, la noción de familia sumable es
equivalente a la de serie incondicionalmente convergente, un concepto que como ya hemos visto
resulta ser más fuerte que la convergencia usual de series.
Finalizamos esta sección con esta otra observación. Suponga que ( xi )i∈ I es una familia arbitraria de números reales tal que el conjunto
(
)
X
xi : F ∈ Pfin ( I )
i∈ F
está acotado, digamos, por una constante M > 0. Por cada F ∈ Pfin ( I ), considere los subconjuntos
F + = i ∈ F : xi ≥ 0
y
F − = i ∈ F : xi < 0 .
Entonces
X
i∈ F
| xi | =
X
i∈ F +
xi −
X
xi =
i∈ F −
X
xi +
i∈ F +
X
i∈ F −
xi
≤ 2M.
Esto prueba que el conjunto de números no-negativos
X
| xi | : F ∈ Pfin ( I )
i∈ F
está acotado y, en consecuencia, por la primera parte, la familia (| xi |)i∈ I es sumable. En este caso
definimos
X
X
| xi | = sup
| xi | : F ∈ Pfin ( I ) .
i∈ I
i∈ F
118
Cap. 2 Los Números Reales
La noción de familia sumable se puede llevar a cabo para sucesiones dobles en R del modo
+
siguiente: suponga que para cada (m, n) ∈ N × N, x(m,n) ∈ R y defina



 X
S = sup
x(m,n) : F ∈ Pfin (N × N ) .


( m,n)∈ F
Teorema 2.1.58. Con la notación anterior, se tiene que
∞ X
∞
X
x(m,n) = S =
m =1 n =1
∞
∞ X
X
x(m,n).
n =1 m =1
Si, además, ϕ : N → N × N es una aplicación biyectiva, entonces
S =
∞
X
x ϕ( k) .
k=1
Prueba. Sean M, N ∈ N arbitrarios y observe que
M X
N
X
x(m,n) =
m =1 n =1
De esto se sigue que
∞
M X
X
n =1 m =1
x(m,n) = lı́m
N →∞
m =1 n =1
y similarmente,
N X
∞
X
N X
M
X
x(m,n) = lı́m
M→∞
n =1 m =1
x(m,n) ≤ S.
M X
N
X
x(m,n) ≤ S
N X
M
X
x(m,n) ≤ S.
m =1 n =1
n =1 m =1
Tomando límite sobre M y N, respectivamente, en las expresiones anteriores se obtiene que
∞ X
∞
X
m =1 n =1
x(m,n) = lı́m lı́m
N →∞ N →∞
= lı́m lı́m
M X
N
X
x(m,n)
N X
M
X
x(m,n) =
m =1 n =1
M→∞ M→∞
n =1 m =1
∞ X
∞
X
n =1 m =1
x(m,n) ≤ S.
Para demostrar la otra desigualdad, tome F ∈ Pfin (N × N ). Entonces
X
( m,n)∈ F
x(m,n) ≤
∞ X
∞
X
x(m,n)
m =1 n =1
y, por lo tanto,
S ≤
Esto termina la prueba.
∞ X
∞
X
x(m,n) .
m =1 n =1
En la práctica se suele sustituir el término x(m,n) por xm,n para cada m, n ∈ N.
Sec. 2.2 Espacios Topológicos
119
2.2. Espacios Topológicos
Los intervalos abiertos son las piezas fundamentales en el desarrollo de un nuevo estudio de
las propiedades de R llamado la estructura topológica de R. Por ejemplo, R disfruta de una importantísima propiedad denominada propiedad de Hausdorff la cual establece que: para cualesquiera
dos números x, y ∈ R con x 6= y, existen intervalos abiertos Gx y Gy tales que
x ∈ Gx ,
y
y ∈ Gy
G x ∩ Gy = ∅.
En efecto, basta tomar r = | x − y|/2 y definir
Gx = ( x − r, x + r)
y
Gy = (y − r, y + r)
para comprobar que Gx ∩ Gy = ∅. En este caso también se dice que R es un espacio de Hausdorff.
Definición 2.2.1. Un conjunto G ⊆ R es abierto si, para cada x ∈ G, existe un δ > 0 tal que
( x − δ, x + δ) ⊆ G.
Denotemos por OR la colección de todos los subconjuntos abiertos de R.
establecido que la familia G cumple con las siguientes propiedades:
( a) ∅, R ∈ OR ,
(b) si {Gα : α ∈ J } es una subcolección de O, entonces
S
α∈ J
Es un hecho ya
Gα ∈ OR , y
(c) si {G1 , . . . , Gn } es cualquier subcolección finita de OR , entonces
En general, se tiene el siguiente concepto fundamental.
Tn
i=1
Gi ∈ OR .
Definición 2.2.2. Sea X un conjunto no vacío y suponga que T es una colección no vacía de subconjuntos
de X. Diremos que T es una topología sobre X siempre que dicha familia cumpla con las siguientes
propiedades:
( a0 ) ∅, X ∈ T,
(b0 ) si {Gα : α ∈ J } es cualquier colección de elementos de T, entonces
T
(c0 ) si para cualquier n ∈ N, G1 , . . . , Gn ∈ T, entonces ni=1 Gi ∈ T.
S
α∈ J
Gα ∈ T, y
Un espacio topológico es un par ( X, T ), donde X es un conjunto no vacío y T es una topología
sobre X. Los elementos de cualquier topología T sobre un conjunto X son llamados conjuntos
T-abiertos o simplemente abiertos. Una subcolección B ⊆ T se llama una base de T si para
S cualquier conjunto abierto U ⊆ X, existe una familia (Vα )α∈ I incluida en B tal que U ⊆ α∈ I Vα .
Un espacio topológico ( X, T ) se dice que es 2o numerable si existe una base de T que es numerable. Todos los espacios topológicos considerados en estas notas se supondrán ser Hausdorff, es decir,
cualesquiera sean x, y ∈ X con x 6= y, existen abiertos disjuntos U, V en X tales que x ∈ U y
y ∈ V.
120
Cap. 2 Los Números Reales
Observe que P ( X ) es claramente una topología sobre X, llamada la topología discreta.
De igual forma, {∅, X } también es otra topología sobre X conocida como la topología trivial. Ambas topología son extremas, es decir, cualquier otra topología J sobre X verifica que
{∅, X } ⊆ J ⊆ P ( X ).
Sea ( X, T ) un espacio topológico. Cualquier subconjunto no vacío Y de X puede ser considerado en sí mismo
como un espacio topológico definiendo la topología TY sobre Y del modo
siguiente: TY := G ∩ Y : G ∈ T , esto es, si V ⊆ Y, entonces
V es abierto en Y si, y sólo si, existe G ∈ T tal que V = G ∩ Y.
En este caso se dice que (Y, TY ) es un subespacio de ( X, T ) y a TY se le llama la topología
inducida por T.
Por ejemplo, si Y = [ a, b], entonces para cada x ∈ [ a, b] y δ > 0,
V ( x, δ) = [ a, b] ∩ ( x − δ, x + δ)
es abierto en [ a, b]. En particular, si δ es tal que a + δ < b, entonces V ( a, δ) = [ a, a + δ) es
abierto en [ a, b].
Sea ( X, T ) un espacio topológico y sea x ∈ X. Un subconjunto V de X se llama un entorno
abierto, o simplemente, un entorno del punto x, si existe un conjunto abierto G tal que x ∈ G ⊆
V. Un subconjunto F de X se dice que es un conjunto cerrado si X \ F es un conjunto abierto.
Se sigue de las propiedades de los conjuntos abiertos y las leyes de Morgan que:
( a0′ ) ∅ y X son conjuntos cerrados,
T
(b0′ ) si { Fα : α ∈ J } es cualquier colección de subconjuntos cerrados de X, entonces α∈ J Fα es
cerrado, y
S
(c0′ ) si para cualquier k ∈ N, F1 , . . . , Fk son subconjuntos cerrados de X, entonces ki=1 Fi también es cerrado.
Sea F un subconjunto no vacío de X. Diremos que F es un conjunto Fσ , o algunas veces,
un conjunto de tipo Fσ , si existe una sucesión ( Fn )∞
n =1 de subconjuntos cerrados en X tal que
F =
∞
[
n =1
Fn .
Sec. 2.2 Espacios Topológicos
121
La familia de todos los subconjuntos Fσ será denotada por Fσ . El complemento de un conjunto Fσ
lo llamaremos un conjunto Gδ , o simplemente, un conjunto de tipo Gδ , es decir, un conjunto G
es un Gδ si existe una sucesión ( Gn )∞
n =1 de subconjuntos abiertos en X tal que
G =
∞
\
Gn .
n =1
La familia de todos los subconjuntos Gδ será denotada por Gδ . Un conjunto que simultáneamente
se puede representar tanto como un Fσ así como un Gδ será llamado un conjunto ambiguo, es
decir, A es ambiguo si A ∈ Fσ ∩ Gδ .
Ejemplo 2.2.1. (1) Q es un Fσ , mientras que los números irracionales R r Q, es un Gδ -denso. ¿Es Q
un conjunto ambiguo? Más adelante veremos, como consecuencia del Teorema de Categoría
de Baire, que a Q le está negada la posibilidad de poder expresarse como un Gδ .
(2) Si F ⊆ R es cerrado, entonces F es un Gδ . En particular, F es ambiguo.
Prueba. Para cada n ∈ N, sea
Gn =
[
x∈ F
( x − 1/n, x + 1/n).
T
Como cada Gn es abierto y FT
⊆ Gn para todo n, resulta que F ⊆ ∞
n =1 Gn . Para demostrar la
∞
otra inclusión, tomemos y ∈ n=1 Gn . Entonces y ∈ Gn para todo n ∈ N. Fijado un n, existe
un x ∈ F tal que y ∈ ( x − 1/n,
T∞x + 1/n) lo cual dice que y ∈ F y como F es cerrado, entonces
y ∈ F = F. Esto prueba que n=1 Gn ⊆ F y termina la demostración de (2).
(3) Cualquier conjunto abierto G en R es un Fσ . En particular, G es ambiguo pues trivialmente es
un Gδ .
Observe que para todo a, b ∈ R con a < b,
[a, b) =
∞
\
( a − 1/n, b) ∈ Gδ
( a, b) =
y
n =1
∞
[
[a + 1/n, b) ∈ Fσ .
n =1
Sea E ⊆ X y considere la colección
CE =
T ⊆ X : E ⊆ T, T es cerrado
Puesto X es cerrado, resulta que CE 6= ∅. Se sigue de (b0′ ) que el conjunto
F =
\
T
T ∈ CE
es cerrado y, además, es el conjunto cerrado más pequeño que contiene a E. A E se le llama la
clausura de E. Cualquier punto x ∈ E es llamado un punto de clausura de E. Es fácil ver que
si E ⊆ F ⊆ X, entonces E ⊆ F.
Teorema 2.2.3. x ∈ E si, y sólo si, G ∩ E 6= ∅ para cualquier conjunto abierto G conteniendo a x.
122
Cap. 2 Los Números Reales
Prueba. Suponga que x ∈ E y sea G un conjunto abierto conteniendo a x. Veamos que la
igualdad G ∩ E = ∅ no puede ocurrir. Aceptando que G ∩ E = ∅ y definiendo F0 = X \ G,
tendremos
Tque F0 es un conjunto cerrado conteniendo a E pero no a x, lo cual es imposible pues
x ∈ E = F∈F F ⊆ F0 . Recíprocamente, suponga que G ∩ E 6= ∅ para todo conjunto abierto G
conteniendo a x pero que x 6∈ E. Entonces G = X \ E es un conjunto abierto conteniendo a x
pero disjunto de E. Esta contradicción establece el resultado.
Sea E un subconjunto de X. La unión de todos los conjuntos abiertos contenidos en E es llamado el
interior de E y denotado por int( E). Observe que si E no contiene ningún subconjunto abierto
no vacío, entonces int( E) = ∅. Se sigue de nuestra definición que si int( E) 6= ∅, entonces int( E)
es el conjunto abierto más grande contenido en E. Por consiguiente, x ∈ int( E) si, y sólo si, G ⊆ E
para algún conjunto abierto G conteniendo a x. De esto se sigue que si E ⊆ X, entonces:
k◮
( E )c = int( Ec ).
En efecto,
x ∈ ( E)c ⇔ x 6∈ E
⇔ G ∩ E = ∅ para algún conjunto abierto G conteniendo a x
⇔ G ⊆ Ec para algún conjunto abierto G conteniendo a x
⇔ x ∈ int( Ec ).
Uno de los resultados importantes que caracteriza a los subconjuntos abiertos de R, el cual
fue demostrado por G. Cantor y que usaremos frecuentemente, es el siguiente.
Teorema 2.2.4 (Cantor: Caracterización
de abiertos en R). Sea G ⊆ R abierto no vacío.
∞
S Entonces existe una sucesión In n=1 de intervalos abiertos y disjuntos dos a dos tal que G = ∞
n =1 In .
Prueba. Sea x ∈ G. Puesto G es abierto, existe un intervalo abierto Jx conteniendo a x tal que
Jx ⊆ G. Considere ahora la familia
Gx = J ⊆ G : J es un intervalo abierto conteniendo a x .
T
Por la observación anterior Sel conjunto Gx es no vacío y, además, x ∈
J ∈Gx J. Se sigue del
Corolario 2.1.17 que Ix = J ∈Gx J es un intervalo que es abierto (por ser unión de conjuntos
abiertos) y que, por definición, es el más grande de los intervalos abiertos que están contenidos en
G y que contienen a x. Es claro que
[
G =
Ix .
x∈G
Veamos ahora que la familia G = { Ix : x ∈ G } es disjunta. En efecto, sean x, y ∈ G y suponga
que Ix 6= Iy . Si fuese Ix ∩ Iy 6= ∅, entonces J0 = Ix ∪ Iy sería un intervalo abierto contenido en
G y conteniendo a x ya que contiene a Ix , de donde resultaría que J0 es más grande que Ix .
Esto, por supuesto, contradice la definición de Ix y, en consecuencia, Ix ∩ Iy = ∅ si x 6= y.
Si se selecciona uno, y sólo un número racional r Ix en cada uno de los intervalos Ix ∈ G,
tendremos que ningún otro intervalo abierto perteneciente a la familia G y distinto de Ix puede
contener a r Ix y, por consiguiente, la aplicación ϕ : G → Q dada por ϕ( Ix ) = r Ix para todo
x ∈ G es inyectiva. Como Q es numerable, resulta entonces que G también es numerable.
Sec. 2.2 Espacios Topológicos
123
∞
S
Finalmente, si In n=1 es una enumeración de G, entonces se tendrá que G = ∞
n =1 In y de este
modo termina la prueba.
Del último parágrafo en la demostración del resultado anterior se concluye que:
Corolario 2.2.5. Sea ( Gα )α∈ D una colección de intervalos abiertos. Si ( Gα )α∈ D es disjunta, entonces
D es a lo más numerable.
Cada uno de los intervalos abiertos In que conforman a G en el Teorema 2.2.4 se llama una
componente conexa abierta, o simplemente, una componente conexa, de G. En general, si K
es un subconjunto cerrado de [ a, b], la sucesión de intervalos abiertos y disjuntos dos a dos que,
según el Teorema 2.2.4, particionan a G = [ a, b] \ K se llaman contiguos o adyacentes a K.
Definición 2.2.6. Un espacio topológico ( X, τ ) se llama conexo si no se puede representar como la unión
de dos conjuntos abiertos no vacíos. Un subconjunto Y de X es conexo si él, como subespacio, es conexo.
Es fácil ver que que un espacio topológico ( X, τ ) es conexo si, y sólo si, los únicos subconjuntos de X que son ambos abiertos y cerrados son ∅ y X. En efecto, suponga que G ⊆ X es
abierto y cerrado. Si G 6= ∅, entonces por ser G cerrado, resulta que X \ G es un abierto no
vacío tal que X = G ∪ ( X \ G ) contradiciendo el hecho de que X es conexo. La otra implicación
es, por supuesto, inmediata.
Si x ∈ X, entonces la colección Cx constituida por todos los subconjuntos conexos de X que
contienen a x se llama la componente conexa de x. Es fácil establecer que la familia de todas la
componentes conexas de X, C = {Cx : x ∈ X }, constituyen una partición de X, es decir, C es
una familia disjunta cuya unión es X.
En el siguiente resultado se establece de modo definitivo cuáles son los subconjuntos de R
que son conexos.
Teorema 2.2.7. Un conjunto no vacío S ⊆ R es conexo si, y sólo si, S es un intervalo o consta de un
único punto.
Prueba. Suponga que S es conexo. Si S consta de único punto, no hay nada que probar. Asuma
entonces que S posee más de un punto y no es un intervalo. Esto significa, según el Lema 2.1.16,
que existen x, y ∈ S con x < y tal que el intervalo cerrado [ x, y] no está contenido en S, es
decir, existe z ∈ ( x, y) tal que z 6∈ S. Si ahora consideramos los conjuntos
U = (−∞, z) ∩ S
y
V = (z, +∞) ∩ S
resulta que U y V son subconjuntos abiertos disjuntos incluidos en S tal que S = U ∪ V. Esto,
por supuesto, contradice el hecho de que S es conexo. La otra implicación es inmediata.
Definición 2.2.8. Sea ( X, τ ) un espacio topológico y sea D ⊆ X. Se dice que D es totalmente disconexo si sus únicos subconjuntos conexos son los puntos.
La definición anterior tiene una interpretación geométrica muy interesante: significa que entre
dos puntos cualesquiera x, y ∈ D, siempre hay puntos que no pertenecen a D. Cuando D =
X, decir que X es totalmente disconexo es equivalente a afirmar que cada conjunto de τ es
simultáneamente abierto y cerrado. (Verifique esto!)
124
Cap. 2 Los Números Reales
Uno puede afinar un poco más la conclusión del Teorema
2.2.4 para derivar un resultado
∞
similar pero sin exigir que la sucesión de intervalos In n=1 sea disjunta. Recordemos antes que
si I es un intervalo acotado con extremos a y b, a < b, el interior de I es el intervalo abierto
( a, b).
Definición 2.2.9. Dos intervalos I y J se dicen que son casi-disjuntos, o no-superpuestos, si sus
interiores son disjuntos. Una colección F de intervalos se llama casi-disjunta o no-superpuesta, si sus
elementos son dos a dos casi-disjuntos.
Las expresiones: contiguos, o adyacentes, se usan como sinónimos de casi-disjuntos o nosuperpuestos. Observe que todo intervalo se puede dividir en una cantidad finita de subintervalos casi-disjuntos. En efecto, sean a1 , . . . , an puntos interiores en un intervalo I tal que
a1 < a2 < · · · < an . Si I está acotado, digamos [ a, b], entonces los intervalos I1 = [ a, a1 ], I2 =
[a1 , a2 ], . . . , In = [an , b] son casi-disjuntos. Los otros casos son similares. El siguiente es una
generalización del Teorema 2.2.4.
Lema 2.2.10 (Otra caracterización de abiertos). Sea G un subconjunto abierto no vacío de R. Entonces existe una familia numerable casi-disjunta (Kn )∞
n =1 de intervalos cerrados y acotados tal que
G =
∞
[
Kn .
n =1
Prueba. Para cada n ∈ N, considere la colección Rn de los intervalos diádicos de longitud 1/2n
definida por
k k+1
Rn =
: k∈Z .
,
2n 2n
Las siguientes propiedades son fáciles de establecer:
( a) Cada colección Rn es casi-disjunta, n ≥ 1.
S
(b) R = K∈Rn K para cada n ∈ N.
(c) Para cualesquiera n, m ∈ N con n ≥ m, todo intervalo perteneciente a Rn está contenido
en algún intervalo perteneciente a Rm .
(d) Todo intervalo perteneciente a Rn tiene longitud
1
2n .
Nuestro objetivo es construir, inductivamente, una sucesión de familias muy especiales, digamos
′
′
(R′n )∞
n =1 , de modo que Rn sea un subconjunto de Rn , para cada n ∈ N. Sea R1 el conjunto
de todos los intervalos K ∈ R1 tales que K ⊆ G. Suponga que hemos construido las familias
R1′ , R2′ , . . . , R′n y defina R′n+1 como el conjunto de todos los intervalos pertenecientes a Rn+1
que están contenidos
Sn en ′ G y que tienen interior disjunto con todos los interiores de los intervalos
pertenecientes a k=1 Rk . Finalmente, definamos
R =
∞
[
Rn′ .
n =1
Observe que cada uno de los conjuntos Rn′ es a lo más numerables y, en consecuencia, R es
numerable. Suponga ahora que K1 , K2 ∈ R son intervalos distintos, digamos K1 ∈ R′n y K2 ∈ R′m
Sec. 2.2 Espacios Topológicos
125
con n ≥ m. Si n > m entonces, por construcción, el interior de K1 es disjunto del interior de
S −1 ′
cualquier intervalo perteneciente a nk=
1 Rk , en particular, el interior de K1 es disjunto del interior
de K2 . Si n = m, se sigue de la propiedad ( a), que los interiores de K1 y K2 son disjuntos. Esto
prueba que la colección numerable R es casi-disjunta. Verifiquemos ahora que
G =
[
K.
K ∈R
S
Es claro, por construcción, que K∈R K ⊆ G. Para demostrar la otra inclusión, sea x ∈ G. Como
G es abierto, existe un n ≥ 1 tal que todo intervalo abierto con centro en x y longitud 1/2n está
contenido en G. Se sigue de las propiedades (b) y (d) que existe un K ∈ Rn tal que x ∈ K y,
además, K ⊆ G. Puede ocurrir
siguientes: (1) que K ∈ Rn′ ⊆ R
S sólo una de las dos posibilidades
′
y, en consecuencia, G ⊆ K∈R K; o, (2) que K 6∈ Rn . En este caso, existe un m < n y un
′ tal que los interiores de K y K se intersectan. En vista de la propiedad ( c), podemos
K1 ∈ Rm
1
hallar un intervalo K2 ∈ R′m conteniendo a K de modo que K1 , K2 ∈ R′m y, por consiguiente, sus
interiores se intercepten. Esto último lo que indica es que K1S= K2 , gracias a la propiedad ( a) y,
por lo tanto, x ∈ K ⊆ K1 = K2 ∈ R. En cualquier caso, x ∈ K∈R K lo cual da por finalizada la
prueba.
Teorema 2.2.11. Sea E un subconjunto no vacío de R. Son equivalentes:
( a) x ∈ E.
(b) Existe una sucesión ( xn )∞
n =1 en E tal que lı́m xn = x.
n→∞
Prueba. ( a) ⇒ (b) Sea x ∈ E. Si En = ( x − 1/n, x + 1/n) ∩ E para cada n ∈ N, entonces
En 6= ∅, y así, seleccionando un punto xn de cada En , vemos que lı́mn→∞ xn = x.
(b) ⇒ ( a) Suponga que (b) se cumple y sea G un conjunto abierto conteniendo a x. Escojamos
un ε > 0 de modo tal que ( x − ε, x + ε) ⊆ G. Por otro lado, como lı́mn→∞ xn = x, para el ε
seleccionado, existe un N ∈ N tal que | xn − x| < ε para todo n ≥ N, es decir, xn ∈ ( x − ε, x + ε)
para todo n ≥ N. Por esto, xn ∈ G ∩ E para todo n ≥ N, lo cual demuestra que G ∩ E 6= ∅ y
termina la prueba.
La siguiente definición es extremadamente útil e importante en muchas ramas del árbol de
las matemáticas.
Definición 2.2.12. Sea ( X, τ ) un espacio topológico y sea D ⊆ X. Diremos que D es denso en X si
X = D.
Ejemplo 2.2.2. (1) Q y R \ Q son los ejemplos clásicos de subconjuntos densos en R.
(2) Sea D el conjunto de los racionales diádicos en R, es decir, si denotamos por
k
Dn =
: k∈Z ,
2n
S
para cada n ∈ N, entonces D = ∞
n =1 Dn es denso en R.
En efecto, sea x ∈ R y sea ε > 0. Sin perder generalidad, asumiremos que x ∈ (0, 1]. Use el
Principio de Arquímedes para hallar un n ∈ N tal que 1/2n < ε. Para el n hallado, divida
126
Cap. 2 Los Números Reales
el intervalo (0, 1] en 2n partes iguales y observe que x ∈ ((k − 1)/2n , k/2n ] para algún entero
k = 1, . . . , 2n . Resulta de esto que | x − k/2n | ≤ 1/2n < ε y concluye la demostración.
(3) Sean D1 , D2 subconjuntos de un espacio topológico ( X, τ ) con D1 ⊆ D2 . Si D1 es denso en X,
entonces D2 también lo es y D1 = D2 = X.
Sea E un subconjunto no vacío de R. Diremos que x0 ∈ R es un punto límite de E si
existe una sucesión ( xn )∞
n =1 en E que converge a x0 . En vista del Teorema 2.2.11, los puntos
límites y los puntos de clausura son exactamente los mismos. Por otro lado, x0 ∈ R es un punto de
acumulación de E si G ∩ ( E \ { x0 }) 6= ∅ para todo conjunto abierto G conteniendo al punto x0
o, de forma equivalente, si card( G ∩ E) > 1 para todo entorno G de x0 . Denotaremos por E′
el conjunto de todos los puntos de acumulación de E. Observe que todo punto de acumulación
es un punto límite. Es fácil establecer que si x0 es un punto de acumulación de E, entonces
existe una sucesión ( xn )∞
n =1 en E que converge a x0 tal que xm 6 = xn para todo m 6 = n. Por
consiguiente, la escasa diferencia entre punto límite y punto de acumulación es que la existencia
de una sucesión convergente puede, en el primer caso, ser la sucesión constante, mientras que en
el segundo caso siempre se puede elegir una sucesión convergente cuyos términos sean distintos
dos a dos. Un punto x0 ∈ E se dice que es aislado en E si x0 6∈ E′ , es decir, si existe un entorno
G de x0 tal que G ∩ E = { x0 }.
Corolario 2.2.13. Sea E ⊆ R. Son equivalentes:
(1) E es cerrado.
(2) E′ ⊆ E.
Prueba. (1) ⇒ (2). Sea x ∈ E′ . En particular, x es un punto límite de E, de donde se sigue,
usando el Teorema 2.2.11, que x ∈ E = E, pues E es cerrado.
(2) ⇒ (1). Sea x ∈ E y suponga que x 6∈ E. Como x ∈ E, se tiene que G ∩ E 6= ∅ para
cualquier entorno G de x. Pero como x 6∈ E, resulta que G ∩ ( E \ { x}) 6= ∅, es decir, x ∈ E′ y,
así, por hipótesis, x ∈ E.
2.2.1. Espacios Métricos
Sea X un conjunto no vacío. Una métrica sobre X es una aplicación d : X × X → [0, +∞)
que cumple con las siguientes propiedades:
(1) 0 ≤ d( x, y) < +∞ para todo x, y ∈ R.
(2) d( x, y) = 0 si, y sólo si, x = y.
(3) d( x, y) = d(y, x) para todo x, y ∈ R.
(4) d( x, y) ≤ d( x, z) + d(z, y) para todo x, y, z ∈ R.
Al par ( X, d) se le llama un espacio métrico. En ocasiones, en lugar del símbolo d( x, y) escribiremos dist( x, y).
Una sucesión ( xn )∞
n =1 en el espacio métrico ( X, d) se dice que converge a un punto x si
lı́m d( xn , x) = 0.
n→∞
Sec. 2.2 Espacios Topológicos
127
La sucesión ( xn )∞
n =1 se dice que es de Cauchy si, dado ε > 0, existe un N ∈ N tal que
d( xm , xn ) < ε para todo m, n ≥ N. Diremos que ( X, d) es un espacio métrico completo si
toda sucesión de Cauchy en ( X, d) converge.
Dos hechos importantes que hay que destacar en relación a las sucesiones de Cauchy, y cuyas
pruebas se dejan a cargo del lector, son los siguientes:
(1) Si ( xn )∞
n =1 es una sucesión de Cauchy en X, entonces se puede determinar la existencia una subsucesión
∞
(nk )k=1 de enteros positivos tal que d( xnk , xnk +1 ) < 2−k para todo k ∈ N.
∞
∞
(2) Si ( xn )∞
n =1 es una sucesión de Cauchy y ( xn j ) j=1 es una subsucesión de ( xn ) n =1 que converge a
algún punto x ∈ X, entonces la sucesión ( xn )∞
n =1 también converge y lo hace hacia el mismo punto x.
Sea ( X, d) un espacio métrico. Para cada x ∈ X
U ( x, r) = y ∈ X :
B( x, r) = y ∈ X :
S( x, r) = y ∈ X :
y cada r > 0 los conjuntos
d( x, y) < r ,
d( x, y) ≤ r ,
d( x, y) = r
se llaman, respectivamente, una bola abierta, una bola cerrada y la esfera con centro en x y
radio r > 0. Un conjunto G ⊆ X se dice que es abierto en X si para cada x ∈ G, existe un
r > 0 tal que la bola abierta U ( x, r) ⊆ G. La colección de todos los subconjuntos abiertos de
X será denotada por Jd y llamada la d-topología de X o la topología generada por d. Una
subcolección B de Jd se dice que es una base para X si todo conjunto abierto en X es la unión
de alguna subcolección de miembros de B. Si la colección B es numerable, entonces diremos
que X posee una base numerable.
Sea A ⊆ X. Es un ejercicio sencillo establecer que:
x ∈ A si, y sólo si, existe una sucesión ( an )∞
n =1 en A tal que lı́m d( an , x ) = 0.
n→∞
Definición 2.2.14. Un espacio métrico ( X, d) se dice que es separable si existe un conjunto D ⊆ X que
es numerable y denso en X.
Teorema 2.2.15. Todo espacio métrico separable ( X, d) posee una base numerable.
Prueba. Para ver esto, sea D = { xn : n ∈ N } un conjunto numerable y denso de X, y considere
la colección B = {U ( xn , q) : n ∈ N, q ∈ Q }. Claramente B es numerable, de modo que sólo
resta verificar que es una base para X. En efecto, sea G un subconjunto abierto de X y sea
y ∈ G. Por definición, existe un ε > 0 tal que U (y, ε) ⊆ G. Puesto que D es denso en X,
y
y
podemos elegir un xm ∈ D de modo que 0 < d(y, xm ) < ε/2. Usemos ahora el hecho de Q es
y
denso en R para hallar un qy ∈ Q tal que d(y, xm ) < qy < ε/2. De esto se sigue
y
y, en consecuencia, G ⊆
S
y ∈ U ( xm , qy ) ⊆ U (y, ε) ⊆ G
y
y∈ G
U ( xm , qy ). Esto prueba que B es una base numerable para X. Un espacio métrico ( X, d) se dice que es Polaco si él es completo y separable. En general, cualquier espacio topológico ( X, τ ) para el cual exista una métrica completa d tal que la
d-topología Jd coincida con τ es llamado un espacio Polaco. Por ejemplo, cualquier espacio
compacto metrizable es un espacio Polaco. Una de las propiedades fundamentales de los espacios Polacos es que cualquier subespacio abierto, así como cada subespacio cerrado, en un espacio
Polaco X siguen siendo Polacos.
128
Cap. 2 Los Números Reales
Definición 2.2.16. Sean A y B subconjuntos de ( X, d). La distancia entre A y B se define por
dist( A, B) = ı́nf d( a, b) : a ∈ A, b ∈ B .
Observe que si A ∩ B 6= ∅, entonces dist( A, B) = 0, es decir, la condición dist( A, B) = 0 no
implica, en general, que A = B. Más adelante veremos bajo qué condiciones sobre los conjuntos
A y B se obtiene que dist( A, B) = 0.
En particular, si x ∈ X y A es un subconjunto no vacío de X, la distancia entre x y A, se
define como
dist( x, A) = dist({ x}, A) = ı́nf d( x, a) : a ∈ A .
Es una tarea fácil establecer las siguientes propiedades:
( a) dist( x, A) = dist( x, A),
(b) dist( x, A) = 0 si, y sólo si, x ∈ A, y
(c) dist( x, A) − dist(y, A) ≤ d( x, y) cualesquiera sean x, y ∈ X.
Un conjunto A ⊆ X se dice que es acotado si existe una bola cerrada que lo contiene. Si A es
acotado, el diámetro de A, diam( A), se define mediante el número
diam( A) = sup d( a, b) : a, b ∈ A .
Pondremos diam( A) = ∞, si el conjunto A no es acotado. Observe que si A es un subconjunto
acotado de R, entonces gracias al Corolario 2.1.13 se tiene que
diam( A) = sup A − ı́nf A.
El siguiente resultado es una pieza fundamental para la demostración de varios resultados
importantes en Análisis, entre ellos, el irrenunciable Teorema de Categoría de Baire.
Teorema 2.2.17 (Encaje de Cantor). Sea ( Fn )∞
n =1 una sucesión de subconjuntos cerrados no vacíos
en un espacio métrico completo ( X, d) tal que
( a) F1 ⊇ F2 ⊇ · · · ⊇ Fn ⊇ · · · , y
(b) lı́m diam( Fn ) = 0.
n→∞
Entonces existe un único x0 ∈ X tal que
T∞
n =1 Fn
= { x0 }.
Prueba. Por cada n ∈ N, seleccionemos un único xn ∈ Fn . Afirmamos que la sucesión ( xn )∞
n =1
es de Cauchy en X. En efecto, sea ε > 0 y usemos el hecho de lı́mn→∞ diam( Fn ) = 0 para elegir
un entero N > 0 tal que diam ( FN ) < ε. Como la sucesión ( Fn )∞
n =1 es decreciente, se sigue que
si m, n ≥ N, entonces d( xn , xm ) < ε. En efecto, como xn ∈ Fn ⊆ FN y también xm ∈ Fm ⊆ FN ,
resulta que d( xn , xm ) ≤ diam( FN ) < ε. Por esto ( xn )∞
n =1 es de Cauchy y por la completitud
de X ella converge a un x0 ∈ X. Puesto que todos los términos de la sucesión ( xn )∞
n =1 , salvo
un número finito de ellos se quedan
dentro
de
F
para
todo
k
∈
N,
resulta
que
x
∈
F k = Fk
0
k
T∞
para todo k ∈ N. Por esto, x0 ∈ k=1 Fk . Para demostrar la otra inclusión,
observe que como
T
T∞
∞
F
⊆
F
para
todo
m
∈
N,
entonces
la
existencia
de
algún
y
∈
F
nos indicaría que
n
m
n
n =1
n =1
x0 , y ∈ Fm y, por consiguiente, d( x0 , y) ≤ diam( Fm ) → 0 cuando m → ∞. Esto prueba que
y = x0 y termina la demostración.
Cantor demostró, como ya vimos, que R es no-numerable usando su incuestionable Método
de la Diagonal. Otra forma de ver eso es aplicando el Teorema de Encaje de Cantor.
Sec. 2.2 Espacios Topológicos
129
Corolario 2.2.18 (Cantor). R es no-numerable.
Prueba. Es suficiente demostrar, por (Nu3 ), página 13, que [0, 1] es no-numerable. De nuevo,
para fabricar una contradicción, suponga que [0, 1] es numerable y sea
x1 , x2 , . . . , x n , . . .
una lista de todos los números
en [0, 1]. Nuestra tarea será construir una sucesión decreciente de
∞
intervalos cerrados In n=1 en [0, 1] tal que
ℓ( In ) < 1/3n
y
xn 6∈ In
( 1)
para todo n ≥ 1. En efecto, divida [0, 1] en tres intervalos cerrados de igual longitud, es decir,
[0, 1/3], [1/3, 2/3] y [2/3, 1]. Es claro que x1 no puede estar en los 3 intervalos. Sea I1 uno
de esos intervalos para el cual x1 6∈ I1 . Proceda, como antes, dividiendo el intervalo I1 en tres
subintervalos cerrados cada uno de longitud 1/32 . Por supuesto, uno de esos intervalos, al que
denotaremos por I2 , no contiene a x2 . Si se continúa indefinidamente con este procedimiento
se obtiene una sucesión decrecientes de intervalos compactos satisfaciendo (1). Del Teorema de
Encaje de Cantor se sigue la existencia un único x0 ∈ [0, 1] tal que
∞
\
n =1
In = { x0 }.
Puesto que x0 ∈ In para todo n ≥ 1, se sigue de nuestra construcción que x0 6= xn para todo
n ≥ 1 obteniéndose, de este modo, una contradicción pues hemos encontrado un número en
[0, 1], el susodicho x0 , que no está en lista. Por esto, [0, 1] es no-numerable.
Nota Adicional 2.2.2 El siguiente resultado es otra versión del Teorema de Encaje de Cantor en
R que no requiere que los conjuntos sean cerrados:
∞
Teorema 2.2.19 (Intervalos Encajados de Cantor). Sea In n=1 una sucesión de intervalos en
R. Suponga que cada In es acotado con extremos an y bn y que:
( a) I1 ⊇ I2 ⊇ · · · ⊇ In ⊇ · · · y
(b) lı́m ℓ( In ) = 0.
n→∞
Entonces existe un único x0 ∈ R tal que x0 ∈
T∞
n =1 In .
Nótese que no se asume que los intervalos In sean cerrados, aunque la conclusión es que
an ≤ x0 ≤ bn para todo n ≥ 1. Observe que esto último no significa que x0 ∈ In para todo
n ≥ 1 como se puede ver, por ejemplo, si elegimos In = (0, 1/n) para todo n ≥ 1. Por
supuesto, la prueba es idéntica al Teorema 2.2.17 tomando Fn = In para cada n ≥ 1.
Definición 2.2.20. Un punto x ∈ R se dice que es un punto de condensación de un conjunto E ⊆
R, si la intersección de E con cada entorno abierto V de x es un conjunto no-numerable o, de modo
equivalente, si card( E ∩ V ) = c para todo entorno abierto V de x.
Si denotamos por Pc el conjunto de los puntos de condensación de E, resulta que
Pc ⊆ E′ ⊆ E
130
Cap. 2 Los Números Reales
Teorema 2.2.21. Si E es un subconjunto no-numerable de R, entonces E contiene al menos un punto
de condensación.
Prueba. Puesto que R =
S∞
n =1 [− n, n ],
entonces
E = E∩R =
∞
[
n =1
E ∩ [−n, n]
y como E es no-numerable, debe existir algún N tal que E ∩ [− N, N ] es no-numerable. Divida
el intervalo [− N, N ] en dos subintervalos cerrados no-superpuestos de igual longitud. Uno de
ellos, que denotaremos por F1 , tiene la propiedad de que F1 ∩ E es no-numerable. De nuevo,
divida el intervalo F1 en dos subintervalos cerrados no-superpuestos de igual longitud y, como
antes, la intersección de uno de ellos con E es no-numerable. Llamémoslo
F2 . Si continuamos
∞
indefinidamente con este procedimiento obtenemos una sucesión Fn n=1 de intervalos cerrados
con las siguientes propiedades:
(1) F1 ⊇ F2 ⊇ · · · ⊇ Fn ⊇ · · · ,
(2) lı́m diam( Fn ) = 0 y
n→∞
(3) Fn ∩ E es no-numerable para todo n ≥ 1.
T
Se sigue del Teorema de Encaje de Cantor que ∞
n =1 Fn = { x0 }. Claramente x0 ∈ E y como
lı́mn→∞ diam( Fn ) = 0, resulta que cualquier entorno V de x0 contiene a uno de los Fm para un
cierto m y, por consiguiente, V ∩ E ⊇ Fm ∩ E es un conjunto no-numerable. Esto nos revela que
x0 es un punto de condensación de E y termina la prueba.
Definición 2.2.22. Un subconjunto P de R se llama perfecto si él cerrado y todos sus puntos son puntos
de acumulación.
El siguiente resultado establece que todo subconjunto cerrado no-numerable de R se puede
particionar en dos conjuntos, uno de ellos siendo perfecto y el otro a lo más numerable.
Teorema 2.2.23 (Cantor-Bendixson). Sea E un subconjunto cerrado no-numerable de R. Entonces
E se puede escribir en la forma E = P ∪ N, donde P es perfecto y N es a lo más numerable.
Prueba. Defina P = x ∈ E : x es punto de condensación de E
y sea N = E \ P. Observe que
x ∈ N ⇔ existe un entorno Vx de x tal que card(Vx ∩ E) ≤ ℵ0 .
Veamos que N es a lo más numerable. En efecto, sea V = (Vn )∞
n =1 una enumeración de todos
los intervalos abiertos con extremos racionales. Sabemos que V es numerable. Para cada x ∈ N,
seleccionemos un miembro Vx ∈ V tal que x ∈ Vx y Vx ∩ E es a lo más numerable. Resulta
entonces que la subcolección
V∗ = Vx ∈ V : x ∈ Vx , Vx ∩ E es a lo más numerable
es numerable y se cumple que
N =
[
x∈ N
Vx ∩ E ⊆
[
Vx ∈V∗
Vx ∩ E,
Sec. 2.2 Espacios Topológicos
131
es decir, N está incluido en una unión numerable de conjuntos a lo más numerables y, por tanto,
N es a lo más numerable.
P es cerrado. Para demostrar esta afirmación observe que por el Teorema 2.2.21, P 6= ∅. Sea
x ∈ P y sea Gx un entorno de x. Entonces Gx ∩ P 6= ∅. Sea z ∈ Gx ∩ P. Como Gx un
entorno de z ∈ P, él contiene, por definición, una cantidad no-numerable de puntos de E, lo
cual significa que x ∈ P y, así, P es cerrado.
Veamos ahora que P′ = P. En efecto, puesto que todo punto de condensación de E es
claramente un punto de acumulación, tenemos que P ⊆ P′ . Por otro lado, como P es cerrado, se
sigue del Corolario 2.2.13 que P′ ⊆ P. Esto prueba que P es perfecto y que E = P ∪ N.
En el siguiente resultado se establece que uniones de familias arbitrarias de conjuntos abiertos
en R siempre se pueden reducir a uniones numerables. Ese resultado constituye, por supuesto,
una buena economía y revela, una vez más, el gran poder de los conjuntos abiertos.
Teorema 2.2.24 (Lindelöf). Si V = Vα : α ∈ D es cualquier colección de subconjuntos abiertos
no vacíos de R, entonces existe una subcolección numerable Vn ∈ V : n ∈ N de V tal que
[
α∈ D
Vα =
∞
[
Vn .
n =1
Prueba. Sea J la familia de todos los intervalos abiertos no-degenerados cuyos extremos son
números
∞racionales. Puesto que Q es numerable, resulta que la colección J también es numerable.
Sea Jn n=1 una enumeración de J. Fijemos α ∈ D. Como Vα es abierto, para cada x ∈ Vα
podemos determinar un intervalo Jn x ∈ J tal que x ∈ Jn x ⊆ Vα . Es claro que
[
[
Vα =
Jn x .
α∈ D
n x ∈N
Finalmente, por cada intervalo Jn x , seleccionemos el correspondiente conjunto Vn x tal que Jn x ⊆
Vn x . Entonces
[
[
[
[
Vα =
Jn x ⊆
Vn x ⊆
Vα
y termina la prueba.
α∈ D
n x ∈N
n x ∈N
α∈ D
Una de las nociones topológicas más importantes y que se usa frecuentemente es la de compacidad. Sea K un subconjunto de un espacio topológico ( X, T ).
Definición 2.2.25. Una colección V = Vα : α ∈ D de subconjuntos
de X se dice que es un cubriS
miento abierto de K si cada Vα es un conjunto abierto y K ⊆ α∈ I Vα .
Si D0 es un subconjunto de D y si la subcolección V0 = Vα : α ∈ D0 cubre a K, entonces
decimos que V0 es un subcubrimiento de K. Si D0 es finito, diremos que V0 es un subcubrimiento finito de K. Los conjuntos compactos tiene la virtud de reducir a cubrimientos finitos
cualquier cubrimiento infinito.
Definición 2.2.26. Un subconjunto
K de un espacio topológico ( X, T ) se dice que es compacto si cual
quier cubrimiento abierto V = SVα : α ∈ D de K se reduce a un subcubrimiento finito, es decir, existen
Vα1 , . . . , Vαn en V tal que K ⊆ nk=1 Vαk .
132
Cap. 2 Los Números Reales
Lema 2.2.27. Sea (Kn )∞
n =1 una sucesión subconjuntos compactos de un espacio topológico ( X, T ).
Entonces:
( a) K1 ∪ · · · ∪ Kn es compacto para cualquier n ∈ N.
(b)
∞
\
Kn es compacto.
n =1
Prueba. ( a). Sea V = Vα : α ∈ D
un cubrimiento abierto de K1 ∪ · · · ∪ Kn . Como V es un
Sn
j
j
j
cubrimiento abierto de cada K j existen Vα1 , . . . , Vαn j en V tal que K j ⊆ i=j 1 Vαi . Luego
K1 ∪ · · · ∪ K n ⊆
nj
n [
[
j
Vαi
j=1 i=1
y termina la prueba de ( a). El lector puede consultar la demostración del Teorema 2.2.34, página 134, para una prueba sencilla de la parte (b).
Teorema 2.2.28. Todo intervalo [ a, b], con a, b ∈ R, a < b, es compacto.
Prueba. Suponga que [ a, b] no es compacto. Esto significa que existe un cubrimiento abierto
de [ a, b], digamos V = {Vα : α ∈ D }, con la propiedad de que ninguna subfamilia finita de
V cubre a [ a, b]. Vamos ahora, con esa hipótesis, a fabricar una contradicción. Comencemos.
Dividamos el intervalo I1 = [ a, b] en dos subintervalos de igual longitud. Al menos uno de esos
dos intervalos, que denotaremos por I2 , no puede ser cubierto por una subfamilia finita de V.
Dividamos de nuevo el intervalo I2 en dos subintervalos de igual longitud y, como antes, uno de
ellos, que denotaremos por I3 , no puede ser cubierto por una subfamilia
∞finita de V. Si repetimos
indefinidamente el procedimiento anterior se obtiene una sucesión In n=1 de intervalos cerrados
con las siguientes propiedades:
(1) I1 ⊇ I2 ⊇ · · · ⊇ In ⊇ · · · ,
b−a
= 0, y
2n
(3) ninguna subfamilia finita de V cubre a ninguno de los In , n = 1, 2, . . .
(2) lı́m diam( In ) = lı́m
n→∞
n→∞
El Teorema de Encaje de Cantor, Teorema 2.2.17, nos garantiza entonces la existencia de un único
x0 ∈ R tal que
∞
\
In = { x0 }.
S
n =1
Como x0 ∈ I1 = [ a, b] ⊆ α∈ D Vα , existe un α ∈ D tal que x0 ∈ Vα . Siendo Vα un conjunto
abierto, existe un intervalo abierto ( x0 − ε, x0 + ε) ⊆ Vα para algún ε > 0. Por otro lado, usando
(2), podemos hallar un N ∈ N de modo tal que (b − a)/N < ε y, en consecuencia, el intervalo
IN ⊆ ( x0 − ε, x0 + ε) ⊆ Vα . Esto último es incompatible con nuestra construcción de los intervalos
In , ya que por (3), ninguno de tales intervalos puede ser cubierto por una subfamilia finita de V.
Esta contradicción establece que [ a, b] es compacto y termina la prueba.
Recordemos que si K ⊆ R, entonces un subconjunto V ⊆ K es abierto en K si, y sólo si, V es
de la forma V = G ∩ K para algún conjunto abierto G ⊆ R.
Sec. 2.2 Espacios Topológicos
133
Teorema 2.2.29. Sea K ⊆ R compacto. Entonces
(1) K es cerrado y acotado.
(2) Si F ⊆ K es cerrado, entonces F es compacto.
Prueba. (1). Puesto que R =
S∞
n =1 (− n, n ),
resulta entonces que
K = K∩R =
∞
[
n =1
K ∩ (−n, n)
y por lo dicho anteriormente, la colección {K ∩ (−n, n) : n = 1, 2, . . . } es un cubrimiento abierto
S
del compacto K y, por consiguiente, existen n1 , . . . , nk en N tal que K = kj=1 K ∩ (−n j , n j ). Si
ahora definimos N = máx{n1 , . . . , nk }, vemos que K ⊆ (− N, N ) y, por lo tanto, K es acotado.
Probemos ahora que K es cerrado. Para este fin, fijemos un x0 ∈ R \ K. Para cada x ∈ K, usemos
el hecho de que R es Hausdorff para hallar
conjuntos abiertos y disjuntos Vx y Vx ( x0 ) de x
y x0 respectivamente. Observe que V = Vx : x ∈ K es un cubrimiento abierto de K con la
propiedad de que x0 6∈ Vx para todo x ∈ K. La
compacidad de K permite reducir
S el cubrimiento
anterior a un subcubrimiento finito, digamos, Vx1 , . . . , Vxn . Claramente G = ni=1 Vxi es abierto
con x0 ∈ G ⊆ R \ K. Esto prueba que R \ K es abierto, y así, K es cerrado.
(2). Suponga que F es un subconjunto cerrado de K. Sea V un cubrimiento abierto de F. Como
F es cerrado, entonces R \ K es abierto y, en consecuencia, V ∪ (R \ K ) es un cubrimiento abierto
de
K. Por compacidad, existen V1 , . . . , Vn en V tal que K ⊆ V1 ∪ · · · ∪ Vn ∪ (R \ K ). Claramente
V1 , . . . , Vn es un cubrimiento de F.
Teorema 2.2.30 (Heine-Borel). Un subconjunto no vacío K ⊆ R es compacto si, y sólo si, K es
cerrado y acotado.
Prueba. Si K es compacto, entonces el Teorema 2.2.29 nos dice que K es cerrado y acotado.
Recíprocamente, suponga que K es cerrado y acotado. Sean a = ı́nf K y b = sup K. Puesto que
K ⊆ [ a, b] es, por hipótesis, un subconjunto cerrado del compacto [ a, b] entonces, por una nueva
aplicación del Teorema 2.2.29, tenemos que K es compacto.
Una consecuencia de los Teoremas de Heine-Borel y de Bolzano-Weierstrass es el siguiente
resultado que establece que sucesiones son suficientes para caracterizar compacidad, un resultado que
también es válido para cualquier compacto viviendo en un espacio métrico arbitrario.
Teorema 2.2.31 (Weierstrass). Sea K un subconjunto no vacío de R. Las siguientes condiciones son
equivalentes:
(1) K es compacto.
(2) K es secuencialmente compacto, es decir, cualquier sucesión en K posee una subsucesión que
converge a algún punto de K.
Prueba. (1) ⇒ (2). Suponga que K es compacto. Por el Teorema de Heine-Borel, K es cerrado y
∞
acotado. Sea ( xn )∞
n =1 una sucesión en K. Como K es acotado, también lo es la sucesión ( xn ) n =1 ,
y entonces, por el Teorema de Bolzano-Weierstrass, ella posee una subsucesión convergente a un
punto de K pues K es cerrado.
134
Cap. 2 Los Números Reales
(2) ⇒ (1). Suponga que (2) se cumple. Veamos que K es cerrado y acotado. Para demostrar
que K es cerrado, tomemos x ∈ K. Entonces existe una sucesión ( xn )∞
n =1 en K tal que xn → x.
∞
Por hipótesis, existe una subsucesión de ( xn )n=1 que converge a un punto y ∈ K y, por supuesto,
x = y ∈ K. Esto prueba que K es cerrado. Para verificar que K es acotado, suponga que no
lo es. Esto significa que, para cada n ∈ N, existe un xn ∈ K tal que | xn | > n. Por hipótesis,
∞
existe una una subsucesión ( xnk )∞
k=1 de ( xn ) n =1 que converge a un punto x0 ∈ K. Aquí viene la
contradicción: como toda sucesión convergente es acotada, existe una constante M > 0 tal que
| xnk | ≤ M para todo k ∈ N, sin embargo, por construcción | xnk | ≥ nk > k para todo k ∈ N.
Esto revela que k ≤ M para todo k ∈ N, es decir, la sucesión de todos los números naturales
está acotada lo cual es imposible. Por esto K es acotado y termina la prueba.
Las aplicaciones del Teorema de Weierstrass son amplias. He aquí una de ellas que usaremos
un poco más adelante.
Teorema 2.2.32. Si A es cerrado, B es compacto y A ∩ B = ∅, entonces dist( A, B) > 0.
Prueba. Suponga que dist( A, B) = 0. Entonces, por definición, para cada n ∈ N, existen an ∈ A
y bn ∈ B tales que | an − bn | < 1/n. Ahora bien, como B es compacto se sigue del Teorema de
∞
Weierstrass que existe una subsucesión (bnk )∞
k=1 de ( bn ) n =1 tal que bn k → b ∈ B. Por supuesto,
∞
∞
la correspondiente subsucesión ( ank )k=1 de ( an )n=1 también converge y lo hace hacia b. Más
aun, como A es cerrado, resulta que b ∈ A, de donde se obtiene la incuestionable contradicción
b ∈ A ∩ B = ∅.
Del Teorema 2.2.29 también
se deduce que si (Kα )α∈ I es una familia arbitraria de subconjunT
tos compactos, entonces α∈ I Kα es compacto, aunque dicha intersección puede ser vacía. Sin
embargo,
si la familia (Kα )α∈ I es numerable, digamos (Kn )∞
n =1 , y además decreciente, entonces
T∞
K
.
Lo
anterior
permite
justificar
la
siguiente
definición.
6
=
∅
n
n =1
Definición 2.2.33. Una familia ( Fα )α∈ I de subconjuntos de un espacio topológico ( X T ) se dice que
tiene
T la propiedad de intersección finita (PIF) si, para cada subconjunto finito F ⊆ I, se cumple que
α∈ F Fα 6 = ∅.
Una de las tantas caracterizaciones hermosas que poseen los espacios compactos de Hausdorff
es la siguiente:
Teorema 2.2.34. Sea K un subconjunto no vacío de un espacio topológico ( X, T ). Son equivalentes:
(1) K es compacto.
(2) Para cualquier familia (Kα )α∈ D de subconjuntos cerrados de K con la propiedad de intersección
finita se cumple que
\
K α 6 = ∅.
α∈ D
Prueba. (1) ⇒ (2). Suponga que K es compacto y sea (Kα )α∈ D una familia
de subconjuntos
T
cerrados de K con la propiedad de intersección finita. Si ocurriera que α∈ D Kα = ∅, entonces,
tomando Vα = R r Kα para cada α ∈ D, resultaría que la familia (Vα )α∈ D sería un cubrimiento
abierto de K del que, por la compacidad deTK, se podría extraer un subcubrimiento finito, digamos Vα1 , . . . , Vαn . De esto se seguiría que nk=1 Kαk = ∅ lo cual es una contradicción. La otra
implicación es más sencilla de probar y se deja a cargo del lector.
Una consecuencia inmediata del resultado anterior es el siguiente.
Sec. 2.2 Espacios Topológicos
135
Corolario 2.2.35. Si (Kα )α∈ I es una
T familia decreciente de subconjuntos compactos no vacíos de un
espacio topológico ( X, T ), entonces α∈ I Kα es compacto y no vacío.
Prueba. Puesto
T que cualquier intersección finita de los Kα es no vacía, se sigue del Teorema 2.2.34
que K := α∈ I Kα es no vacío y, además, como K es cerrado (por ser intersección de conjuntos
cerrados, Teorema 2.2.29) y contenido en el compacto K1 tenemos, por una nueva aplicación del
Teorema 2.2.29, que K es compacto.
2.2.2. El Teorema de Categoría de Baire
Ya hemos visto, un resultado de George Cantor, que R es un conjunto no-numerable, lo que
también es equivalente a afirmar que ninguna colección numerable de puntos de R puede ponerse
en correspondencia uno a uno con todos los elementos de R. René Baire extiende el resultado de
Cantor al demostrar que ninguna colección numerable de conjuntos de primera categoría puede cubrir
a R. Esto se obtendrá como consecuencia de un extraordinario resultado de mayor alcance que el
de Cantor llamado el Teorema de Categoría de Baire. Recordemos que conjunto D de un espacio
métrico ( X, d) es denso en X si D = X. Notemos que ello significa que el conjunto cerrado
más pequeño que contiene a D es precisamente X. En general, sean A y B subconjuntos de
X y suponga que A ⊆ B. Diremos que A denso en B si B ⊆ A. Una condición equivalente
a la definición de densidad que no hace referencia a ningún punto del espacio y que se usa
frecuentemente es el siguiente:
Teorema 2.2.36. Sean ( X, d) un espacio métrico y D un subconjunto no vacío de X. Entonces, D es
denso en X si, y sólo si, para cada subconjunto abierto no vacío G de X, G ∩ D 6= ∅.
Prueba. Supongamos que D es denso en X y sea G un subconjunto abierto no vacío de X. Si se
diera el caso que G ∩ D = ∅, entonces F = X \ G sería un conjunto cerrado conteniendo a D y,
en consecuencia, D ⊆ F 6= X, lo que contradice la densidad de D.
Recíprocamente, suponga que G ∩ D 6= ∅ para cada subconjunto abierto no vacío G de X. De
ocurrir D 6= X, entonces G := X \ D sería un conjunto abierto no vacío que satisface G ∩ D = ∅.
Esta contradicción establece que D = X.
Puesto que todo conjunto abierto no vacío G se puede expresar como una unión numerable
y disjunta de intervalos abiertos no vacíos, resulta que para demostrar que un conjunto D ⊆ R
es denso en R sólo basta con verificar que D ∩ I 6= ∅ para cualquier intervalo abierto I.
El siguiente principio es fundamental en matemáticas.
k◮
Principio del Palomar o de Dirichlet. Si n palomas se distribuyen en m palomares
y si n > m, entonces al menos uno de los palomares debe contener más de una paloma.
Teorema 2.2.37 (Kronecker). Sea ξ ∈ R un número irracional. Entonces el conjunto
Dξ = x ∈ R : x = p + qξ, p, q ∈ Z
es numerable y denso en R.
Prueba. Claramente la aplicación f : Dξ → N × N definida por f ( p + qξ ) = ( p, q) es inyectiva
y como N × N es un conjunto numerable, se sigue del Teorema 1.2.6, página 13, que Dξ es
numerable.
136
Cap. 2 Los Números Reales
Para demostrar la densidad de Dξ en R, sea I un intervalo abierto arbitrario y veamos que
Dξ ∩ I 6= ∅. Lo primero que vamos a hacer es demostrar la siguiente:
Afirmación: Para cada n ∈ N, existe un único pn ∈ Z tal que
pn + nξ ∈ (0, 1).
En efecto, sea m = [nξ ] la parte entera de nξ. Entonces m ≤ nξ < m + 1 y, así, 0 ≤ −m + nξ < 1.
Ahora bien, como n ≥ 1 y ξ es irracional, resulta que −m + nξ > 0 y, en consecuencia, si
hacemos pn = −m, entonces pn + nξ ∈ (0, 1) y nuestra afirmación queda demostrada.
Puesto que I es un intervalo no vacío, su longitud ℓ( I ) > 0 y, por consiguiente, existe
un k ∈ N tal que ℓ( I ) > 1/k. Dividamos el intervalo (0, 1) en k partes iguales y disjuntas,
digamos J1 , . . . , Jk . Escojamos ahora k + 1 enteros distintos n1 , . . . , nk+1 y hagamos uso de
nuestra afirmación para seleccionar enteros pn1 , . . . , pnk +1 de modo que x j = pn j + n j ξ ∈ (0, 1)
para j = 1, . . . , k + 1. Puesto que ξ es irracional, todo los x′j s son distintos y entonces, por el
Principio del Palomar, dos de tales puntos, digamos xi y xl pertenecen a uno, y sólo uno, de los
intervalos anteriores al que denotaremos por Jj0 y, en consecuencia, | xi − xl | < 1/k. Esto, por
supuesto, nos indica que podemos elegir un entero m tal que
m xi − xl ∈ I.
( 1)
Por otro lado, como x j = pn j + n j ξ para j = 1, . . . , k + 1, resulta entonces que
m xi − xl
= m pn i − pn l + m n i − n l ξ ∈ Dξ .
De (1) y (2) se sigue que m xi − xl
completa.
( 2)
∈ Dξ ∩ I y, por lo tanto, Dξ ∩ I 6= ∅. La prueba es
Nota Adicional 2.2.3 Con un argumento similar al anterior, se prueba que el conjunto
Dξ2 =
x ∈ R : x = 2p + qξ, p, q ∈ Z
también es denso en R. En efecto, la demostración es idéntica a la dada en el Teorema de
Kronecker, sólo se reemplaza el intervalo (0, 1) por el intervalo (0, 2) en la Afirmación.
Observe, además, que cada conjunto Dξ con ξ ∈ R \ Q es un subgrupo (aditivo) de R y
la familia Dξ = { x + Dξ : x ∈ R } es una partición (disjunta) de R. Para ver esto último,
considere la siguiente relación sobre R:
x∼y
⇔
x − y ∈ Dξ .
Es fácil establecer que ∼ es una relación de equivalencia sobre R por lo que la colección
E = { x + Dξ : x ∈ R } formada por todas las clases de equivalencias determinadas por ∼
es una partición de R. Estos conjuntos pueden ser usados para justificar, vía el Axioma de
Elección, la existencia de conjuntos no medibles según Lebesgue.
Definición
2.2.38. Sean ( X, d) un
espacio métrico y E ⊆ X. Diremos que E es nunca-denso en X, si
int E = ∅. Si ocurre que int E 6= ∅, entonces se dice que E es denso en alguna parte de R.
Sec. 2.2 Espacios Topológicos
137
El término conjunto raro se usa, con cierta frecuencia, como un sinónimo de conjunto nuncadenso. Por supuesto, E es nunca-denso si, y sólo si, E es nunca-denso. Observe que un conjunto
nunca-denso no puede ser un entorno de ninguno de sus puntos y, por consiguiente,
E es nunca-denso si, y sólo si, para cada conjunto abierto no vacío G ⊆ X, existe un conjunto
abierto no vacío J ⊆ G tal que J ∩ E = ∅.
Prueba. En efecto, suponga que existe un subconjunto abierto no vacío G de X con la
propiedad de que cualquier subconjunto abierto no vacío de G intersecta a E. Esto, por
supuesto, significa que E contiene a G lo que es imposible por ser E nunca-denso.
Teorema 2.2.39. Sea F un subconjunto cerrado de un espacio métrico ( X, d). Para cualquier B ⊆ F se
cumple que
F r int ( B ) = F r B.
(2.2.1)
En particular, int ( B ) = ∅ si, y sólo si, F r B es denso en F.
Prueba. Puesto que int ( B ) ⊆ B, resulta entonces que F r B ⊆ F r int ( B ) y, como además,
F r int ( B ) es cerrado, se concluye que
F r B ⊆ F r int ( B ).
/ F r B. Entonces existe un entorno Gx de x tal
Por otro lado, suponga que x ∈ F con x ∈
que Gx ∩ ( F r B) = ∅. Esto, por supuesto, significa que x ∈ Gx ⊆ B, lo cual quiere decir que
x ∈ int ( B ) y, en consecuencia, x ∈
/ F r int ( B ). Hemos demostrado que F r int ( B ) ⊆ F r B y
termina la prueba.
Si en el resultado anterior tomamos F = X y B ⊆ X, entonces
B es nunca-denso
⇔
X \ B es denso en X.
Definición 2.2.40. Sea A un subconjunto de un espacio métrico ( X, d). Diremos que
∞
( a) A es de primera
categoría
en
X
si
existe
una
sucesión
A
de subconjuntos nunca-densos de X
n
n =1
S∞
tal que A = n=1 An .
(b) A es de segunda categoría en X si él no es de primera categoría.
∞
S
Es claro que si Bn n=1 es una sucesión de conjuntos de primera categoría, entonces ∞
n =1 A n
es de primera categoría. Es bien conocido que Q y R \ Q son ambos densos en R. Más aun,
para cada número irracional ξ, el conjunto ξ · Q = ξ · r : r ∈ Q es denso en R. Sin embargo,
si D es cualquier subconjunto a lo más numerable de números irracionales, entonces existen
intersecciones de la forma
\
ξ · Q,
ξ ∈D
que pueden ser vacías. ¿Cuándo se puede garantizar que cualquier intersección numerable de
conjuntos densos sea siempre no vacía? La respuesta viene dada por uno de los resultados más
prolíficos del análisis : el Teorema de Categoría de Baire (véase, por ejemplo, el libro [23] donde
se muestran sorprendentes y casi inimaginables aplicaciones de dicho teorema).
Teorema 2.2.41 (Categoría de Baire). Sea ( X, d) un espacio métrico completo.
Si ( Gn )∞
n =1 es una
T∞
sucesión de subconjuntos no vacíos, abiertos y densos en X. Entonces G = n=1 Gn es un Gδ -denso
en X.
138
Cap. 2 Los Números Reales
Prueba. Sea V un conjunto abierto no vacío de X. Queremos demostrar que
V∩
∞
\
n =1
Gn 6 = ∅.
Como G1 es abierto y denso en X, se tiene que V ∩ G1 es abierto y no vacío. Escoja un punto
x1 ∈ V ∩ G1 y seleccione un conjunto abierto J1 ⊆ V ∩ G1 con las siguientes propiedades:
x1 ∈ J1 ,
diam( J1 ) <
1
,
2
J1 ⊆ V ∩ G1 .
Como J1 es un conjunto abierto no vacío y G2 es abierto y denso en X, resulta que J1 ∩ G2 es
abierto y no vacío. Sea x2 ∈ J1 ∩ G2 y escojamos, de nuevo, un conjunto abierto J2 ⊆ J1 ∩ G2
para el cual:
1
x2 ∈ J2 ,
diam( J2 ) < 2 ,
J2 ⊆ J1 ∩ G2 .
2
Teniendo en cuenta, una vez más, que J2 ∩ G3 es un abierto no vacío, podemos repetir el proceso
anterior y continuarlo indefinidamente para obtener una sucesión de intervalos cerrados ( Jn )∞
n =1
verificando las siguientes propiedades:
1) J1 ⊇ J2 ⊇ · · · ⊇ Jn ⊇ · · · ,
2) lı́m diam( Jn ) = lı́m diam( Jn ) = 0, y
n→∞
n→∞
3) Jn ⊆ Jn−1 ∩ Gn para todo n ≥ 1, donde hemos puesto J0 = V.
Podemos entonces invocar al Teorema de Encaje de Cantor para concluir que
∅ 6=
∞
\
n =1
Jn ⊆
∞
\
n =1
Jn−1 ∩ Gn
⊆ V∩
∞
\
Gn .
n =1
Esto termina la prueba.
Varias consecuencias inmediatas se derivan del Teorema de Categoría de Baire.
TCB (0) R es no-numerable.
∞
Suponga
S∞ que R es numerable. Entonces existe una sucesión ( xn )n=1 en R tal que
R = n=1 { xn }. Para cada n ∈ N, el conjunto Gn = R r { xn } es
T abierto y denso en R,
por lo que el Teorema de Categoría de Baire nos garantiza que ∞
n =1 Gn es denso en R,
lo cual es imposible ya que
∞
\
n =1
Gn = R r
∞
[
n =1
{ x n } = ∅.
TCB (1) Si ( X, d) es un espacio métrico completo, entonces él es de segunda categoría.
Suponga, para construiruna contradicción, que X es de primera categoría.
S Entonces
∞
existe una sucesión An n=1 de subconjuntos nunca-densos tal que X = ∞
n =1 A n . Sin
perder generalidad, podemos suponer que cada An es cerrado. Por el Teorema 2.2.39
cada conjunto Gn = X \ An es abierto y denso en X y, por consiguiente, gracias al
Sec. 2.2 Espacios Topológicos
139
Teorema de Categoría de Baire,
una contradicción ya que
T∞
∅ 6=
n = 1 Gn
∞
\
n =1
es denso en X, lo que constituye, por supuesto,
Gn = X \
∞
[
A n = ∅.
n =1
Esto prueba que X es de segunda categoría.
TCB (2) Si F ⊆ X es cerrado, entonces F satisface la conclusión del Teorema de Categoría de T
Baire, es
∞
decir, si ( Gn )n=1 es una sucesión de subconjuntos abiertos y densos en F, entonces ∞
n = 1 Gn
es denso en F.
La prueba procede de manera idéntica a la del Teorema de Categoría de Baire y, por lo
tanto, se omite.
TCB (3) Sea ( Fn )n∈N S
una sucesión de subconjuntos cerrados en un espacio métrico completo ( X, d)
tal que X = ∞
n =1 Fn . Entonces
∞
[
V =
int( Fn )
n =1
es abierto y denso en X.
Prueba. Observemos que V es abierto por ser unión de conjuntos abiertos. Para cada
n ∈ N, sea Vn = int( Fn ) y definamos Gn = Vn ∪ ( X r Fn ). Fijemos n ∈ N. Nuestro
objetivo es probar que Gn es abierto y denso en X. En efecto, Gn es abierto por ser
unión de dos conjuntos abiertos. Para ver que Gn es denso en X, tomemos cualquier
subconjunto abierto no vacío G de X. Ocurre entonces que o bien G ⊆ Fn , en cuyo caso
G ⊆ Vn ⊆ Gn ,
es decir,
G ∩ Gn 6 = ∅ ,
o bien G * Fn , de donde se obtiene que G ∩ ( X r Fn ) 6= ∅, y por consiguiente GT∩ Gn 6=
∅. Esto prueba Gn es denso en X. Por el Teorema de Categoría de Baire, E = S ∞
n = 1 Gn
∞
es denso en X. Afirmamos que E ⊆ V. En efecto, suponga que x ∈ E ⊆ X = n=1 Fn .
Entonces existe algún n0 ∈ N tal que x ∈ Fn0 . Por otro lado, x ∈ Gn0 pues x ∈ E =
T
∞
n =1 Gn , y así, x ∈ Gn0 ∩ Fn0 = Vn0 ⊆ V; es decir, x ∈ V y por lo tanto E ⊆ V. De aquí
se sigue que V es denso en X y concluye la prueba.
TCB (4) Si F ⊆ R es perfecto, es decir, cerrado y sin puntos aislados, entonces F es no-numerable.
En efecto, suponga que F es numerable, digamos, F = { x1 , x2 , . . . }. Para cada n ≥ 1,
considere el conjunto Gn = R \ { xn }. Como R no posee puntos aislados, cada conjunto
∞
{ xn } es cerrado en R, de donde resulta que Gn n=1 es una sucesión de subconjuntos
T
abiertos y densos en R. Se sigue del Teorema de Categoría de Baire que ∞
n = 1 Gn
es denso en R. Ahora bien, como F es un subespacio de R, tenemos que F ∩ Gn es
abierto en F y, además, como ningún puntoTde F es aislado, resulta que F ∩ Gn también
∞
es
T∞denso en F. Se sigue de TCB (2) que n=1 ( F ∩ Gn ) es denso en F. En particular,
n =1 ( F ∩ Gn ) 6 = ∅, lo cual es imposible ya que
∅ 6=
∞
\
( F ∩ Gn ) = F ∩
n =1
Esto termina la prueba.
∞
\
n =1
Gn = F ∩ ( R \ F ) = ∅.
140
Cap. 2 Los Números Reales
∞
TCB (5) Si Gn n=1 es una
T sucesión de subconjuntos Gδ -densos en un espacio métrico completo
( X, d), entonces ∞
n =1 Gn también es un Gδ -denso.
En efecto, para cada n ∈ N seleccionemos una sucesión ( Gnj )∞
j=1 de subconjuntos
T∞
abiertos tal que Gn = j=1 Gnj . Teniendo en cuenta que Gn ⊆ Gnj para todo j ≥ 1,
entonces la densidad de cada Gn garantiza la de cada Gnj . Puesto {Gnj : n, j ∈ N }
es una colección numerable de subconjuntos abiertos y densos en X, el Teorema de
Categoría de Baire nos revela que
∞
\
n =1
Gn =
∞
∞ \
\
Gnj
n =1 j=1
es un Gδ -denso.
TCB (6) Si G ⊆ R es un Gδ -denso, entonces G es no-numerable.
T
Escriba G = ∞
n =1 Gn donde cada Gn es abierto y, por supuesto, denso ya que G lo
es. Suponga ahora que G = { x1 , x2 , . . . } es numerable
y, como en TCB (4), defina
∞
Hn = R \ { xn } para todo n ≥ 1. Entonces Hn n=1 es una sucesión de subconjuntos y T
abiertos densos en R y, gracias al Teorema de Categoría de Baire, se tiene que
H = ∞
n =1 Hn es un Gδ -denso. Finalmente, usando TBC (5) se obtiene la siguiente
contradicción:
\
\
∞
∞
∅ = G ∩ (R \ G ) =
Gn ∩
Hn 6 = ∅ .
n =1
n =1
Este hecho, combinado con TCB (5), es el que permite considerar a los conjuntos Gδ densos como “más numerosos” de los que son simplemente densos. Por tal razón, una
propiedad P(x) la cual se cumple para todos los puntos de un conjunto Gδ -denso, se llama abundante, genérica o típica y a un tal conjunto, un conjunto abundante.
Una consecuencia inmediata de TCB (6) es el siguiente:
Corolario 2.2.42. Q no es un conjunto de tipo Gδ .
Esto último permite construir subconjuntos de R que no son ni de tipo de Gδ así como
tampoco de tipo Fσ . En efecto, para cada a ∈ R, pongamos Ga = Q ∩ (−∞, a) y
Fa = (R \ Q ) ∩ [ a, +∞). Se sigue de lo anterior que el conjunto Ha = Ga ∪ Fa no es de
tipo Gδ , ni de tipo Fσ .
Ya hemos tenido oportunidad de mostrar funciones que son continuas en los irracionales
pero discontinuas en los racionales. El siguiente resultado establece, como consecuencia
del resultado anterior, que lo contrario nunca es posible.
TCB (7) No existe ninguna función f : R → R que sea continua en los racionales y discontinua
en los irracionales.
Prueba. Supongamos que una tal f existe. Por el Teorema 3.1.25 sabemos que PC( f )
es un Gδ , mientras que, por hipótesis, PC( f ) = Q. La combinación de estos hechos nos
dice que Q es un Gδ -denso lo cual contradice el resultado anterior.
Sec. 2.2 Espacios Topológicos
141
TCB (8) Existencia de conjuntos de Lusin.
Bajo el imperio de la Hipótesis de Continuo se tiene que cualquier conjunto A ⊆ R con
card( A) < c es de primera categoría. En efecto, como card( A) < c, la Hipótesis de
Continuo nos asegura que A es a lo más numerable y, por lo tanto, podemos escribir a
A como una sucesión (finita o infinita), digamos A = {an : n ∈SF ⊆ N }. Puesto que
An = {an } es nunca-denso para cada n ∈ F, resulta que A = n∈ F An es de primera
categoría.
Usando ideas similares a las utilizadas en la construcción del conjunto de Bernstein, se
puede construir otro conjunto extraño denominado “conjunto de Lusin” donde todos
los subconjuntos de primera categoría que viven en él son necesariamente numerables.
Como antes, ello es posible si se acepta la Hipótesis del Continuo más la existencia de
un buen-orden en R, es decir, el Axioma de Elección.
Teorema 2.2.43 (Conjunto de Lusin). Asumiendo la Hipótesis del Continuo, existe un subconjunto no vacío L de R con las siguientes propiedades:
( a) card(L) = ℵ1 y
(b) card L ∩ A ≤ ℵ0 para cualquier conjunto A ⊆ R de primera categoría.
Prueba. Sea Fc la familia de todos los subconjuntos cerrados de R. Por el Teorema 1.3.47 (8), página 74, sabemos que card(Fc ) = ℵ1 = c (recuerde que estamos
asumiendo la Hipótesis de Continuo). Denotemos por Fnd los miembros de Fc que
son nunca-densos. Puesto que { x} ∈ Fnd para cada x ∈ R, entonces card(Fnd ) ≥ c y,
así,
c ≤ card(Fnd ) ≤ card(Fc ) = c.
Este hecho permite que podamos enumerar a Fnd por medio de una sucesión transfinita,
digamos, Fnd = { Fα : α < ω1 }. Para construir nuestro conjunto L observe que como
Fα 6= R para todo α < ω1 , podemos comenzar eligiendo un x1 ∈ R tal que x1 6∈
F1 ∈ Fnd . Fijemos un ξ < ω1 y supongamos que la familia ( xα )α<ξ ha sido construida.
Consideremos el conjunto
Xξ =
[
α<ξ
Fα ∪ xα : α < ξ
y observemos que como ξ es numerable, Xξ es de primera categoría en R. Por el
Teorema de Categoría de Baire, Xξ 6= R. Si ahora elegimos un xξ ∈ R \ Xξ , entonces el Principio de Inducción Transfinita da por finalizada la construcción de ( xξ )ξ <ω1 .
Definamos ahora
L = xξ : ξ < ω1 .
Afirmamos que L posee las propiedades requeridas. En efecto:
( a) L es no numerable. Considere la aplicación f : ω1 → L dada por f (α) = xα . Veamos
que ella es biyectiva. En efecto, es claro que f es sobreyectiva. Para ver que ella
también es inyectiva, suponga que α < ξ < ω1 . Entonces, por construcción, se
tiene xα 6= xξ . Esto prueba que card(L ) = c = ℵ1 .
142
Cap. 2 Los Números Reales
S
(b) L satisface (b). Sea A = ∞
n =1 A n un conjunto de primera categoría en R, donde
cada An es cerrado y nunca-denso. Puesto que Fnd es la familia de todos los
conjuntos cerrados nunca densos de R, resulta que para cada n ∈ N, existe un
Fαn ∈ Fnd tal que An = Fαn . Por construcción, sabemos que
L ∩ An = L ∩ Fαn ⊆ x β : β < α
S
y como éste último conjunto es numerable, entonces L ∩ A = ∞
n =1 L ∩ A n es
numerable.
Esto termina la prueba.
Al conjunto L del resultado anterior se le llama un conjunto de Lusin. Observe que,
por construcción, todo subconjunto no-numerable incluido en L es de segunda categoría. En
particular, L es de segunda categoría.
Una nota interesante, que puede ser de interes al lector, es siguiente resultado:
Si existe un conjunto de Lusin y cualquier subconjunto de R de cardinalidad menor que c
es de primera categoría, entonces la Hipótesis del Continuo es verdadera.
Definición 2.2.44. Una función f : [ a, b] → R se dice que es puntualmente discontinua si PC( f ) es
denso en [ a, b].
Corolario 2.2.45. Si f : [ a, b] → R es una función puntualmente discontinua, entonces PC( f ) es un
Gδ -denso en [ a, b].
Prueba. Sólo resta demostrar que PC( f ) es un Gδ .
Teorema 3.1.25, página 168.
Esto, sin embargo, es consecuencia del
¿Qué tan complicado es el conjunto de los puntos de continuidad de una función arbitraria
f : [ a, b] → R? ¿En qué otros casos es PC( f ) un Gδ -denso? El siguiente resultado establece la
existencia de una amplia categoría de funciones, cada una de las cuales posee abundantes puntos
de continuidad, es decir, sus puntos de continuidad forman un Gδ -denso en [ a, b].
Teorema 2.2.46 (Baire). Sea f : [ a, b] → R una función arbitraria. Suponga que existe una sucesión
de funciones en C ([ a, b]), digamos ( f n )n∈N , tal que f ( x) = lı́mn→∞ f n ( x) existe para cada x ∈ [ a, b].
Entonces PC( f ) es un Gδ -denso en [ a, b]. En particular, PC( f ) es no-numerable.
Prueba. PC( f ) es un Gδ gracias al Teorema 3.1.25. Veamos que él también es denso en [ a, b]. Para
k, m, n ∈ N, definamos
1
Fkmn = x ∈ [ a, b] : f m ( x) − f n ( x) ≤
.
k
Siendo f m , f n funciones continuas, también lo es | f m − f n | y, en consecuencia, cada Fkmn es cerrado
en [ a, b]. Fijando k, m ∈ N y definiendo
Fkm =
∞
\
n=m
Fkmn ,
Sec. 2.2 Espacios Topológicos
143
S
resulta que cada Fkm también es cerrado en [ a, b]. Afirmamos que [ a, b] = ∞
m =1 Fkm para cada
k ∈ N. En efecto, sea k ∈ N y sea x ∈ [ a, b]. Puesto que lı́mn→∞ f n ( x) = f ( x), existe un m ∈ N
tal que f n ( x) − f ( x) ≤ 1/(2k) para todo n ≥ m. Ahora bien, si n ≥ m, entonces
f m ( x) − f n ( x) ≤
f m ( x) − f ( x) + f n ( x) − f ( x) ≤
1
1
1
+
=
2k
2k
k
lo que prueba que x ∈ Fkmn para todo n ≥ m y, por lo tanto,
x∈
∞
\
n=m
Fkmn = Fkm ⊆
∞
[
Fki
i=1
S
Esto prueba nuestra afirmación. Por TCB (3), cada Gk = ∞
m =1 int( Fkm ) es abierto y denso en
[a, b] y, en consecuencia, por el Teorema de Categoría de Baire, el conjunto
E =
∞
\
Gk
k=1
es denso en [ a, b].
Nos proponemos demostrar que E ⊆ PC( f ). En efecto,
sean x0 ∈ E y ε > 0. Elijamos un
S∞
ε
1
k ∈ N de modo tal que k < 3 . Como x0 ∈ Gk = m=1 int( Fkm ), existe un m ∈ N tal que
x0 ∈ int( Fkm ). Siendo int( Fkm ) abierto, podemos elegir un δ0 > 0 de modo que intervalo abierto
( x0 − δ0 , x0 + δ0 ) ⊆ int( Fkm ). Observemos ahora que si | x − x0 | < δ0 , entonces x ∈ int( Fkm ) ⊆ Fkm
y así, f m ( x) − f n ( x) ≤ 1/k para cualquier n ≥ m. Usando la continuidad del valor absoluto, se
obtiene que
f m ( x) − f ( x) =
f m ( x) − lı́m f n ( x) = lı́m f m ( x) − f n ( x) ≤
n→∞
n→∞
1
.
k
En particular, f m ( x0 ) − f ( x0 ) ≤ 1/k. Por otro lado, como f m continua en x0 , existe un δ1 tal que
f m ( x) − f m ( x0 ) ≤ ε/3 siempre que x ∈ ( x0 − δ1 , x0 + δ1 ). Sea δ = mı́n{δ0 , δ1 }. Si | x − x0 | < δ,
entonces
f ( x ) − f ( x0 ) ≤
≤
f ( x ) − f m ( x ) + f m ( x ) − f m ( x0 ) + f m ( x0 ) − f ( x0 )
1
ε
1
ε
ε
ε
+
+
≤
+
+
= ε
k
3
k
3
3
3
Esto prueba que f es continua en x0 y, en consecuencia, E ⊆ PC( f ). De aquí se sigue que PC( f )
es un Gδ -denso en [ a, b]. La última parte es consecuencia de TCB (6).
El símbolo B1 ([ a, b]) denotará el conjunto de todas las funciones f : [ a, b] → R que son límites
puntuales de sucesiones de funciones continuas, esto es, f ∈ B1 ([ a, b]) si, y sólo si, existe una sucesión
( f n )∞
n =1 en C ([ a, b]) tal que
f ( x) = lı́m f n ( x)
n→∞
para cada x ∈ [ a, b]. Cada elemento de B1 ([ a, b]) se llamará, en lo sucesivo, una función de la
primera clase de Baire. Resulta claro que
C ([ a, b]) ⊆ B1 ([ a, b]).
Se sigue del resultado anterior que para cada f ∈ B1 ([ a, b]), el conjunto PC( f ) es un Gδ -denso
en [ a, b].
144
Cap. 2 Los Números Reales
Corolario 2.2.47. Si f : [ a, b] → R es una función continua tal que f ′ ( x) existe para todo x ∈ [ a, b],
entonces f ′ ∈ B1 ([ a, b]).
Prueba. Extienda f continuamente al intervalo [ a, b + 1] poniendo f ( x) = f (b) para todo x en
[b, b + 1]. Si para cada n ∈ N, definimos gn : [a, b] → R por
gn ( x) = n f ( x + 1/n) − f ( x) ,
resulta que cada gn es continua y se cumple que, para cada x ∈ [ a, b],
f ′ ( x) = lı́m
n→∞
f ( x + 1/n) − f ( x)
= lı́m gn ( x).
n→∞
1/n
Esto prueba que f ′ ∈ B1 ([ a, b]).
2.2.3. Espacios Normados
Sea X un espacio vectorial sobre R. Una norma sobre X es una aplicación k · k : X → R
que cumple con las siguientes propiedades:
(1) k x k ≥ 0 para todo x ∈ X,
(2) k x k = 0 si y, sólo si, x = 0,
(3) k a · x k = a · k x k para todo x ∈ X y todo a ∈ R, y
(4) k x + y k ≤ k x k + k y k para todo x, y ∈ X. (Desigualdad Triangular)
El par ( X, k · k) es llamado un espacio normado. Se sigue de (4) e inducción que
n
X
xk
k=1
≤
n
X
k=1
k xk k
cualesquiera sean x1 , . . . , xn en X. Más aun,
kxk−kyk
≤ kx−yk
(1a)
para todo x, y ∈ X. Observe que gracias a las propiedades (3) y (4) cualquier norma es una
función convexa. Es importante también destacar que toda norma sobre un espacio vectorial da
origen a una métrica natural definida por
d( x, y) = k x − y k , x, y ∈ X,
(2a)
y, en consecuencia, todo espacio normado ( X, k · k) siempre será pensado como un espacio métrico bajo dicha métrica.
Definición 2.2.48. Dos normas k · k y k · k ∗ sobre X son equivalentes si existen constantes a, b > 0
tales que
a · k x k ≤ k x k∗ ≤ b · k x k para todo x ∈ X.
Sec. 2.2 Espacios Topológicos
145
Observe que afirmar que k · k y k · k∗ son equivalentes significa que las topologías inducidas
por ambas normas coinciden sobre X, es decir, la aplicación identidad id : ( X, k · k) → ( X, k · k∗ )
es un homeomorfismo.
Sea ( X, k · k X ) un espacio normado. Recordemos que una aplicación f : X → R se llama un
funcional lineal si f ( ax + by) = a f ( x) + b f (y) para todo x, y ∈ X y todo a, b ∈ R. El dual de
X, denotado por X ∗ , consiste de todos los funcionales lineales continuos x∗ : X → R. Es claro que,
con las operaciones usuales, X ∗ es un espacio vectorial sobre R. Recordemos que un funcional
lineal x∗ : X → R es continuo si, y sólo si, él es acotado, es decir, existe una constante C > 0 tal que
| x∗ ( x)| ≤ C k x k para todo x ∈ X. En este caso, se define el número k x∗ k por
k x∗ k = ı́nf C > 0 : | x∗ ( x)| ≤ C k x k .
Es fácil verificar k x∗ k X ∗ es una norma sobre X ∗ llamada la norma dual. Más aun,
k x∗ k = sup | x∗ ( x)| : k x k ≤ 1
de donde se sigue
| x∗ ( x)| ≤ k x∗ k k x k
para todo x ∈ X.
Con esta información se prueba si dificultad que ( X ∗ , k · k) es siempre un espacio de Banach
independientemente de si X es o no de Banach.
Sea (Y, k · kY ) otro espacio de Banach. Diremos que Y es el dual de X, denotado por Y = X ∗ ,
si existe una aplicación lineal isométrica T : X ∗ → Y tal que T ( X ∗ ) = Y, esto significa que T es
lineal, continua, biyectiva satisfaciendo
k T ( x∗ ) k = k x∗ k
para todo x∗ ∈ X ∗ .
Teorema 2.2.49 (Acotación Uniforme). Sea ( X, k · k) un espacio de Banach y suponga que F es
una familia no vacía incluida en X ∗ que está puntualmente acotada en el siguiente sentido: para cada
x ∈ X, existe una constante Mx ≥ 0 tal que
sup | x∗ ( x)| ≤ Mx .
x ∗ ∈F
Entonces existe una constante M ≥ 0 tal que
sup k x∗ k ≤ M.
x ∗ ∈F
Prueba. Por cada entero k ≥ 1 y cada x∗ ∈ F, considere el conjunto
Ek, x ∗ = x ∈ X : | x∗ ( x)| ≤ k .
Pongamos ahora,
Ek =
\
x ∗ ∈F
Ek, x ∗ .
S
S∞
Observe que X = ∞
k=1 Ek . Sólo se necesita verificar que X ⊆
k=1 Ek . En efecto, tome cualquier
x ∈ X y usemos nuestra hipótesis para hallar una constante Mx ≥ 0 tal que | x∗ ( x)| ≤ Mx para
todo x∗ ∈ F.
x , entonces se cumple que x ∈ Ek y, por lo
S Si ahora elegimos cualquier k ≥ M
∗ ∈ F es una aplicación continua, resulta que
tanto, X ⊆ ∞
E
.
Por
otro
lado,
como
cada
x
k=1 k
146
Cap. 2 Los Números Reales
Ek, x ∗ es cerrado y, en consecuencia, Ek también lo es. Se sigue del Teorema de Categoría de
Baire, véase TCB (3), que el conjunto
V =
∞
[
int( Ek )
k=1
es abierto y denso en X. De aquí se sigue la existencia de algún k0 ∈ N tal que int( Ek0 ) 6= ∅. En
particular, existe algún x0 ∈ int( Ek0 ) y un cierto δ > 0 tal que la bola abierta U ( x0 , δ) ⊆ int( Ek0 ).
Resulta claro que
sup | x∗ ( x)| ≤ k0 .
x∗ ∈ F
x ∈ U ( x0, δ )
Finalmente, sea x ∈ X con x 6= 0 y defina y = 2δ k x k−1 x. Puesto que k y k < δ, entonces
y + x0 ∈ U ( x0 , δ) y se sigue de la desigualdad anterior que
!
2
x
k
k
| x∗ ( x)| ≤ x∗
y
δ
=
2k xk ∗
| x (y)|
δ
≤
2k xk ∗
| x (y + x0 )| + | x∗ ( x0 )|
δ
≤
2k xk
2k0
δ
=
4k0
kxk
δ
para cualquier x∗ ∈ F. Por supuesto, como dicha desigualdad se cumple trivialmente si x = 0,
resulta que tomando M = 4k0 /δ se obtiene el resultado deseado; es decir,
sup k x∗ k ≤ M.
x ∗ ∈F
Fin de la prueba.
2.2.4. La Topología Producto
Sea X un conjunto no vacío y sea E ⊆ P ( X ). Afirmamos que existe una única topología
sobre X, la cual denotaremos por τX (E), con las siguientes propiedades:
( a) E ⊆ τX (E), y
(b) τX (E) es la topología más pequeña conteniendo a E, es decir, si J es otra topología sobre X
con E ⊆ J, entonces τX (E) ⊆ J.
La prueba de la existencia y unicidad de τX (E) es simple. En efecto, considere la familia
T(E) formada por todas las topologías sobre X que contienen a E. Observe que T(E) es no
vacía ya que P ( X ) ∈ T(E) y entonces defina
\
τX (E) =
J.
J ∈ T( E)
Sec. 2.2 Espacios Topológicos
147
Es un ejercicio sencillo establecer que τX (E) es una topología sobre X que satisface ( a) y (b).
Por supuesto, ella es única. A τX (E) se le llama la topología generada por E.
El siguiente mecanismo, basado en la construcción anterior, es un proceso natural para generar
topologías sobre un conjunto dado. Comencemos con un conjunto no vacío X, el cual puede o no
estar provisto de alguna topología, y sea (Y, JY ) un espacio topológico arbitrario. Se considera
una función f : X → (Y, JY ) y lo que se desea es construir la topología más pequeña sobre X,
digamos JX , que permita que f sea JX − JY continua, es decir, f −1 ( G ) ∈ JX para cualquier
G ∈ JY . Hay evidencia de la existencia de al menos una topología que hace que f sea JX − JY
continua. En efecto, si tomamos a X con la topología discreta, P ( X ), resulta entonces claro que
f es P ( X ) − JY continua. La elección de la topología discreta no siempre es la más afortunada
por lo que es deseable poder contar con otra topología, distinta a la discreta, que nos resuelva el
problema. Consideremos entonces
n
o
JX = f −1 ( G ) : G ∈ JY .
Es fácil establecer que JX es la topología más pequeña sobre X que hace que f sea JX − JY
continua.
Generalicemos el argumento anterior en el siguiente sentido: tomemos el conjunto X y en
lugar de tener un único espacio topológico (Y, JY ) y una única función f : X → Y, elijamos una
familia de espacios topológicos, digamos (Yα , Jα )α∈ I , y una familia de funciones f α : X → Yα con
α ∈ I, y como antes, queremos construir la topología más pequeña sobre X que permita que
todas las funciones f α sean continuas. He aquí el procedimiento. Para cada α ∈ I, sea
n
o
τα = f α−1 ( G ) : G ∈ Jα
y pongamos
E =
[
τα .
α∈ I
Observe que por ser cada uno de los conjuntos τα una topología sobre X (la cual garantiza que
la respectiva función f α sea continua, pero no las demás), resulta que ∅, X ∈ E. En general, E
no es una topología sobre X, pero sí lo es τX (E), la topología generada por E. A esta topología
se le llama la topología inicial o proyectiva sobre X asociada a la familia ( f α )α∈ I . Es claro que
τX (E) es la topología más pequeña sobre X bajo la cual cada f α es τX (E) − Jα continua.
Denote por Efin la colección de las intersecciones de familias finitas de E, esto es, A ∈ Efin si, y
sólo si, existe F ∈ Pfin ( I ) y conjuntos Aα ∈ E con α ∈ F tal que
\
A =
Aα .
α∈ F
Si ahora se considera Eσ la colección de todas las uniones de familias arbitrarias de Efin , entonces
τX (E) = Eσ .
( 1)
En primer lugar, observe que, si A, B ∈ Efin , entonces A ∩ B ∈ Efin . Más aun, Eσ contiene a
E. Para verificar la igualdad (1), sólo debemos demostrar queS Eσ es una topología
sobre X.
S
Claramente, ∅, X ∈ Eσ . Sean ahora U, V ∈ Eσ . Entonces U = α∈ F Aα y V = β∈ G Bβ donde
( Aα )α∈ F y ( Bβ ) β∈ G son familias de elementos de Efin . Se deduce que
[
[ [
U∩V =
Aα ∩
Bβ =
Aα ∩ Bβ
α∈ F
β∈ G
( α, β)∈ F× G
148
Cap. 2 Los Números Reales
y puesto que Aα ∩ Bβ ∈ Efin para cualquier (α, β) ∈ F × G, resulta que U ∩ V ∈ Eσ . Por
inducción se sigue que cualquier intersección finita de elementos de Eσ permanece dentro de
Eσ .
Suponga ahora que (Uα )α∈ F es una familia de elementos
S de Eσ . Entonces, Uα es la unión
de una familia de elementos de Efin y,
en
consecuencia,
α∈ F Uα es la unión de una familia de
S
elementos de Efin . Esto prueba que α∈ F Uα ∈ Eσ y, así, Eσ es una topología sobre X. Como
Eσ que contiene a E se tiene que τ (E) ⊆ Eσ . Por otro lado, puesto que τ (E) es una topología
conteniendo a E se tiene que Efin ⊆ τ (E) y, por consiguiente, Eσ ⊆ τ (E). Esto termina la prueba
de (1).
Como una aplicación de lo que acabamos de ver, mostraremos de inmediato cómo se obtiene
la topología producto de una familia de espacios topológicos. Suponga que ( Xα , Jα )α∈ I es una
familia de espacios topológicos y sea
Y
Xα
X =
α∈ I
su producto cartesiano. Para cada β ∈ I, sea
Y
pβ :
Xα → X β
α∈ I
la proyección de X sobre X β , esto es, p β (( xα )α∈ I ) = x β para todo ( xα )α∈ I ∈ X. La topología
inicial sobre X asociada a la familia ( pα )α∈ I la llamaremos la topología producto sobre X y la
denotaremos, en lo sucesivo, por T p . Por consiguiente, T p es la topología más pequeña sobre X que
hace que cada proyección pα sea continua.
Usando la igualdad dada en (1) sabemos que T p = Eσ , donde
[
1
E =
p−
α (Jα ) ,
α∈ I
1
−1
y p−
α (Jα ) = pα (U ) : U ∈ Jα . Observe que, para cada U ∈ Jα ,
(
Y
U
si α = β
−1
p β (U ) =
Vα ,
donde
Vα =
Xα
si α 6= β.
α∈ I
Recordemos que Efin es la familia formada por todas las intersecciones de colecciones finitas de
elementos de E, es decir, A ∈ Efin si, y sólo si, existe un conjunto finito F ⊆ I y conjuntos
abiertos Uα ⊆ Xα con α ∈ F tal que
(
\
Y
Uα
si α ∈ F
−1
p α ( Uα ) =
Vβ ,
donde
Vβ =
A =
Xα
si α 6∈ F.
α∈ F
β∈ I
Finalmente, Eσ es la colección que se obtiene formando todas las uniones de familias arbitrarias
de conjuntos pertenecientes a Efin , es decir, V ∈ Eσ si, y sólo si, existe una familia (Wβ ) β∈ F
incluida en Efin tal que
[
V =
Wβ .
β∈ F
Observe que Efin constituye una base para la topología producto. Sus elementos serán llamados los
conjuntos básicos de T p .
Sec. 2.2 Espacios Topológicos
149
Por definición, cada proyección pα : X → Xα es una función continua cuando X está dotado
de la topología producto. Lo que resulta también interesante es que pα es una aplicación abierta,
esto es, transforma conjuntos abiertos en conjuntos abiertos. Para ver esto, fijemos un α ∈ I y sea
1
U ∈ E. Entonces existe un β ∈ I y un conjunto Uβ ∈ J β tal que U = p−
β (U β ). Puesto que pα
es una aplicación sobreyectiva, se tiene que
pα (U ) = Vα ∈ Jα
donde Vα =
(
Uα
Xα
si α = β
si α 6= β.
T
1
Si U ∈ Efin , entonces U = β∈ F p−
α (U β ) donde F = { β ∈ I : U β 6 = X β } es finito. Se sigue
de lo anterior que pα (U ) es abierto en Xα . EnSel caso general, puesto que todo abierto U ⊆ X
es unión de conjuntos básicos, esto es, U = β∈ F Wβ donde (Wβ ) β∈ F es alguna colección de
conjuntos básicos, se sigue que
pα (U ) =
[
β∈ F
pα (Wβ ) ∈ Jα .
En conclusión, cada proyección es una función continua, abierta y sobreyectiva.
Uno de los resultados fundamentales en Análisis lo constituye el Teorema de Tychonoff el
cual afirma que el producto arbitrario de espacios compactos, provisto de la topología producto,
es compacto. La demostración que a continuación ofrecemos se apoya en el Lema de Zorn. Sin
embargo, también se pueden dar demostraciones de dicho resultado usando el Principio del Buen
Orden, redes, ultrafiltros, etc.
Teorema 2.2.50 (Tychonoff).
Sea ( Xα , Jα )α∈ I una familia de espacios topológicos compactos. EnQ
tonces el producto ( α∈ I Xα , T p ) es compacto.
Q
Prueba. Sea X = α∈ I Xα dotado de la topología producto y sea A una colección
de subconjunT
tos de X con la propiedad de intersección finita. Vamos a demostrar que A∈A A 6= ∅. Para
alcanzar ese objetivo usaremos el Lema de Zorn argumentando del modo siguiente: considere la
colección DA de todas las familias D de subconjuntos de X tales A ⊆ D y D tiene la propiedad
de intersección
S finita. Dotemos a DA del orden parcial estricto $ y sea C una cadena en DA .
Puesto que B∈C B es claramente una cota superior para los elementos de C, el Lema de Zorn
nos garantiza la existencia de un elemento maximal D0 ∈ DA . Será suficiente demostrar que
\
D ∈D0
D 6 = ∅.
Para verificar esto, tomemos un α ∈ I arbitrario y considere la colección
Fα =
pα ( D ) : D ∈ D0 .
de subconjuntos de Xα . Esta colección tiene la propiedad de intersección finita ya que D0 la tiene.
T
Puesto que Xα es compacto, el Teorema 2.2.34 nos revela que D ∈D0 pα ( D ) 6= ∅. Seleccione un
punto xα ∈ Xα tal que
\
xα ∈
pα ( D ).
D ∈D0
150
Cap. 2 Los Números Reales
Sea x = ( xα )α∈ I ∈ X y veamos que x ∈ D para todo D ∈ D0 . Observe que ello es equivalente
a demostrar que si U es un subconjunto abierto arbitrario de X conteniendo a x, entonces
U ∩ D 6= ∅. En efecto, sea Uα un abierto en Xα con xα ∈ Uα . Como xα ∈ pα ( D ), resulta
que Uα intersecta a pα ( D ) en algún punto pα (y) para algún y ∈ D. De esto se sigue que
1
y ∈ p−
α (Uα ) ∩ D y entonces V ∩ D 6 = ∅ para cualquier V ∈ Efin que contenga a x. Finalmente,
como U es T
unión de una colección de conjuntos pertenecientes a Efin el resultado sigue. Esto
prueba que D ∈D0 D 6= ∅ y termina la prueba.
En particular, si dotamos al conjunto {0, 1} de la topología
Q discreta yNhacemos Xn = {0, 1}
para todo n ∈ N, resulta que él es compacto y, entonces, ∞
es compacto con la
n =1 Xn = 2
topología producto.
Q
Si para cada n ∈ N, el espacio topológico ( Xn , Jn ) es 2o numerable, entonces ( ∞
n =1 Xn , T p )
también es 2o numerable. En efecto, suponga que BQn es una base numerable de Xn para cada
n ≥ 1. Para cada conjunto finito F ⊆ N, sea UF = ∞
n =1 Un , donde Un ∈ Bn para cada n ∈ F,
mientras que Un = Xn si n 6∈ F. Si se considera la colección B ⊆ T p formada por todos los
productos de la forma UF con F ⊆ N finito, entonces B es una base numerable para T p .
2.2.5. El Espacio de Baire
El objetivo de esta sección es estudiar brevemente un espacio Polaco de particular importancia
en la Teoría Descriptiva de Conjuntos, específicamente en el estudio de los conjuntos analíticos y
que denotaremos por N.
En lo que sigue escribiremos
∞
[
<∞
=
N
Nk ,
k=1
es decir,
consiste de todas las sucesiones finitas de números naturales. Otras notaciones
relevantes que usaremos son las siguientes: si s ∈ N <∞ , el símbolo ℓ(s) será usado para denotar
la longitud de s, es decir, su número de elementos. Por ejemplo, si s = (s1 , . . . , sk ), entonces
ℓ(s) = k. Para cada par de elementos s, t ∈ N <∞ , digamos s = (s1 , . . . , sk ) y t = (t1 , . . . , tm ),
convenimos en escribir s ≤ t para indicar que s es un segmento inicial de t, es decir, t =
(s1 , . . . , sk , tk+1 , . . . , tm ). En este caso diremos que t es una extensión de s. Por ejemplo,
N <∞
(4, 7, 3) ≤ (4, 7, 3, 9, 2, 1)
pero
(4, 7, 9) (4, 7, 3, 9, 2, 1).
Escribiremos s < t, si s ≤ t pero s 6= t.
Para describir N, debemos comenzar con el conjunto N al cual dotaremos de su topología
Q∞ discreta PN(N ). Para cada n N∈ N, pongamos N n = N y considere el espacio producto
con la topología producto T p , entonces al espacio topolón =1 N n = N . Si dotamos a N
gico (NN , T p ) lo denotaremos brevemente por N y lo llamaremos el espacio de Baire. Puesto
que N posee la topología discreta, todos sus subconjuntos son abiertos. En particular, para cada
m ∈ N, el conjunto {m} es abierto y
−1
({m}) = N1 × · · · N m−1 × {m} × N m+1 × · · ·
pm
Como antes, sea
E =
∞
[
n =1
1
p−
n (P (N )).
Sec. 2.2 Espacios Topológicos
151
Sabemos que una base para la topología T p viene dada por la colección Efin formada por todas
las intersecciones de colecciones finitas de elementos de E. Sin embargo, si se considera la
colección B p = {Os : s ∈ N <∞ } ⊆ T p , donde para cada s = (s1 , . . . , sk ) ∈ N <∞ ,
Os =
k
Y
i=1
=
n
1
p−
s i ({n i })
o
N
(nk )∞
∈
N
:
n
s
,
.
.
.
,
n
s
=
=
1
1
k
k .
k=1
entonces B p también es una base para T p . En este sentido, un conjunto U ⊆ NN es T p -abierto,
o simplemente abierto, si para cada x = (nk )∞
k=1 ∈ U existe un k ∈ N tal que O( n1 , ..., n k ) ⊆ U.
Esto nos indica que los conjuntos abiertos de N son muy simples: ellos son exactamente los
subconjuntos de NN que comienzan con conjunto finito prescrito de números naturales. Dicho
de otra manera,
U ⊆ NN es abierto si, y sólo si, existe un conjunto S ⊆ N <∞ tal que U =
Observe que si s, t ∈ N <∞ , entonces
s ≤ t
⇒
S
s ∈ S Os .
Os ⊇ Ot .
Por otro lado, si no ocurre que s ≤ t ni tampoco que t ≤ s, entonces debe existir algún i ∈ N
para el cual i < mı́n{ℓ(s), ℓ(t)} y ni 6= mi . En este caso, Os ∩ Ot = ∅. En tal situación
escribiremos s ⊥ t.
Recordemos que un espacio topológico ( X, T ) es totalmente disconexo si éste tiene una base
cuyos elementos son abiertos y cerrados a la vez.
Teorema 2.2.51. N es totalmente disconexo.
Prueba. Veamos que cada conjunto en B p es abierto y cerrado a la vez. Fijemos un elemento
arbitrario s = (s1 , . . . , sk ) ∈ N <∞ y sea Os ∈ B p . Puesto que Os es ciertamente abierto, sólo
basta verificar que él es cerrado, pero esto es consecuencia inmediata de la igualdad
[
N \ Os =
{Ot : t ⊥ s }.
La prueba es completa.
Recordemos que un punto x = (nk )∞
k=1 ∈ N es un punto límite de A ⊆ N, si Os ∩ A 6 = ∅
para todo abierto básico Os ⊆ N para el cual x ∈ Os . Por supuesto, esto significa que: para
cada k ∈ N, existe algún y = (mk )∞
k=1 ∈ A con x 6 = y y ( n1 , . . . , n k ) = ( m1 , . . . , m k ). También
recordemos que un conjunto es cerrado si contiene a todos sus puntos límites.
Es fácil establecer que la aplicación d : NN × NN → [0, +∞) dada por
(
0
si x = y
d( x, y) =
2−ℓ( x,y)
si x 6= y, y ℓ( x, y) = ı́nf{n ∈ N : xn 6= yn },
∞
N
N que
siendo x = ( xn )∞
n =1 y y = ( yn ) n =1 elementos arbitrarios de N , es una métrica sobre N
genera la topología producto. Más aun, (N, d) resulta ser un espacio métrico completo y separable
152
Cap. 2 Los Números Reales
el cual es de importancia fundamental en el estudio y desarrollo de los espacio Polacos y los
conjuntos analíticos. En efecto, el conjunto
n
o
∞
D = (nk )∞
k=1 ∈ N : ( n k ) k=1 es eventualmente 0
es subconjunto numerable y denso de N. Para ver esto, recuerde que (nk )∞
k=1 ∈ N es eventualmente constante si existe un N ∈ N y un entero m ≥ 0 tal que nk = m para todo k ≥ N.
Claramente D es numerable, de modo que sólo resta ver que él es denso. Pero ser denso en N
significa que D ∩ Os 6= ∅ para cualquier s ∈ N <∞ y, obviamente, si s = (n1 , . . . , nk ) ∈ N <∞ ,
entonces (n1 , . . . , nk , 0, 0, . . . ) ∈ D ∩ Os . En particular, N es un espacio 2o numerable.
2.3. Problemas
(1) Sea A un conjunto acotado inferiormente y sea
B = b ∈ R : b es una cota inferior de A .
Demuestre que B está acotado superiormente y que sup B = ı́nf A.
(2) Si sup A < sup B, demuestre que existe al menos un b ∈ B tal que sup A < b.
(3) Sean A y B subconjuntos acotados de R. Pruebe que A ∪ B y A ∩ B están acotados y
ı́nf( A ∪ B) = mı́n{ı́nf A, ı́nf B}
y
sup( A ∪ B) = máx{sup A, sup B}.
(4) Sea ( Aα )α∈ I una familia arbitraria de subconjuntos no vacíos de R.
( a) Si para cada α ∈ I, Aα está acotado
S superiormente y el conjunto S1 = {sup Aα : α ∈ I }
está acotado superiormente, entonces α∈ I Aα está acotado superiormente y
!
[
Aα = sup sup Aα .
sup
α∈ I
α∈ I
¿Se obtiene la misma conclusión si la hipótesis “S1 está acotado superiormente” no se verifica?
(b) Si para cada α ∈ I, Aα está acotado
S inferiormente y el conjunto S2 = {ı́nf Aα : α ∈ I }
está acotado inferiormente, entonces α∈ I Aα está acotado inferiormente y
!
[
ı́nf
Aα = ı́nf ı́nf Aα .
α∈ I
α∈ I
¿Se obtiene la misma conclusión si la hipótesis “S2 está acotado inferiormente” no se verifica?
P∞ P∞
(5) Sea ( xmn )∞
m =1
n =1 | xmn | < + ∞. Demuestre que
m,n =1 una sucesión doble en R tal que
para cualquier biyección σ : N → N × N se cumple que
!
!
∞
∞
∞
∞
∞
X
X
X
X
X
xmn =
xmn =
xσ( k) .
m =1
n =1
n =1
m =1
k=1
Sec. 2.3 Problemas
153
(6) Sea ( xn )∞
n =1 una sucesión en R y sea a ∈ R. Pruebe que:
( a) Si a < lı́m xn , entonces existe un N ∈ N tal que a < xn para todo n ≥ N.
n→∞
( a′ ) Si lı́m xn < a, entonces {n : xn < a} es infinito.
n→∞
(b) Si existe un N ∈ N tal que a < xn para todo n ≥ N, entonces a ≤ lı́m xn .
n→∞
(b′ ) Si {n : xn < a} es infinito, entonces lı́m xn ≤ a.
n→∞
(7) Sea ( xn )∞
n =1 una sucesión en R y sea b ∈ R. Pruebe que:
( a) Si b > lı́m xn , entonces existe un N ∈ N tal que b > xn para todo n ≥ N.
n→∞
( a′ ) Si lı́m xn > b, entonces {n : xn > b} es infinito.
n→∞
(b) Si existe un N ∈ N tal que b > xn para todo n ≥ N, entonces b ≥ lı́m xn .
n→∞
(b′ ) Si {n : xn > b} es infinito, entonces lı́m xn ≥ b.
n→∞
(8) Sean
( xn ) ∞
n =1
y
( yn ) ∞
n =1
dos sucesiones en R. Pruebe que:
( a) Si (yn )∞
n =1 converge, entonces
lı́m ( xn + yn ) = lı́m xn + lı́m yn
n→∞
y
n→∞
n→∞
lı́m ( xn + yn ) = lı́m xn + lı́m yn .
(b) Si las sucesiones
( xn ) ∞
n =1
n→∞
y
y
(c) Si las sucesiones
( xn ) ∞
n =1
y
y
n→∞
n→∞
n→∞
lı́m ( xn yn ) ≥
lı́m xn
n→∞
n→∞
n→∞
n→∞
lı́m ( xn yn ) =
lı́m xn
n→∞
(9) Sea ( xn )∞
n =1 una sucesión y, para cada n ≥ 1, defina
σn =
lı́m yn
n→∞
( a) lı́m xn ≤ lı́m σn ≤ lı́m σn ≤ lı́m xn .
n→∞
(b) Si xn → x, entonces σn → x.
n→∞
n→∞
lı́m yn
n→∞
x1 + x2 + · · · + x n
.
n
Pruebe que:
n→∞
n→∞
son no negativas y (yn )∞
n =1 converge, entonces
lı́m ( xn yn ) = lı́m xn lı́m yn
( yn ) ∞
n =1
n→∞
n→∞
n→∞
son no negativas, entonces
lı́m ( xn yn ) ≤ lı́m xn lı́m yn
( yn ) ∞
n =1
154
Cap. 2 Los Números Reales
(10) Sean An
∞
n =1
y Bn
∞
sucesiones de subconjuntos de R y suponga que
n =1
A = lı́m An
y
n→∞
B = lı́m An .
n→∞
Pruebe que
( a) lı́m An =
n→∞
lı́m An =
n→∞
(b)
lı́m An
n→∞
c
x∈R :
x∈R :
n =1 χ A c ( x ) < + ∞ ,
P∞
n
χ
(
x
)
=
+
∞
.
n =1 A
P∞
n
= lı́m Acn .
n→∞
(c) χ A = lı́m χ An
y
n→∞
χ B = lı́m χ A .
(d) lı́m An ∩ lı́m Bn ⊆ lı́m An ∩ Bn .
n→∞
n→∞
n→∞
n
n→∞
(e) lı́m An \ lı́m An = lı́m An △ An+1 .
n→∞
n→∞
( f ) Si lı́m An = A′ y
n→∞
n→∞
lı́m Bn = B′ , entonces
n→∞
lı́m An × Bn
n→∞
= A′ × B′ .
∞
( g) Sea Fn n=1 una sucesión disjunta
S de subconjuntos cerrados de un espacio métrico completo ( X, d). Demuestre que ∞
n =1 Fn es cerrado.
CAPÍTULO
3
Funciones Continuas
3.1. Propiedades Básicas
La noción de continuidad, como sabemos, es una de las más importantes y de mayor utilidad
en matemáticas. En lo que sigue, supondremos que ( X, d) es un espacio métrico o, más general,
que ( X, τ ) es un espacio topológico de Hausdorff.
Definición 3.1.1. Una función f : ( X, τ ) → R es continua en un punto x0 ∈ X si, dado ε > 0, existe
un entorno abierto Vx0 de x0 tal que | f ( x) − f ( x0 )| < ε para cualquier x ∈ Vx0 .
La función f se dice continua en X, o sobre X, si f es continua en todos los puntos de X.
Si ( X, d) es un espacio métrico, entonces podemos reemplazar el entorno abierto Vx0 de x0 por
alguna bola abierta B( x0 , δ). Una simple y útil caracterización de continuidad en términos de
convergencia de sucesiones es el siguiente.
Teorema 3.1.2. Sea f : ( X, d) → R una función y sea x0 ∈ X. Las siguientes condiciones son equivalentes:
(1) f es continua en x0 .
(2) Si ( xn )∞
n =1 es cualquier sucesión en X tal que lı́m xn = x0 , entonces
n→∞
lı́m f ( xn ) = f ( x0 ).
n→∞
Prueba. Se deja a cargo del lector.
Otro aspecto importante respecto a la definición de continuidad en un punto tiene que ver con
la noción de límites laterales. Suponga que X = [ a, b]. Una función f : [ a, b] → R es continua
en x0 ∈ [ a, b] significa que
lı́m f ( x) = f ( x0 ) ∈ R,
en otras palabras,
x → x0
156
Cap. 3 Funciones Continuas
(1) f ( x0 ) existe,
(2) lı́mx→x0 f ( x) existe, y
(3) lı́mx→x0 f ( x) = f ( x0 ).
Recuerde que lı́m f ( x) existe significa que f ( x0− ) = f ( x0+ ), donde
x → x0
f ( x0− ) = lı́m− f ( x)
x → x0
y
f ( x0+ ) = lı́m+ f ( x)
x → x0
Para la continuidad en los puntos extremos, debe ocurrir que f ( a+ ) = f ( a) y f (b− ) = f (b).
El símbolo C ( X ) lo usaremos para denotar el conjunto de todas las funciones f : X → R son
continuas sobre X. Con las operaciones algebraicas usuales resulta que C ( X ) es un poco más
que un espacio vectorial sobre R, esto es, si f , g ∈ C ( X ) y α, β ∈ R, entonces
( a) α f + βg ∈ C ( X ),
( b ) f g ∈ C ( X ), y
(c) f /g ∈ C ( X ) siempre que g 6= 0.
Una noción más fuerte que la de continuidad fue introducida por primera vez por Heinrich
Eduard Heine quien la llamó continuidad uniforme.
Definición 3.1.3. Una función f : ( X, d) → R es uniformemente continua sobre X si, dado ε >
0, existe un δ > 0, dependiendo sólo de ε, con la siguiente propiedad: cualesquiera sean x, y ∈ X
satisfaciendo la condición d( x, y) < δ, se cumple que | f ( x) − f (y)| < ε.
Es claro que toda función uniformemente continua es continua. Aunque el recíproco no
siempre es cierto resulta que, en presencia de compacidad, ambas nociones son indistinguibles,
es decir, cuando X es un conjunto compacto cualquier función continua f : X → R es uniformemente
continua, véase el Teorema 3.1.6. Una clase muy particular de funciones uniformemente continuas
y que estudiaremos con más profundidad en el Capítulo 8 es el de función Lipschitz.
Definición 3.1.4. Una función f : ( X, d) → R se dice que es M-Lipschitz, o simplemente, Lipschitz,
sobre X, si existe una constante M > 0 tal que cualesquiera sean x, y ∈ X se cumple que
| f ( x) − f (y)| ≤ M · d( x, y) .
Es claro que toda función Lipschitz es uniformemente continua. Más aun, para cada subconjunto cerrado F de X, la función distancia f ( x) = dist( x, F ) para todo x ∈ X es Lipschitz ya
que
| f ( x) − f (y)| = dist( x, F ) − dist(y, F ) ≤ d( x, y)
para todo x, y ∈ X.
Otra de las caracterizaciones topológicas de continuidad que no le confiere importancia alguna
a ningún punto en particular del dominio de la función y que, por lo tanto, es de una gran utilidad
es la siguiente.
Sec. 3.1 Propiedades Básicas
157
Teorema 3.1.5. Para cada función f : ( X, τ ) → R, las siguientes condiciones son equivalentes:
(1) f es continua sobre X.
(2) Para cualquier conjunto abierto V en R, existe un abierto G ⊆ X tal que f ( G ) ⊆ V.
(3) Para cualquier conjunto abierto V en R, f −1 (V ) es abierto en X.
(4) Para cualquier conjunto cerrado F en R, f −1 ( F ) es cerrado en X.
(5) Para cualquier conjunto E ⊆ X, f E ⊆ f ( E).
Prueba. Ejercicio.
3.1.1. Funciones Continuas con Soportes Compactos
Como antes, X representará un espacio métrico o un espacio topológico. El símbolo Cb ( X )
será usado para designar las funciones en C ( X ) que son acotadas sobre X. Este conjunto también
es un espacio vectorial sobre R.
Cuando el dominio de una función continua es un conjunto compacto, las propiedades de tal
función se convierten en una envidia para el resto de las funciones continuas que no comparten ese dominio. En lo que sigue, veremos algunas de tales propiedades. Comencemos con la
primera.
Teorema 3.1.6 (Heine). Sea ( X, d) un espacio métrico y sea K un subconjunto compacto de X. Para
cualquier función f : K → R las siguientes condiciones son equivalentes:
(1) f es continua sobre K.
(2) f es uniformemente continua sobre K.
Prueba. Observe que (2) ⇒ (1) independientemente si el dominio de f es, o no, un conjunto
compacto. Veamos la implicación (1) ⇒ (2). Suponga, para construir una contradicción, que f
es continua pero no uniformemente continua. Esto, por supuesto, significa que existe algún ε > 0
con la siguiente propiedad: para cualquiera elección arbitraria de δ > 0, se puede determinar un
par de puntos xδ , yδ ∈ X con d( xδ , yδ ) < δ pero tal que | f ( xδ ) − f (yδ )| ≥ ε. Si para cada n ∈ N,
seleccionamos δ = 1/n, entonces lo anterior nos permite la construcción de un par de sucesiones
∞
( xn ) ∞
n =1 y ( yn ) n =1 en K tales que, para todo n ∈ N,
d( xn , yn ) < 1/n
pero
| f ( xn ) − f (yn )| ≥ ε
∞
Como K es compacto, podemos extraer una subsucesión ( xnk )∞
k=1 de ( xn ) n =1 que converge a
algún punto z ∈ K. Puesto que
1
d(z, ynk ) ≤ d z, xnk + d xnk , ynk < d z, xnk + ,
nk
∀k ≥ 1
∞
se concluye que la subsucesión (ynk )∞
k=1 de ( yn ) n =1 también converge a z. Veamos que esto
conduce a un imposible. En efecto, por un lado, como f es continua, resulta que
lı́m f ( xnk ) − f (z) = 0
k→∞
y
lı́m f (ynk ) − f (z) = 0.
k→∞
( 1)
158
Cap. 3 Funciones Continuas
Mientras que, por el otro lado, para todo k ≥ 1 se cumple que
0 < ε ≤
f ( xn k ) − f ( z) + f ( yn k ) − f ( z) .
f ( xn k ) − f ( yn k ) ≤
Esto último nos indica que uno de los límites
lı́m f ( xnk ) − f (z)
k→∞
o
lı́m f (ynk ) − f (z)
k→∞
debe ser estrictamente positivo, lográndose de este modo un disparate en relación a (1). Esta
contradicción nos convence de que f es uniformemente continua y finaliza la prueba.
El siguiente resultado establece que compacidad se preserva por imágenes continuas, es decir:
Teorema 3.1.7. Sea ( X, τ ) un espacio topológico y suponga que K ⊆ X es compacto. Si f : X → R
es una función continua sobre X, entonces f (K ) es compacto.
Prueba. Sea V = Vα : α ∈ I un cubrimiento abierto de f (K ). Puesto que f es continua
sobre X, la colección U = f −1 Vα : α ∈ I es un cubrimiento abierto de K el cual, por ser
un conjunto
compacto, se reduce a un subcubrimiento
finito, es decir, existen α1 , . . . , αn tal que
S
S
K ⊆ ni=1 f −1 (Vαi ). De esto se sigue que f (K ) ⊆ ni=1 Vαi y termina la prueba.
Puesto que todo conjunto compacto es cerrado y acotado, se sigue del resultado anterior que
si X es compacto, cualquier función continua f : X → R es acotada sobre X. Por esta razón, si X es
compacto, entonces C ( X ) = Cb ( X ). Esto permite definir, para cada f ∈ C ( X ), el número
k f k∞ = sup | f ( x)| : x ∈ X .
A k f k∞ se le llama la norma uniforme o norma sup de f . La familia de todos los conjuntos de
la forma
B ( f , r ) = g ∈ Cb ( X ) : k g − f k ∞ < r
donde f ∈ Cb ( X ) y r ∈ R + , constituye una topología sobre Cb ( X ) llamada la topología uniforme. Es un ejercicio sencillo demostrar que (Cb ( X ), k · k∞ ) es un espacio de Banach.
Recordemos que un espacio topológico de Hausdorff ( X, τ ) se dice localmente compacto si
cada x ∈ X posee un entorno abierto Vx de x cuya clausura es compacta, es decir, tal que Vx
es un conjunto compacto.
Definición 3.1.8. Sea ( X, τ ) un espacio localmente compacto y sea f : X → R una función. El soporte
de f se define como el conjunto
sop( f ) = { x ∈ X : f ( x) 6= 0}.
Puesto que ( A)c = int( Ac ), resulta que
x 6∈ sop( f )
⇔
x ∈ int { x ∈ X : f ( x) = 0}
⇔
existe un entorno abierto V de x tal que f (z) = 0 para todo z ∈ V.
De esta observación se deduce que si V0 es la unión de todos los conjuntos abiertos Vx que
contienen a x y para los cuales f |Vx = 0, resulta que V0 es el conjunto abierto más grande sobre el
cual f se anula. Por esto,
sop( f ) = X \ V0
y, por lo tanto, si x 6∈ sop( f ), entonces f ( x) = 0. Sin embargo, lo contrario no es, en general,
cierto. Por ejemplo, si f : R → R se define como f ( x) = x, resulta que sop( f ) = R y f (0) = 0.
Sec. 3.1 Propiedades Básicas
159
Definición 3.1.9. Sea ( X, τ ) un espacio localmente compacto. Una función continua f : X → R se dice
que tiene soporte compacto sobre X si su soporte, sop( f ), es un conjunto compacto.
En lo que sigue, el símbolo Cc ( X ) será usado para denotar el conjunto de todas las funciones
continuas f : X → R con soporte compacto.
Corolario 3.1.10. Si f ∈ Cc ( X ), entonces existe un intervalo compacto [ a, b] ⊇ sop( f ) tal que
f ( x) = 0
Prueba. Sea f ∈ Cc ( X ). Si definimos
a = ı́nf sop( f )
para todo x 6∈ [ a, b] .
y
b = sup sop( f ),
entonces [ a, b] ⊇ sop( f ) y f ( x) = 0 para todo x 6∈ [ a, b].
Con las operaciones usuales de adición y multiplicación por un escalar se comprueba sin
dificultad que Cc ( X ) es un espacio vectorial sobre R. De hecho, Cc ( X ) es un retículo vectorial,
en el siguiente sentido: si f , g ∈ Cc ( X ), entonces también pertenecen a Cc ( X ) las funciones
f ∧ g = mı́n{ f , g}
y
f + = máx{ f , 0}
y
f ∨ g = máx{ f , g}.
De esto último se sigue que si f ∈ Cc ( X ), entonces | f | ∈ Cc ( X ). Para ver esto, recordemos que
las partes positiva y negativa de f se definen como
y de las relaciones
f − = mı́n{− f , 0}
| f | = f + + f −,
f = f + − f −,
1
1
máx{ f , g} =
( f + g) + | f − g| ,
mı́n{ f , g} =
( f + g) − | f − g|
2
2
se sigue que | f | ∈ Cc ( X ).
El siguiente resultado garantiza la existencia de funciones continuas con soporte compacto
bajo condiciones muy sencillas.
Lema 3.1.11 (Urysohn). Sea ( X, d) un espacio métrico y suponga que existe un conjunto compacto K
y un conjunto abierto G tal que K ⊆ G ⊆ X. Entonces existe una función f ∈ Cc ( X ) tal que
( a) f ( x) = 1 para todo x ∈ K,
(b) f ( x) = 0 para todo x ∈ G c , y
(c) 0 ≤ f ( x) ≤ 1 para todo x ∈ R.
Prueba. La función f puede ser definida explícitamente del modo siguiente:
f ( x) =
dist( x, G c )
,
dist( x, K ) + dist( x, G c )
x ∈ X.
Puesto que K y G c son conjuntos cerrados y disjuntos, el denominador de f nunca es cero.
Más aun, f es continua sobre X por ser el cociente de dos funciones continuas y claramente ella
satisface las condiciones ( a) − (c). Por supuesto, sop( f ) ⊆ G y, así, f ∈ Cc ( X ).
En general, el Lema de Urysohn es válido si X es un espacio localmente compacto aunque su
demostración es mucho más elaborada.
160
Cap. 3 Funciones Continuas
Corolario 3.1.12. Sean ( X, d) un espacio métrico y F un subconjunto cerrado de X. Para cada
x0 ∈ X con x0 6∈ F, existe f ∈ Cc ( X ) tal que 0 ≤ f ( x) ≤ 1 para todo x ∈ X con f ( x0 ) = 1.
Prueba. Tomando K = { x0 } y G = F c , resulta que K es compacto, G es abierto y K ⊆ G. Se
sigue entonces del Lema de Urysohn que existe f ∈ Cc ( X ) con las propiedades señaladas.
En general, valen las inclusiones siguientes
Cc ( X ) ⊆ Cb ( X ) ⊆ C ( X ) ,
y que si X es compacto, entonces Cc ( X ) = Cb ( X ) = C ( X ). Nótese que la función f ( x) =
2
e− x es continua pero no pertenece a Cc (R ), aunque es fácil construir una sucesión ( f n )∞
n =1 en
Cc (R ) tal que f n → f puntualmente. Un característica importante que posee f es la siguiente:
lı́m| x |→∞ f ( x) = 0, lo cual significa que: dado cualquier ε > 0 existe un N ∈ N tal que | f ( x)| < ε
siempre que | x| > N. Si tomamos K = [− N, N ], lo anterior se puede expresar en la forma
| f ( x)| < ε para todo x ∈ K c .
Definición 3.1.13. Sea ( X, τ ) un espacio localmente compacto. Una función continua f : X → R se
anula en el infinito si para cada ε > 0, existe un compacto K ⊆ X tal que
| f ( x)| < ε para todo x ∈ X \ K.
En lo sucesivo, el símbolo C0 (R ) designará el conjunto de todas las funciones continua f ∈ C ( X )
que se anulan en el infinito. Es fácil establecer que
Cc ( X ) ⊆ C0 ( X ) ⊆ Cb ( X ) ⊆ C ( X )
y que C0 ( X ) es un subespacio cerrado de (Cb ( X ), k · k ∞ ). En particular, un espacio de Banach
2
con la norma del supremo. El ejemplo de la función f ( x) = e− x , muestra que C0 (R ) no coincide
con Cc (R ).
Teorema 3.1.14. La clausura de Cc (R ) en la topología uniforme es igual a C0 (R ), es decir,
Cc ( R )
k · k∞
= C0 (R ).
k·k
Prueba. Es claro que Cc (R ) ∞ ⊆ C0 (R ). Para demostrar la otra inclusión, sea f ∈ C0 (R ) y
fijemos un ε > 0. Entonces existe un compacto K ⊆ R tal que | f ( x)| < ε si x 6∈ K. Sea G
cualquier conjunto abierto tal que K ⊆ G. Por el Lema de Urysohn, existe una función ϕ ∈ Cc (R )
tal que
( a) ϕ( x) = 1 para todo x ∈ K,
(b) ϕ( x) = 0 para todo x ∈ G c , y
(c) 0 ≤ ϕ( x) ≤ 1 para todo x ∈ R.
Defina g = f ϕ. Entonces sop( g) ⊆ sop( ϕ), g ∈ Cc (R ) y se cumple que
| f ( x) − g( x)| = | f ( x) − f ( x) ϕ( x)| = | f ( x)||1 − ϕ( x)|
el cual vale 0 si x ∈ K y es < ε si x 6∈ K. Por lo tanto, k f − g k∞ < ε y termina la prueba.
Sec. 3.1 Propiedades Básicas
161
Teorema 3.1.15. Si f ∈ Cc (R ), entonces f es uniformemente continua sobre R.
Prueba. Puesto que sop( f ) es un conjunto compacto, él es cerrado y acotado y, en consecuencia,
existen números reales a, b tales que sop( f ) ⊆ [ a, b]. En particular, por ser f continua sobre R,
ella es uniformemente continua sobre [ a, b]. Por otro lado, como f = 0 sobre sop( f )c y [ a, b]c ⊆
sop( f )c , resulta que f = 0 sobre [ a, b]c . De esto se sigue que f también es uniformemente
continua sobre [ a, b]c y, por lo tanto, uniformemente continua sobre [ a, b] ∪ [ a, b]c = R.
3.1.2. Más sobre Funciones Continuas
Sea ( X, d) un espacio métrico. Sabemos que toda función continua f : X → R transforma
sucesiones convergentes en sucesiones convergentes; sin embargo, no ocurre lo mismo para sucesiones de Cauchy, es decir, f no necesariamente transforma sucesiones de Cauchy en sucesiones
de Cauchy. Por otro lado, si X es compacto, resulta que que toda función continua f : X → R
transforma sucesiones de Cauchy en sucesiones de Cauchy. La razón de fondo de tal hecho radica en
que, en este caso, dicha función es uniformemente continua y, por lo tanto, la afirmación anterior
se expresa en la forma: toda función uniformemente continua transforma sucesiones de Cauchy en sucesiones de Cauchy. Otra de las buenas razones de por qué las funciones uniformemente continuas
son importantes lo constituye el siguiente resultado:
Teorema 3.1.16 (Extensión Continua). Sea ( X, d) un espacio métrico y suponga que D es un subconjunto no vacío de X. Si f : D → R es una función uniformemente continua, entonces existe una única
función F : D → R tal que
( a) F es uniformemente continua sobre D y
(b) F ( x) = f ( x) para todo x ∈ D.
Prueba. Nuestro primer paso es la construcción de F. Para hacer eso, tomemos cualquier x ∈ D
∞
y elija una sucesión ( xn )∞
n =1 en D tal que xn → x. Puesto que ( xn ) n =1 es una sucesión de
∞
Cauchy y f es uniformemente continua sobre D, la sucesión ( f ( xn ))n=1 es de Cauchy en R y,
por consiguiente, converge en R. Esto permite definir F : D → R por
F ( x) = lı́m f ( xn )
n→∞
para cada x ∈ D. Debemos ahora verificar que esta es una buena definición, es decir, no depende
de la elección de la sucesión que converge a x. En efecto, sea (zn )∞
n =1 otra sucesión en D, distinta
∞
de la sucesión ( xn )n=1 , que también converge a x. Veamos que
lı́m f ( xn ) = lı́m f (zn ).
n→∞
n→∞
Fijemos ε > 0 elegido de manera arbitraria. Puesto que f es uniformemente continua sobre D,
existe un δ > 0 tal que cualesquiera sean u, v ∈ D con d(u, v) < δ se cumple que | f (u) − f (v)| <
ε. Ahora bien, como d( xn , zn ) → 0, resulta que para el δ elegido, existe un N ∈ N tal que
d( xn , zn ) < δ para todo n ≥ N. Se sigue de lo anterior que
| f ( xn ) − f (zn )| < ε para todo n ≥ N,
lo cual significa que lı́mn→∞ f ( xn ) = lı́mn→∞ f (zn ). Con esto hemos demostrado la existencia de
F.
162
Cap. 3 Funciones Continuas
(i) F ( x) = f ( x) para todo x ∈ D. En efecto, sea x ∈ D. Tomando xn = x para todo n ≥ 1,
vemos que
F ( x) = lı́m f ( xn ) = f ( x).
n→∞
(ii) F es uniformemente continua sobre D. Dado ε > 0, usemos el hecho de que f es uniformemente continua sobre D para elegir un δ > 0 tal que
si u, v ∈ D
con
entonces | f (u) − f (v)| < ε/3.
d(u, v) < δ
( 1)
Sean x, z ∈ D tal que d( x, z) < δ/3. Para demostrar que | F ( x) − F (y)| < ε, seleccionemos
∞
sucesiones ( xn )∞
n =1 y ( yn ) n =1 en D tales que xn → x y zn → z. Escojamos ahora un N1 ∈ N
de modo tal que si n ≥ N1 , entonces
d( xn , x) < δ/3
y
d(zn , z) < δ/3.
En particular,
d( xn , zn ) ≤ d( xn , x) + d( x, z) + d(zn , z) < δ
para todo n ≥ N1
y así, por (1), | f ( xn ) − f (zn )| < ε/3 para todo n ≥ N1 . De igual modo, como f ( xn ) → F ( x) y
f (zn ) → F (z), existe un N2 ∈ N tal que
| F ( xn ) − F ( x)| < ε/3
y
| F (zn ) − F (z)| < ε/3.
para todo n ≥ N2 . Sea N = máx{ N1 , N2 }. De lo anterior se sigue que
| F ( x) − F (z)| ≤ | F ( x) − F ( x N )| + | F ( x N ) − F (z N )| + | F (z N ) − F (z)|
= | F ( x) − F ( x N )| + | f ( x N ) − f (z N )| + | F (z N ) − F (z)|
< ε/3 + ε/3 + ε/3 = ε
lo cual prueba que F es uniformemente continua sobre D.
(iii) Para verificar que F es única, suponga que G es otra extensión uniformemente continua de
f sobre D y sea x ∈ D. Entonces existe una sucesión ( xn )∞
n =1 en D tal que
F ( x) = lı́m f ( xn ) = lı́m G ( xn ) = G ( x).
n→∞
La prueba es completa.
n→∞
Una consecuencia inmediata del resultado anterior en combinación con el Teorema 3.1.7 es el
siguiente.
Corolario 3.1.17. Sea K ⊆ R n acotado. Si f : K → R es una función uniformemente continua
sobre K, entonces f (K ) es acotado.
Prueba. Por el Teorema de Extensión Continua, existe una única aplicación uniformemente continua F : K → R que es una extensión de f . Como K es acotado, también lo es K y así, K es
compacto. Se sigue del Teorema 3.1.7 que F (K ) es compacto y, por lo tanto, acotado. Finalmente,
como
f (K ) = F (K ) ⊆ F (K ),
Sec. 3.1 Propiedades Básicas
163
resulta que f (K ) es acotado.
Sean ( A, τ1 ) y ( B, τ2 ) espacios topológicos. Una función f : A → B se dice que es un
homeomorfismo de A sobre B si ella es biyectiva, continua y su inversa f −1 : B → A también es
continua. En este caso se dice que A y B son homeomorfos . Si ( A, d1 ) y ( B, d2 ) son espacios
métricos y f : A → B es un aplicación biyectiva y continua tal que d1 ( x, y) = d2 ( f ( x), f (y))
para todo x, y ∈ A, entonces diremos que A y B son isométricos y a la función f se le llama
una isometría sobreyectiva. Es importante destacar que una función continua y biyectiva no
es necesariamente un homeomorfismo. Sin embargo, si su dominio es compacto, se obtiene el
siguiente resultado:
Teorema 3.1.18. Sean K1 y K2 espacios topológicos tal que K1 es compacto. Entonces, toda biyección
continua f : K1 → K2 es un homeomorfismo.
Prueba. Sólo tenemos que demostrar que la función inversa f −1 : K2 → K1 es continua en K2 , es
− 1
decir, si F ⊆ K1 es cerrado, entonces f −1
( F ) = f ( F ) es cerrado en K2 . Suponga que F es
un subconjunto cerrado en K1 . Como K1 es compacto, el Teorema 2.2.29 nos garantiza que F es
compacto y la continuidad de f nos revela, gracias al Teorema 3.1.7, que f ( F ) es compacto en K2 .
Por una nueva aplicación del Teorema 2.2.29 tenemos que f ( F ) es cerrado en K2 .
Definición 3.1.19. Sea f : [ a, b] → R una función. Diremos que f es una función de Darboux, o
posee la Propiedad del Valor Intermedio (PVI) si, para cualesquiera x, y ∈ [ a, b] con x < y y cualquier
número c entre f ( x) y f (y), existe un t ∈ ( x, y) tal que f (t) = c.
En realidad, uno puede reemplazar el intervalo [ a, b] en la definición anterior, por cualquier
intervalo I ⊆ R.
Teorema 3.1.20 (Bolzano, Teorema del Valor Intermedio). Si f : [ a, b] → R es una función continua sobre [ a, b], entonces f posee la PVI.
Prueba. Puesto que f es continua en el compacto [ a, b] ella es acotada. Sean
m = ı́nf f ( x) : x ∈ [ a, b]
y
M = sup f ( x) : x ∈ [ a, b] .
Si m = M, entonces f es constante y la conclusión es inmediata. Suponga que m < M y sea c
tal que m < c < M. Las propiedades del ínfimo y del supremo implican la existencia de puntos
a1 , b1 en [ a, b] tales que
m ≤ f ( a1 ) < c < f (b1 ) ≤ M.
Para simplificar la presentación supondremos que a1 < b1 (el caso a1 > b1 se trata de modo
similar). Defina
E = x ∈ [ a, b] : f ( x) ≤ c .
Observe que E 6= ∅ ya que a1 ∈ E y, además, está acotado superiormente por b. Sea t = sup E.
Para cada n ∈ N, las propiedades de éste supremo indican la existencia de un elemento xn ∈ E
tal que t − 1/n < xn ≤ t y, por consiguiente, la sucesión ( xn )∞
n =1 converge a t, y entonces, por
continuidad, f ( xn ) → f (t). Pero como xn ∈ E resulta que f ( xn ) ≤ c y, así,
f (t) = lı́m f ( xn ) ≤ c.
n→∞
164
Cap. 3 Funciones Continuas
Por otra parte, puesto que t es el supremo de E, entonces cualquier x ∈ (t, b] es cota superior
de E y, en consecuencia, f ( x) > c. De nuevo, por continuidad,
f (t) = lı́m f ( x) ≥ c,
x →t+
de donde se concluye que f (t) = c. La prueba es completa.
En el siglo XIX muchos matemáticos compartían la creencia de que la Propiedad del Valor
Intermedio era equivalente a continuidad. Sin embargo, en el año 1875, el matemático francés
Jean Gaston Darboux (1842-1917) probó que esa creencia era totalmente falsa, es decir, el recíproco
del Teorema de Valor Intermedio es falso. Para ver esto, considere la aplicación f : R → R
definida por

sen(1/x)
si x 6= 0
f ( x) =
0
si x = 0.
Es claro que f es discontinua en x = 0. Sin embargo, puesto que el rango de f es el intervalo
[−1, 1] se tiene que f posee la PVI.
El resultado anterior establece que la PVI no es una propiedad exclusiva de las funciones
continuas. De hecho, existen funciones que poseen la PVI que no son continuas en ningún punto
de su dominio (véase el Corolario 6.5.36, página 342).
Teorema 3.1.21 (Darboux). Si f : [ a, b] → R es una función diferenciable en [ a, b], entonces f ′ posee
la PVI.
Prueba. Sean x, y ∈ [ a, b] con x < y y suponga que c es cualquier punto entre f ′ ( x) y f ′ (y).
Sin perder generalidad, podemos asumir que f ′ ( x) > f ′ (y). Defina la función G : [ x, y] → R
por G (t) = f (t) − ct. Puesto que G es diferenciable sobre [ a, b], ella es continua sobre dicho
intervalo y, en consecuencia, alcanza su máximo en algún punto t0 ∈ [ x, y]. En particular,
G ′ (t0 ) = 0. Observe ahora que G ′ ( x) = f ′ ( x) − c > 0, por lo que t0 6= x. Similarmente,
G ′ (y) = f ′ (y) − c < 0 y, entonces, t0 6= y. Esto nos garantiza que t0 ∈ ( x, y) y, por lo tanto,
0 = G ′ (t0 ) = f ′ (t0 ) − c.
Uno entonces se pregunta, ¿bajo qué condiciones adicionales, si es que existen, la PVI implica
continuidad? La respuesta viene dada por el siguiente resultado.
Teorema 3.1.22. Sea f : [ a, b] → R una función inyectiva la cual satisface la PVI sobre [ a, b]. Entonces f es continua sobre [ a, b].
Prueba. Nuestra primera tarea es demostrar que f es estrictamente monótona sobre [ a, b]. Para
ver esto, sean x1 , x2 ∈ [ a, b] con x1 < x2 . Puesto que f es inyectiva, resulta que f ( x1 ) 6= f ( x2 ).
Suponga que f ( x1 ) < f ( x2 ). Si x1 < u < x2 , entonces se debe cumplir que f ( x1 ) < f (u) <
f ( x2 ). En efecto, de ocurrir la desigualdad f (u) > f ( x2 ), tendríamos las desigualdades f ( x1 ) <
f ( x2 ) < f (u) y entonces la PVI nos proporcionará un x ∈ ( x1 , u) tal que f ( x) = f ( x2 ) lo que
negaría la hipótesis de que f es inyectiva. Similarmente, la desigualdad f (u) < f ( x1 ) no puede
ocurrir.
Para demostrar la continuidad de f asumiremos que ella es estrictamente creciente sobre [ a, b]
y tomemos x ∈ [ a, b]. Si f es discontinua en x, entonces debemos tener que f ( x− ) < f ( x) o
f ( x) < f ( x+ ), donde f ( x− ) y f ( x+ ) son, respectivamente, los límites laterales por la izquierda
Sec. 3.1 Propiedades Básicas
165
y por la derecha de f en x. Si, por ejemplo, ocurre que f ( x) < f ( x+ ), entonces la PVI no se
cumple sobre [ x, x + δ] para cualquier δ > 0. Por esto, debemos tener que f ( x) = f ( x+ ). De
modo similar se tiene que f ( x) = f ( x− ) y termina la prueba.
Una fácil aplicación de la Propiedad del Valor Intermedio para funciones continuas es el
siguiente el hecho:
Corolario 3.1.23. Si f : [ a, b] → R es una función continua estrictamente creciente sobre [ a, b],
entonces f ( J ) es un intervalo para cualquier intervalo J ⊆ [ a, b].
Prueba. Suponga que J = ( x, y) ⊆ [ a, b] y sea x < t < y. Como f es estrictamente creciente
sobre [ a, b], se tiene que f ( x) < f (t) < f (y) y, por lo tanto,
f (( x, y)) ⊆ ( f ( x), f (y)).
Por otro lado, si ξ ∈ ( f ( x), f (y)), entonces por ser f continua sobre [ a, b], la Propiedad del
Valor Intermedio nos garantiza la existencia de un t ∈ ( x, y) tal que f (t) = ξ. Esto nos indica
que ( f ( x), f (y)) ⊆ f (( x, y)) y termina la prueba.
La siguiente función es una modificación de la función de Dirichlet. Es un ejemplo interesante
de una función que es continua en los irracionales pero discontinua en los racionales. Esto, por supuesto,
constituye un hecho que sorprende a la imaginación. Pero si ese hecho resulta curioso, no menos
curioso es este otro: el Teorema de Categoría de Baire garantiza (véase la consecuencia TBC(7) en
la página 140) que es imposible construir una función f : [0, 1] → R que sea continua en los racionales
y discontinua en los irracionales. Estos, y tantos otros resultados similares, revelan que continuidad
es un asunto que hay que analizar con mucha precaución. En lo que sigue designaremos por Q ∗
al conjunto de los números racionales en forma irreducible, es decir, p/q ∈ Q ∗ si p y q son
primos relativos.
Ejemplo 3.1.1. Considere la función de Thomae f : R → R definida por

1


si x = p/q ∈ Q ∗ ,
q
f ( x) =

0 si x ∈ R \ Q.
Entonces f es continua en los irracionales pero discontinua en los racionales.
1−
1
2
b
−
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b b
b b
b b
b
b
b
b
b b
b b
b b
b b
b
b
b
b
b b
b b
bb
b
b
b
b
b
bb
b b
b b
b
b
b
b b
bbb
b b b b b b b b b b b b b b b b b b bb b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b
bbb
b
b
b
b
b
b
b
b
b
b
bbb
b
b
b
b
b
b
b bbb bbbbb bbbb bbb b b b bbbbb b b b b bb b b b b b bb b b b b b bb b b b b b b b b b bb b b b b b b b b b b b b b bbb b b b b b b b b b bb b b b b b b b b b b b bbb b b b b b b b b b bb b b b b b b bb b b b b b b b bb b b b b b b b b b b b b b b b b b bbbb b b b b b b b b b b b b b b b b b bb b b b b b b b bb b b b b b b bb b b b b b b b b b bbbb b b b b b b b b b b b bb b b b b b b b b b bb b b b b b b b b b b b b b bb b b b b b b b b b bb b b b b b bb b b b b b bb b b b b b b b b b b b b b b b b b b b b b b b b b b b b
bbb b
b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b bb b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b
bbbbbb
b b b b bbbbbbbbbbbb
bbbbbb b bbbbbbbb b b b bbbbbbbbbb
bb b b b bbbbbbbbbbbbbbb
b b b b bbbbbbbbbbbbb
b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b bb b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b
bb b b bbbbbbbbbbbbbbbbbb
b b bbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
b b bbbbbbbbbbbbbbbbbbbb
b b bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
b b bbbbbbbbbbbbbbbbb
b b b bbbbbbbbbbbbbbbbbbbbbbbbb
b b b b b b b b b b b b b b b b b b b bb b b b bbbbbbbbb bbbbbbbb bbbbbbbb
b bb bbbbbbbbbb
b b b b bbbbbbbbbbbbbbbbbbbbbbbbbbb
bbbbbbbbbbbbbbbbbbb
b b b b bbbbbbbbbbbbbbbbbbbbbbbbbbbbb
bb b b bbbbbbbbbbbbb
b bbbbbbbbbbbbbbbbbbbbbbb
b b b b bbbbbbbbbbbbbbbbbbbb
b b bbbbbbbbbbbbbbbbbbbbbbbb
b b bb bbbbbbbbbbbbbbb
b bb b b bbbbbbbbb
b bb b b b bbbbbbbbbbbbbbbbbbbbbbbbbbb
b b bbbbbbbbbbbbbbbbbbbbbbbbbbb
b b b bbbbbbbbbbbbbbbbbbbbbb
b b bb b bbbbbbbbbbbbbbbbb
b bb b b bbbbbbbbbbbbb
bbbbbbb
bbbbbb b bbbb b b bbb b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b
b b b b b b b b b b bb bb bb bb b b bb bb bb bb b b b b b b b b b bb bb bb bb bb bbb bb b b b b b b b b b bb b b b bb b b b b b b b b bb b b b b b b bbbbbbb b b b b bbbbbbb b b b bbbbbbb b b bbbbbbb b bbbbb b b b bbbbbb bbbb b bb b b b
bb
bb bb
0
b
bb
bb b b
b
bb b
bb b
bb
b
b
b
b
1
166
Cap. 3 Funciones Continuas
Prueba. Veamos, en primer lugar, que f es discontinua sobre Q. Sea x = p/q ∈ Q ∗ . Como el
conjunto de los números irracionales es denso en R, podemos elegir una sucesión de números
irracionales ( xn )∞
n =1 tal que lı́mn →∞ xn = x. Por definición, f ( xn ) = 0 para todo n ∈ N, mientras
que f ( x) = 1/q 6= 0, es decir, lı́mn→∞ f ( xn ) 6= f ( x). Esto prueba la discontinuidad de f en x ∈ Q
y como x es arbitrario, concluimos que f es discontinua sobre Q.
Para probar que f es continua sobre los irracionales, será suficiente, por la periodicidad de
f , demostrarla en lo irracionales del intervalo (0, 1). Tomemos cualquier x0 ∈ (0, 1) \ Q y sea
0 < ε < 1. Elijamos un N ∈ N tal que N1 < ε. Nuestro objetivo es determinar un intervalo abierto
con centro en x0 , digamos J, que no contenga ningún racional en forma reducida de la siguiente
lista
N−1
1
1
2
1
3
1
2
3
4
,
,
,
,
,
,
,
,
, ··· ,
·
(3.1.1)
2
3
3
4
4
5
5
5
5
N
¿Por qué la elección de J es la adecuada? Pues bien, supongamos que hemos obtenido el intervalo
J y tomemos cualquier x ∈ J. Notemos ahora que:
si x es irracional, entonces f ( x) = f ( x0 ) = 0 y, en consecuencia,
| f ( x) − f ( x0 )| = 0 < ε.
si x es racional, entonces dicho número no es ninguno de los que aparecen en (3.1.1) y, por
p
consiguiente, su denominador debe ser mayor que N, es decir, x es de la forma con q > N
q
y, por lo tanto,
1
1
| f ( x) − f ( x0 )| = | f ( x)| =
<
< ε.
q
N
Esto demuestra la continuidad de f en x0 y la prueba finalizará una vez hallamos construido el
intervalo J. El procedimiento para obtener el intervalo abierto J es muy sencillo: en efecto, sea
SN =
p/q ∈ (0, 1) : p, q son primos relativos con q ≤ N
Es claro que S N es un conjunto finito y sus elementos son precisamente los puntos que aparecen
en la lista (3.1.1). Ahora bien, como S N es finito, podemos determinar un δ > 0 tal que J :=
( x0 − δ, x0 + δ) ⊆ (0, 1) y con S N ∩ ( x0 − δ, x0 + δ) = ∅. Esto termina la prueba.
La función de Thomae también recibe los siguientes nombres: función de las palomitas de maíz,
función de las gotas de lluvias, la función reglada y la función Estrellas sobre Babilonia. Otra función que
es continua en los irracionales y discontinua en los racionales es la siguiente.
Ejemplo 3.1.2. Sea (rn )∞
n =1 una lista de los números racionales en [0, 1]. Defina la función f : [0, 1] →
R por
X
1


,
si x ∈ (0, 1]
n
f ( x) = n ∈ Dx 2


0,
si x = 0,
donde Dx = {n ∈ N : rn < x}. Entonces f , además de ser estrictamente creciente, es continua en los
irracionales y discontinua en los racionales de [0, 1].
Sec. 3.1 Propiedades Básicas
167
Prueba. Para demostrar que f es estrictamente creciente, sean x1 , x2 ∈ [0, 1] con x1 < x2 . Entonces
X 1
X 1
X
X 1
1
f ( x2 ) =
=
+
>
= f ( x1 ) .
n
n
n
2
2
2
2n
n ∈ N,
r n < x2
n ∈ N,
r n < x1
n ∈ N,
x1 ≤ r n < x2
n ∈ N,
r n < x1
Para ver la segunda parte, sea ε > 0. Puesto que la serie
N ∈ N tal que
∞
X
1
< ε.
2n
P∞
n =1 1/2
n
converge, existe un
n= N
Sea y un número irracional en [0, 1] y defina
δ = máx |y − r j | : 1 ≤ j < N .
Vamos a demostrar que
f ( x ) − f ( y) < ε
para cualquier x ∈ [0, 1] que satisfaga 0 < x − y < δ. En efecto, observe en primer lugar que, si
n es cualquier número natural tal que y < rn < x, entonces n ≥ N. Para ver esto, suponga por
un momento que n < N. Como y < rn < x, resulta entonces que rn − y < x − y < δ lo cual es
imposible por la definición de δ. De lo anterior se deduce que si x − y < δ, entonces
f ( x ) − f ( y) =
∞
X
1
1
≤
< ε.
n
2
2n
X
{n : y < rn < x}
n= N
Esto prueba la continuidad de f en cualquier irracional y ∈ [0, 1].
Suponga ahora que y es un racional arbitrario en [0, 1]. Entonces y = rm para algún m ∈ N.
Admitamos, por un momento, que f es continua en y y escojamos un δ > 0 tal que si 0 <
x − y < δ, entonces f ( x) − f (y) < ε. Puesto que
ε > f ( x ) − f ( y) =
X
{n : y < rn < x}
1
1
≥ m
n
2
2
entonces se obtiene una contradicción si nuestro ε se elige tan pequeño de modo que ε <
esto se concluye que f es discontinua en cada racional de [0, 1] y termina la prueba.
1
2m .
De
3.1.3. Oscilación y Discontinuidad de una Función
Como siempre V ( x, δ) denotará un entorno de x en [ a, b], es decir, V ( x, δ) es de la forma
V ( x, δ) = ( x − δ, x + δ) ∩ [ a, b]
para algún
δ > 0.
Recordemos que una función f : [ a, b] → R es continua en x0 ∈ [ a, b] si, dado ε > 0, existe un
δ > 0 tal que | f ( x) − f ( x0 )| < ε siempre que x ∈ V ( x0 , δ). Esto nos indica que
f (V ( x0 , δ)) ⊆ ( f ( x0 ) − ε, f ( x0 ) + ε).
Nuestro primer resultado estable que cualquier función continua que es positiva en un punto
posee un entorno alrededor de dicho donde la función sigue siendo positiva.
168
Cap. 3 Funciones Continuas
Teorema 3.1.24. Sea f : [ a, b] → R continua sobre [ a, b] y suponga que f ( x0 ) > 0 para algún
x0 ∈ [ a, b]. Entonces existe un δ > 0 tal que f ( x) > 0 para todo x ∈ V ( x0 , δ).
Prueba. Puesto que f es continua en x0 , resulta que tomando ε = f ( x0 )/2, podemos encontrar
un δ > 0 de modo tal que
| f ( x) − f ( x0 )| < ε para todo x ∈ V ( x0 , δ).
En particular, f ( x0 ) − ε < f ( x) para todo x ∈ V ( x0 , δ), es decir,
f ( x) > f ( x0 ) − f ( x0 )/2 = f ( x0 )/2 > 0
para todo x ∈ V ( x0 , δ).
La prueba es completa.
T
Un conjunto G ⊆ R se dice que es un Gδ si él se puede escribir en la forma G = ∞
n = 1 Gn ,
donde cada Gn es un conjunto abierto. Como siempre, el símbolo PC( f ) lo usaremos exclusivamente para representar el conjunto de los puntos de continuidad de f .
Teorema 3.1.25. Sea f : [ a, b] → R una función arbitraria. Entonces PC( f ) es un Gδ .
Prueba. Sea a ∈ PC( f ). Por definición, para cada n ≥ 1, existe un entorno V ( a, δna ) de a tal que
| f ( x) − f ( a)| < 1/n siempre que x ∈ V ( a, δna ).
Para cada n ≥ 1, sea
T∞
Gn =
[
V ( a, δna )
a∈PC( f )
y defina G = n=1 Gn . Claramente cada Gn es un conjunto abierto conteniendo a PC( f ) y, por
lo tanto, G es un Gδ . Nuestra tarea es demostrar que G = PC( f ).
Puesto que PC( f ) ⊆ Gn para todo n ≥ 1, se sigue que PC( f ) ⊆ G. Para demostrar la otra
inclusión, sea x0 ∈ G. Veamos que f es continua en x0 . En efecto, fijemos un ε > 0 arbitrario y
seleccionemos un entero positivo k tal que 1/k < ε/2. Por definición, x0 ∈ Gk , lo cual significa
que x0 ∈ V ( a, δka ) para algún a ∈ PC( f ). Puesto que V ( a, δka ) es un conjunto abierto, existe un
δ > 0 tal que
x0 − δ, x0 + δ ⊆ V ( a, δka ).
Finalmente, si x ∈ x0 − δ, x0 + δ , entonces
| f ( x) − f ( x0 )| ≤ | f ( x) − f ( a)| + | f ( a) − f ( x0 )| < 1/k + 1/k < ε.
Esto prueba que f es continua en x0 y, por lo tanto, G ⊆ PC( f ) y concluye la prueba.
Otra forma de demostrar el resultado anterior es a través de la noción de oscilación de una
función. Es René Baire quien introduce este concepto en su tesis para “medir” cuánto salta una
función en una discontinuidad. Recordemos que
Un punto x0 ∈ [ a, b] es un punto de discontinuidad de f si, y sólo si, existe un ε > 0 con la
siguiente propiedad: para cada δ > 0, existe un xδ ∈ V ( x0 , δ) para el cual se cumple que
| f ( xδ ) − f ( x0 )| ≥ ε.
Lo anterior se puede expresar en la forma:
Sec. 3.1 Propiedades Básicas
169
Una función f es discontinua en x0 ∈ [ a, b], si existe un ε > 0 con la siguiente propiedad: para
cualquier intervalo abierto I contenido en [ a, b] con x0 ∈ I, se cumple que
diam f ( I ) = sup | f ( x) − f (y)| : x, y ∈ I ≥ ε.
La siguiente definición permitirá describir a Disc( f ), el conjunto de los puntos de discontinuidad
de f , en términos de estos supremos. Recordemos antes, véase el Corolario 2.1.13, que si f :
[a, b] → R es función acotada, entonces
sup | f ( x) − f (y)| : x, y ∈ F = sup f ( x) − ı́nf f ( x)
x∈ F
x∈ F
para cualquier conjunto no vacío F ⊆ [ a, b].
Definición 3.1.26. Sea f : [ a, b] → R una función acotada sobre [ a, b]. Para cada subconjunto F de
[a, b], definimos la oscilación de f en F como
osc ( f , F ) = sup f ( x) − ı́nf f ( x)
x∈ F
x∈ F
= sup | f ( x) − f (y)| : x, y ∈ F
= diam f ( F ) .
Por supuesto, si f no es acotada sobre F, pondremos osc ( f , F ) = ∞. Observe que si δ1 < δ2 ,
entonces para cada x ∈ [ a, b],
osc f , V ( x, δ1 ) ≤ osc f , V ( x, δ2 ) ,
de modo que la función ω x : (0, +∞) → R definida por ω x (δ) = osc f , V ( x, δ) es creciente y
no-negativa. Usando lo anterior podemos justificar la siguiente definición:
Definición 3.1.27. Sea f : [ a, b] → R una función acotada. Para cada x ∈ [ a, b], la oscilación de f en
x se define como
osc ( f , x) = ı́nf osc f , V ( x, δ)
δ>0
= lı́m osc f , V ( x, δ) .
δ →0+
El siguiente resultado caracteriza la continuidad de una función en términos de su oscilación
en un punto.
Teorema 3.1.28. Sea f : [ a, b] → R una función. Entonces
(1) PC( f ) = x ∈ [a, b] : osc ( f , x) = 0 .
(2) Para cada ε > 0, el conjunto Of (ε) = x ∈ [a, b] : osc ( f , x) < ε es abierto en [a, b].
Prueba. (1) Sea x ∈ PC( f ). Dado ε > 0 existe, por la
continuidad de f en x, un δ > 0 para el cual
se cumple que f (V ( x, δ)) ⊆ f ( x) − ε/2, f ( x) + ε/2 . De aquí se sigue osc ( f , x) ≤ ε y como ε > 0
es arbitrario, concluimos que osc ( f , x) = 0. Esto prueba que PC( f ) ⊆ { x ∈ [ a, b] : osc ( f , x) =
0}.
Para demostrar la otra inclusión, sea x ∈ [ a, b] tal que osc ( f , x) = 0. Entonces, dado ε > 0,
existe un δ > 0 tal que | f (y) − f (z)| < ε para todo y, z ∈ V ( x, δ). En particular, | f ( x) − f (y)| < ε
170
Cap. 3 Funciones Continuas
para todo y ∈ V ( x, δ). Con esto hemos demostrado que x ∈ PC( f ) y con ello la prueba de la
primera parte del teorema.
(2) Sean ε > 0 y x ∈ Of (ε). Entonces osc ( f , x) = ı́nfδ>0 osc ( f , V ( x, δ)) < ε y, por lo tanto,
existe un δ0 > 0 tal que osc ( f , V ( x, δ0 )) < ε. Sea δ = δ0 /2 y veamos que
V ( x, δ) ⊆ Of (ε).
En efecto, sea y ∈ V ( x, δ). Si |z − y| < δ, entonces
|z − x| ≤ |z − y| + |y − x| < δ + δ = δ0
y, por consiguiente, se cumple que V (y, δ) ⊆ V ( x, δ0 ). Por esto,
| f (z) − f (z′ )| < ε para todo z, z′ ∈ V (y, δ) ,
es decir, osc ( f , V (y, δ)) < ε y así, osc ( f , y) < ε. Como y ∈ V ( x, δ) es arbitrario, resulta
entonces que V ( x, δ) ⊆ Of (ε). Esto termina la prueba.
Observemos que el Teorema 3.1.28 nos dice que
x ∈ Disc( f )
es decir,
Disc( f ) =
⇔
osc( f , x) > 0,
x ∈ [ a, b] : osc( f , x) > 0 .
Además, puesto que el conjunto Of (ε) es abierto en [ a, b] para cada ε > 0, resulta que el conjunto
Dε ( f ) = x ∈ [ a, b] : osc( f , x) ≥ ε = [ a, b] \ Of (ε)
es cerrado en [ a, b] para cada ε > 0. En particular, Dε ( f ) es compacto para todo ε > 0. Más
aun, Disc( f ) se puede representar en la forma
Disc( f ) = [ a, b] \ PC( f )
= x ∈ [a, b] : osc( f , x) > 0
∞ [
1
=
x ∈ [ a, b] : osc( f , x) ≥
n
n =1
=
∞
[
D1/n ( f ).
n =1
De esto se obtiene que Disc( f ) es un Fσ y, por lo tanto, PC( f ) es un Gδ .
Teorema 3.1.29. Sea f : [ a, b] → R una función acotada sobre [ a, b]. Entonces Disc( f ) ∩ L−f es a lo
más numerable, donde L−f = x ∈ ( a, b] : f ( x− ) existe .
Prueba. Puesto que Disc( f ) =
S∞
n =1 D1/n ( f ),
Disc( f ) ∩ L−f
resulta que
=
∞
[
n =1
D1/n ( f ) ∩ L−f
Sec. 3.1 Propiedades Básicas
171
y, en consecuencia, es suficiente demostrar que el conjunto D1/n ( f ) ∩ L−f es a lo más numerable.
Fijemos un n ∈ N y sea x0 ∈ D1/n ( f ) ∩ L−f . Como x0 ∈ L−f , existe un δ > 0 tal que
1
2n
| f ( x) − f ( x0− )| <
para todo x ∈ ( x0 − δ, x0 ),
de donde se sigue que
1
n
| f (u) − f (v)| <
para todo u, v ∈ ( x0 − δ, x0 ).
Esto último nos indica que osc( f , ( x0 − δ, x0 )) ≤ 1/n y, en consecuencia,
si x ∈ ( x0 − δ, x0 ), entonces osc( f , x) ≤ 1/n.
Por otro lado, como x0 ∈ D1/n ( f ), se tiene que osc( f , x) ≥ 1/n y por lo tanto, x0 es el extremo
derecho de algún intervalo abierto, digamos Jx0 , el cual no contiene puntos de D1/n ( f ) ∩ L−f . Es
claro que si x, y son puntos distintos en D1/n ( f ) ∩ L−f , entonces Jx ∩ Jy = ∅. Por esto, la familia
de intervalos abiertos { Jx : x ∈ D1/n ( f ) ∩ L−f } es disjunta, de donde se obtiene que ella es a lo
más numerable y, por consiguiente, D1/n ( f ) ∩ L−f es a lo más numerable.
Un argumento enteramente similar nos revela que Disc( f ) ∩ L+f es a lo más numerable, donde
L+f =
x ∈ [ a, b) : f ( x+ ) existe .
De nuevo, sea f : [ a, b] → R una función arbitraria. Los puntos de Disc( f ) se pueden
clasificar en dos grandes categorías: los que son de la primera especie y los que son de la segunda
especie.
Definición 3.1.30. Sea f : [ a, b] → R una función. Un punto x ∈ Disc( f ) es llamado un punto de
discontinuidad de la primera especie, si lo límites
f ( x+ ) = lı́m f (t)
t→ x +
f ( x− ) = lı́m f (t)
y
t→ x −
existen.
Por supuesto, x ∈ Disc( f ) es un punto de discontinuidad de la primera especie significa que
f ( x+ ) = f ( x− ) 6= f ( x)
o
f ( x − ) 6 = f ( x + ).
Si ocurre que f ( x+ ) = f ( x− ) 6= f ( x), entonces se dice que x es una discontinuidad removible.
Si por el contrario, f ( x− ) 6= f ( x+ ), entonces diremos que x es una discontinuidad de salto.
Todas las otras discontinuidades son llamadas de la segunda especie. Por ejemplo, las funciones

 
 1 si x 6= 0
sen 1
si x 6= 0
2
x
x
f ( x) =
y
g( x ) =


0
0
si x = 0
si x = 0
poseen, ambas, una discontinuidad de la segunda especie en x = 0.
172
Cap. 3 Funciones Continuas
Definición 3.1.31. Una función ϕ : [ a, b] → R se llama una función en escalera, o función escalonada, si existen números x0 , x1 , . . . , xn en [ a, b] tales que
( i ) a = x0 < x1 < · · · < x n = b y
(ii) ϕ es constante en cada intervalo abierto ( x j−1 , xi ), j = 1, 2, . . . n.
Sea ϕ : [ a, b] → R una función en escalera y suponga que ϕ( x) = c j para todo x ∈ ( x j−1 , x j )
para cada j ∈ {1, . . . , n}. Observe que los valores ϕ( x0 ), . . . , ϕ( xn ) de los puntos extremos de los
intervalos [ xi−1 , xi+1 ] pueden no coincidir con los números c1 , . . . , cn . Sin embargo, toda función
representada en la forma
n
X
ϕ( x) =
cj χ I
j=1
j
donde a = x0 < x1 < · · · < xn = b, Ij = [ x j−1 , xi ], para j = 1, 2, . . . n y los c j son números
reales, es una función en escalera.
c2 −
c4 −
c1 −
x0
c3 −
|
x1
|
x2
|
x3
|
x4
El conjunto de todas las funciones escalonadas ϕ : [ a, b] → R será denotado por Esc([ a, b]). Es
fácil establecer que Esc([ a, b]) es un subespacio vectorial de B∞ ([ a, b]). Nótese que el número
de discontinuidades de cualquier ϕ ∈ Esc([ a, b]) es finito y todas son de salto.
Teorema 3.1.32. Si f : [ a, b] → R es una función con la PVI, entonces toda discontinuidad de f es
de la segunda especie.
Prueba. Suponga, para arribar a una contradicción, que f posee una discontinuidad de la primera especie, digamos x0 y que, por ejemplo, dicha discontinuidad es de salto. En este caso
f ( x0− ) 6= f ( x0+ ). Para fijar idea, suponga que f ( x0− ) < f ( x0+ ) y que c es tal que c 6= f ( x0 ) y
f ( x0− ) < c < f ( x0+ ). Ahora bien, puesto que f ( x0− ) = lı́m f ( x), tomando ε = c − f ( x0− ) > 0,
existe un δ1 > 0 tal que
x → x0 −
| f ( x) − f ( x0− )| < ε para cada x ∈ [a, b] con 0 < x0 − x < δ1 .
(PVI1 )
Similarmente, eligiendo ε = f ( x0+ ) − c > 0, existe un δ2 > 0 tal que
| f ( x) − f ( x0+ )| < ε para cada x ∈ [a, b] con 0 < x − x0 < δ2 .
(PVI2 )
Sec. 3.1 Propiedades Básicas
173
Observe que (PVI1 ) implica que
f ( x) < c
para x0 − δ1 < x < x0 .
( 1)
para x0 < x < x0 + δ2 .
( 2)
Similarmente, (PVI2 ) implica que
f ( x) > c
Seleccione dos números cualesquiera en [ a, b], digamos x1 y x2 tales que
x0 − δ1 < x1 < x0 < x2 < x0 + δ2
y observe que de (1) y (2) se obtiene que
f ( x1 ) < c < f ( x2 )
Esto último combinado con el hecho de que c 6= f ( x0 ), nos indica que no existe t ∈ ( x1 , x2 ) para
el cual f (t) = c lo que contradice nuestra hipótesis de que f posee la PVI. Suponga ahora que
x0 es una desigualdad removible, es decir,
f ( x0+ ) = f ( x0− ) 6= f ( x0 ).
Sea L = f ( x0+ ) = f ( x0− ) y seleccione un ε 0 > 0 tal que f ( x0 ) 6∈ ( L − ε 0 , L + ε 0 ). Sin perder
generalidad, asumiremos que f ( x0 ) > L + ε 0 (el caso f ( x0 ) < L − ε 0 se trata de modo similar).
De la definición de límite se sigue la existencia de un δ > 0 tal que
L − ε 0 < f ( x) < L + ε 0
para todo x ∈ ( x0 − δ, x0 + δ) x 6= x0 .
(PVI3 )
Finalmente, seleccione cualquier x1 ∈ ( x0 − δ, x0 + δ) con x1 6= x0 y observe que L + ε 0 está entre
f ( x0 ) y f ( x1 ). Sin embargo, por (PVI3 ), ningún x entre x0 y x1 cumple que f ( x) = L + ε 0 .
Esto, por supuesto, contradice la PVI y termina la prueba.
Si f : [ a, b] → R es una función diferenciable en [ a, b], entonces el Teorema de Darboux,
Teorema 3.1.21, nos dice que f ′ posee la Propiedad del Valor Intermedio y, por consiguiente, se
cumple que:
Corolario 3.1.33. Si f : [ a, b] → R es una función diferenciable sobre [ a, b], entonces toda discontinuidad de f ′ es de la segunda especie.
El siguiente resultado es el ingrediente fundamental para establecer que los puntos de discontinuidad de cualquier función monótona es a lo más numerable.
Teorema 3.1.34. Si f : [ a, b] → R es monótona sobre [ a, b], entonces f ( x− ) y f ( x+ ) existen para
cualquier x ∈ ( a, b). En particular, todos los puntos de discontinuidad de f son de salto.
Prueba. Sin perder generalidad, asumiremos que f es creciente. Sea x ∈ ( a, b) y considere el
conjunto
A x = f ( t) : t < x .
Como f es creciente, A x está acotado superiormente por f ( x) y, por consiguiente, gracias al
Axioma del Supremo, sup A x existe y es menor o igual a f ( x). Defina entonces
λ x = sup A x = sup f (t) : t < x .
174
Cap. 3 Funciones Continuas
Dado cualquier ε > 0, se tiene que λ x − ε < λ x y se sigue de las propiedades del supremo que
existe un y0 ∈ A x = f (t) : t < x tal que λ x − ε < y0 ≤ λ x . Observe que como y0 ∈ A x , existe
un t′ < x tal que y0 = f (t′ ) y puesto que f es creciente resulta, tomando δ = x − t′ , que para
′
′
todo z ∈ [ a, b] con x − δ <
z < x, esto es, t < z < x se cumple que y0 = f (t ) ≤ f (z) ≤ f ( x).
Ahora bien, como f (z) ∈ f (t) : t < x se tiene que f (z) ≤ sup f (t) : t < x = λ x , de donde
se sigue que λ x − ε < y0 = f (t′ ) ≤ f (z) ≤ λ x < λ x + ε. De aquí se obtiene que
| f (z) − λ x | < ε siempre que x − δ < z < x,
lo cual prueba que lı́mt→ x − f (t) = λ x ≤ f ( x). Similarmente, se comprueba que
f ( x) ≥ lı́m f (t) = ı́nf f (t) : t > x ,
t→ x +
de donde se sigue que los límites f ( x− ) y f ( x+ ) existen y f ( x− ) ≤ f ( x) ≤ f ( x+ ).
Suponga ahora que x ∈ Disc( f ) ∩ ( a, b). Siendo x un punto de discontinuidad de f , resulta
que f ( x− ) ≤ f ( x) < f ( x+ ) o bien f ( x− ) < f ( x) ≤ f ( x+ ). En cualquier caso f ( x+ ) − f ( x− ) > 0
y termina la prueba.
Corolario 3.1.35. Si f : [ a, b] → R es monótona sobre [ a, b], entonces Disc( f ) es a lo más numerable.
Prueba. Suponga que f es creciente. Por el resultado anterior, todos los puntos de Disc( f ) son
de salto y, en consecuencia, como estamos asumiendo que f es creciente, resulta que
f ( x− ) = lı́m f (t) < lı́m f (t) = f ( x+ )
t→ x −
t→ x +
para todo x ∈ Disc( f ). Seleccione, por cada x ∈ Disc( f ), un número racional rx ∈ [ a, b] tal que
lı́mt→ x − f (t) < rx < lı́mt→ x + f (t). Es claro que si x, y son puntos distintos en Disc( f ), entonces
rx 6= ry . Esto prueba que la aplicación
φ : Disc( f ) → Q
definida por
φ( x) = rx
es inyectiva y, por lo tanto, como Q es numerable, resulta que el conjunto Disc( f ) es a lo más
numerable.
Por supuesto, si f : R → R es monótona sobre R, entonces como R =
es monótona sobre [−n, n], resulta que Disc( f ) es a lo más numerable.
S∞
n =1 [− n, n ]
y f |[−n,n]
Definición 3.1.36. Una función f : R → R se dice que es continua por la derecha sobre R si para
cada x ∈ R, se tiene que f ( x) = f ( x+ ).
Sec. 3.1 Propiedades Básicas
175
f creciente y continua por la derecha
El siguiente resultado muestra que, dada cualquier función creciente, siempre se puede construir una función continua por la derecha.
Corolario 3.1.37. Si f : R → R es una función creciente sobre R, entonces la función g+ : R → R
definida por
g+ ( x) = f ( x+ ) para todo x ∈ R
es creciente y continua por la derecha sobre R.
Prueba. Claramente g+ es creciente. Para ver que ella también es continua por la derecha, sea
x ∈ R. Entonces
g+ ( x+ ) = lı́m g+ (t) = lı́m f (t+ ) = f ( x+ ) = g+ ( x).
t→ x +
t→ x +
Fin de la prueba.
Denote por Mon([ a, b]) la familia de todas las funciones f : [ a, b] → R que son monótonas sobre
[a, b]. Observe que por el Teorema 3.1.34, toda función f ∈ Mon([a, b]) posee límites laterales
finitos en cada punto x ∈ [ a, b]. Esto permite considerar la siguiente clase de funciones:
Definición 3.1.38. Una función f : [ a, b] → R se dice regulada sobre [ a, b] si ella posee límites laterales
finitos en cada punto x ∈ [ a, b], donde convenimos en definir f ( a− ) = f ( a) y f (b+ ) = f (b).
Denote por Reg([ a, b]) a la familia de todas las funciones f : [ a, b] → R que son reguladas sobre [ a, b], y observe que, gracias al Teorema 3.1.34, Mon([ a, b]) ( Reg([ a, b]). Por otro lado,
Mon([ a, b]) 6= Reg([ a, b]) ya que existen funciones reguladas que no son monótonas. Por ejemplo, cualquier función en escalera pertenece a Reg([ a, b]) y, por supuesto, no todas ellas son
monótonas. Así mismo, resulta claro que C ([ a, b]) Reg([ a, b]).
3.1.4. Convergencia de Sucesiones de Funciones
Sea X un subconjunto no vacío de R. Para cada n ∈ N, sea f n : X → R una función. La
sucesión de funciones ( f n )∞
n =1 se dice que converge puntualmente a f en X, donde f : X → R
si la sucesión numérica ( f n ( x))∞
n =1 converge a f ( x ) para cada x ∈ X, en otras palabras, si para
176
Cap. 3 Funciones Continuas
cada x ∈ X y cada ε > 0, existe un N ∈ N, que por lo general depende tanto de x así como de
ε, tal que
f n ( x) − f ( x) < ε para todo n ≥ N.
Observe que esto es equivalente a afirmar lo siguiente: la sucesión ( f n )∞
n =1 converge puntualmente (a una cierta función) en X si, para cada x ∈ X y cada ε > 0, existe un N = N ( x, ε) ∈ N
tal que
f m ( x) − f n ( x) < ε para todo m, n ≥ N.
Escribiremos f n → f puntualmente cuando la sucesión ( f n )∞
n =1 converja a f puntualmente en X.
Ejemplo 3.1.3. Para cada m ∈ N, defina la función f m : R → R por
f m ( x) = lı́m cos m!πx
n→∞
Entonces f m → χQ puntualmente.
2n
,
x ∈ R.
Prueba. Sea x = p/q un número racional. Sin perder generalidad, podemos asumir que q ≥ 1
y p ∈ Z. Entonces m!x es un entero para cualquier número natural m ≥ q y, en consecuencia,
cos m!πx = ±1. Para tales m’s resulta que
f m ( x) = lı́m cos m!πx
n→∞
2n
= 1
y, por lo tanto, lı́mm→∞ f m ( x) = 1. Por otro lado, si x es irracional, también lo es m!x para
cualquier entero m y, en consecuencia, m!πx no es un múltiplo entero de π. De esto se sigue
que | cos m!πx| < 1 y, en consecuencia,
f m ( x) = lı́m cos m!πx
n→∞
2n
= 0.
Tomando límite cuando m tiende a infinito, resulta que lı́mm→∞ f m ( x) = 0 si x es irracional. En
conclusión,
lı́m f m ( x) = χQ ( x)
m→∞
para cada x ∈ R, es decir, f m → χQ puntualmente.
La convergencia puntual de una sucesión de funciones continuas no garantiza que su límite,
en caso de existir, sea una función continua. Por ejemplo, si f n ( x) = xn para todo x ∈ [0, 1]
resulta que la sucesión ( f n )∞
n =1 converge puntualmente a la función discontinua f , la cual vale
1 en x = 1 y 0 en los puntos restantes. Por consiguiente, se requiere algo más que convergencia
puntual para garantizar que la función límite herede la propiedad de continuidad. Esta y otras
circunstancias evidencian la necesidad de introducir una noción más fuerte que la convergencia
puntual de modo que garantice, por ejemplo, la continuidad de la función límite.
Definición 3.1.39. Una sucesión de funciones ( f n )∞
n =1 definidas sobre un conjunto X y a valores reales
se dice que converge uniformemente sobre X a una función f : X → R si, dado ε > 0, existe un
N = N (ε) ∈ N, que depende únicamente de ε, tal que si n ≥ N entonces se verifica que
f n ( x) − f ( x) < ε
para todo x ∈ X.
Sec. 3.1 Propiedades Básicas
177
Como antes, escribiremos f n → f uniformemente cuando la sucesión ( f n )∞
n =1 converja a f
uniformemente. Observe que ( f n )∞
converge
uniformemente
a
una
función
f sobre X si, y
n =1
sólo si,
lı́m sup | f n ( x) − f ( x)| : x ∈ X = lı́m k f n − f k∞ = 0.
n→∞
n→∞
Resulta claro que la convergencia uniforme implica la convergencia puntual pero no recíprocamente.
Algunos de los enormes beneficios que genera la convergencia uniforme de sucesiones de
funciones se muestran en los siguientes cuatro resultados.
Teorema 3.1.40. Sea ( f n )∞
n =1 una sucesión de funciones continuas definidas sobre un espacio métrico
( X, d). Si ( f n )∞
converge
uniformemente sobre X a una función f : X → R, entonces f es
n =1
continua sobre X.
Prueba. Sea ε > 0. Según la definición de convergencia uniforme, existe un N ∈ N tal que si
n ≥ N se verifica que
f n ( x) − f ( x) < ε/3 para todo x ∈ X.
Fijemos un n ≥ N y sea x ∈ X. Como f n es continua en x, existe un δ > 0 tal que
f n ( x) − f n (y) < ε/3
siempre que d( x, y) < δ. De esto resulta que si d( x, y) < δ, entonces
f ( x ) − f ( y) =
f ( x ) − f n ( x ) + f n ( x ) − f n ( y) + f n ( y) − f ( y)
= f ( x ) − f n ( x ) + f n ( x ) − f n ( y) + f n ( y) − f ( y)
< ε/3 + ε/3 + ε/3 = ε.
Esto prueba la continuidad de f en x y como x fue elegido arbitrariamente, concluimos que f
es continua sobre X.
Un resultado que puede resultar útil en otras situaciones que involucra convergencia uniforme
de funciones continuas es el siguiente.
Teorema 3.1.41. Sea ( f n )∞
n =1 una sucesión de funciones continuas definidas sobre un espacio métrico
( X, d) que converge uniformemente sobre X a una función f : X → R. Si ( xn )∞
n =1 es una sucesión
en X que converge a un punto x0 ∈ X, entonces
lı́m f n ( xn ) = f ( x0 ).
n→∞
Prueba. Sea ε > 0. Queremos demostrar la existencia de un N ∈ N tal que
| f n ( xn ) − f ( x0 )| < ε para todo n ≥ N.
Por el Teorema 3.1.40 sabemos que f es continua sobre X, de modo que podemos determinar la
existencia un δ > 0 para el cual
| f ( x) − f ( x0 )| <
ε
2
siempre que d( x, x0 ) < δ.
178
Cap. 3 Funciones Continuas
Por otro lado, como xn → x0 , existe, para el δ hallado anteriormente, un N1 ∈ N tal que
d ( x n , x0 ) < δ
para todo n ≥ N1 .
También, puesto que f n → f uniformemente, existe un N2 ∈ N tal que
| f n ( x) − f ( x)| < ε para todo n ≥ N2 y todo x ∈ X.
Si ahora escojemos N = máx{ N1 , N2 }, resulta que si n ≥ N, entonces
| f n ( xn ) − f ( x0 )| ≤ | f n ( xn ) − f ( xn )| + | f ( xn ) − f ( x0 )| <
ε
ε
+ = ε.
2 2
La prueba es completa.
Con las notaciones del resultado anterior, si escribimos xmn = f n ( xm ) para todo m, n ≥ 1,
entonces se tiene que
lı́m lı́m xmn = lı́m lı́m xmn = f ( x0 ).
n→∞ m→∞
m→∞ n→∞
Por supuesto, existen sucesiones dobles ( xmn )∞
m,n =1 tales que la igualdad anterior no se cumple.
Por ejemplo, si tomamos xm,n = m/(m + n), resulta que
lı́m lı́m xmn = 1
y
n→∞ m→∞
lı́m lı́m xmn = 0.
m→∞ n→∞
Tal vez uno de los criterios más importantes respecto a la convergencia uniforme de sucesiones
de funciones es el siguiente.
Teorema 3.1.42 (Criterio Uniforme de Cauchy). Una sucesión ( f n )∞
n =1 de funciones a valores reales
definidas sobre X. Las siguientes condiciones son equivalentes:
( 1) ( f n ) ∞
n =1 converge uniformemente sobre X.
(2) Dado ε > 0, existe un N ∈ N tal que si m, n ≥ N entonces
f m ( x) − f n ( x) < ε
para todo x ∈ X.
Prueba. Suponga que f n → f uniformemente sobre X y sea ε > 0. Por definición de convergencia uniforme, existe un N ∈ N tal que si n ≥ N, entonces
f m ( x) − f ( x) < ε/2
para todo x ∈ X. De aquí se sigue que si m, n ≥ N entonces se cumple que
f m ( x) − f n ( x) ≤
f m ( x) − f ( x) + f n ( x) − f ( x) < ε
para todo x ∈ X.
Recíprocamente, suponga que la condición (2) de Cauchy es válida. Puesto que R es completo, para cada x ∈ X, la sucesión ( f n ( x))∞
n =1 converge a un límite en R que llamaremos f ( x ).
Por lo tanto, ( f n )∞
converge
puntualmente
a f : X → R. Para ver que ella también converge
n =1
uniformemente, sea ε > 0 y suponga que existe un N ∈ N tal que si m, n ≥ N, la desigualdad
f m ( x) − f n ( x) < ε
Sec. 3.1 Propiedades Básicas
179
es válida para todo x ∈ X. Fijando n y haciendo que m → ∞ la desigualdad anterior se
convierte en
f ( x) − f n ( x) < ε
que resulta válida para todo x ∈ X y todo n ≥ N.
Sea ( f n )∞
n =1 una sucesión de funciones definidas sobre X y para cada n ∈ N, definamos
Sn = f 1 + · · · + f n .
∞
A
la sucesión Sn P
la llamaremos la serie asociada a ( f n )∞
n =1 y denotada en lo sucesivo por
n =∞1
P∞
f
.
La
serie
f
converge
puntualmente
a
una
función
f si, para cada x, la sucesión
n =1 n
n =1 n
∞
numérica (Sn ( x))n=1 converge
a f ( x). En este caso se dice que f es la suma de la serie ( f n )∞
n =1 .
P∞
Similarmente, la serie n=1 f n converge uniformemente sobre X a una función f si, la sucesión
( Sn ) ∞
f.
n =1 converge uniformemente sobre X aP
∞
Es importante advertir que la expresión
n =1 f n no indica que la serie converja, es sólo una
notación.
Se
mencionará
explícitamente
si
una
serie dada converge o no. Por ejemplo, la serie
P∞
n
−
1
converge puntualmente en (−1, 1) y su suma es f ( x) = 1/(1 − x).
n =1 x
El siguiente test para la convergencia uniforme de una serie dada debido a K. Weierstrass, es
muy conveniente.
Teorema 3.1.43 (M-Test de Weierstrass). Sea ( f n )∞
n =1 una sucesión de funciones a valores reales definidas sobre un conjunto X. Suponga que, para cada n ∈ N, existe una constante no negativa Mn tal
que
f n ( x) ≤ Mn para todo x ∈ X.
P∞
P∞
Si
n =1 Mn < ∞, entonces la serie
n =1 f n converge uniformemente sobre X.
P∞
Prueba. Sea
ε
>
0.
Como
la
serie
n =1 Mn converge, existe un N ∈ N tal que si m > n > N,
Pm
entonces
j= n +1 M j < ε. Por lo tanto, para todo x ∈ X se cumple que
|Sm ( x) − Sn ( x)| ≤
m
X
j= n +1
| f j ( x)| ≤
m
X
Mj < ε
j= n +1
siempre que m > n > N. Del Criterio Uniforme de Cauchy se sigue que la serie
converge uniformemente sobre X.
P∞
n =1 f n
3.1.5. Una Función Continua Nunca Diferenciable
El objetivo de esta corta sección es presentar un ejemplo sencillo de una función continua nunca diferenciable, es decir, que no posee derivada finita en ningún punto de su dominio. La primera
demostración de la existencia de una función continua nunca diferenciable parece provenir del
matemático checo Bernard Placidus Tohann Nepomuk Bolzano (1781-1848). Su trabajo matemático pasó casi desapercibido y nunca recibió el reconocimiento que merecía salvo mucho tiempo
después de su muerte. Bolzano era contemporáneo de Weierstrass. Además de dar definiciones
similares de límite, derivada, continuidad y convergencia, también hizo valiosas contribuciones a
la lógica y la teoría de conjuntos (véase, por ejemplo, [15]). Bolzano inventó, alrededor del año
1830, un procedimiento para la construcción de funciones continuas nunca diferenciables que es
180
Cap. 3 Funciones Continuas
muy distinta a otras construcciones de funciones con propiedades similares. El proceso de creación de Bolzano es completamente geométrico mientras que las otras construcciones usan series
convergentes. Es importante destacar que ese resultado de Bolzano fue dado a conocer en el año
1930, ¡casi 100 años después de haber sido descubierto! En el Volumen 2 de su Mathematische
Werke, publicado en 1895, aparece por primera vez publicado el artículo de K. Weierstrass donde
él demuestra que la función
∞
X
W ( x) =
an cos(bn πx)
n =0
es continua pero nunca diferenciable, siempre que 0 < a < 1, ab > 1 + (3π/2) y b es un entero
impar > 1. Cincuenta y cinco años más tarde, en 1916, G. H. Hardy prueba que la función de
Weierstrass W sigue siendo continua y nunca diferenciable si además de la condición 0 < a < 1
se exige que ab ≥ 1, con b > 1, pero sin pedirle que sea un entero impar.
La función que presentamos en esta sección es la de Takagi, dada a conocer a la comunidad
matemática por Teiji Takagi (1875-1960) en el año 1903 [126] y una de las más simples. A tal
función también se le conoce como el manjar blanco, un tipo de pastel francés que tiene una
apariencia hinchada que se asemeja de una manera casi caprichosa a la gráfica de la función de
Takagi. La tesis de Johan Thim [130] contiene en detalle la construcción de ésta, además, de otras
17 funciones nunca diferenciables.
El siguiente resultado es una de las piezas claves para demostrar que la función de Takagi es
nunca diferenciable.
Lema 3.1.44. Sea f : [ a, b] → R una función continua sobre [ a, b] y suponga que f ′ ( x) existe para
∞
algún x ∈ ( a, b). Si ( an )∞
n =1 y ( bn ) n =1 son sucesiones en [ a, b] con a < xn < x < bn < b y tal que
lı́m an = x = lı́m bn , entonces
n→∞
n→∞
lı́m
n→∞
f ( bn ) − f ( a n )
= f ′ ( x ).
bn − a n
Prueba. Puesto que
bn − x
bn − a n
≤
bn − a n
= 1
bn − a n
y
x − an
bn − a n
≤
bn − a n
= 1,
bn − a n
resulta que
f ( bn ) − f ( a n )
− f ′ ( x) =
bn − a n
≤
bn − x
bn − a n
f ( bn ) − f ( x )
x − an f ( an ) − f ( x )
′
′
− f ( x) +
− f ( x)
bn − x
bn − a n
an − x
f ( bn ) − f ( x )
− f ′ ( x) +
bn − x
f ( an ) − f ( x )
− f ′ ( x)
an − x
→ 0 cuando n → ∞.
Esto finaliza la prueba.
Sec. 3.1 Propiedades Básicas
181
La Función de Takagi
Existen varias formas de introducir la función de Takagi. Una de ellas es la siguiente: considere, en primer lugar, la función φ0 : R → R definida por
(
x
si x ∈ [0, 1/2]
φ0 ( x) =
1−x
si x ∈ (1/2, 1]
y entonces extienda dicha función, periódicamente, a todo R, esto es, defina
φ( x + m) = φ0 ( x)
para todo x ∈ [0, 1] y todo m ∈ Z.
φ
− 12
−3
−2
−1
1
3
2
Claramente φ es continua, no-negativa y φ( x) ≤ 1/2 para todo x ∈ R. Además,
φ ( x ) = φ (1 − x )
para cualquier x ∈ [0, 1] .
Nótese que φ(m) = 0 para todo m ∈ Z. En particular, si x es un racional diádico de orden n,
es decir, si x = m/2n para algún m ∈ Z, entonces
( a1∗ ) φ(2k x) = 0 siempre que k ≥ n ya que, en este caso, 2k x ∈ Z.
( a2∗ ) Más aun, si u = (m − 1)/2n y v = m/2n son números diádicos consecutivos de orden
n tal que los también números diádicos 2k v, 2k u pertenecen al intervalo [0, 1] para 0 ≤ k < n,
entonces de la linealidad de φ se sigue que

1


si 2k v, 2k u ∈ [0, 1/2]
 2k n
2
φ ( 2k v − 2k u ) = 2k φ ( v − u ) =


− 2 k 1
si 2k v, 2k u ∈ (1/2, 1] .
2n
Una vez obtenida la función φ, se define la función de Takagi como la serie
T ( x) =
∞
X
1
k=0
2k
φ ( 2k x ) ,
x ∈ R.
Las gráficas de φ0 , φ0 + φ1 , φ0 + φ1 + φ2 , etc. son mostradas en el intervalo [0, 1], donde
φk ( x) = 2−k φ(2k x) para k = 0, 1, 2, . . .
1
2−
1
−
22
φ0 + φ1 + φ2
φ0 + φ1
1
2−
φ0
1
−
23
φ1
1
2
1
φ0 + φ1
φ2
1
22
1
2
3
22
1
182
Cap. 3 Funciones Continuas
φ0 + φ1 + φ2 + φ3
1
2−
1
−
23
φ0 + φ1 + φ2
......
φ3
1
1
2
Teorema 3.1.45 (Función de Takagi). La función de Takagi es continua pero nunca diferenciable sobre R.
Prueba. Veamos, en primer lugar, que T es continua sobre R. En efecto, para cada k ∈ N0 ,
considere la función continua φk ( x) = 2−k φ(2k x) para todo x ∈ R. Puesto que |φk ( x)| ≤ 1/2k
para todo x ∈ R, el M-test de Weierstrass combinado con el Teorema 3.1.40 nos muestran que T
es continua.
Para ver que φ no posee derivada finita en ningún punto de R, vamos asumir lo contrario
y construir, con la ayuda del Lema 3.1.44, una contradicción. Suponga que x ∈ R es un punto
arbitrario tal que T ′ ( x) es finito. Sin perder generalidad y, sólo por simplificar los cálculos,
m
n
supondremos
S∞ que x ∈ (0, 1). Para cada entero n ≥ 1, sea Dn = { 2n : m = 0, 1, . . . , 2 }. Puesto
que D = n=1 Dn es denso en [0, 1], podemos elegir números diádicos sucesivos de orden n,
digamos, un = m2−n 1 y vn = 2mn tales que un < x < vn y lı́mn→∞ un = x = lı́mn→∞ vn .
Observe que por ( a1∗ ), si k ≥ n, entonces φ(2k un ) = φ(2k vn ) = 0 y, en consecuencia,
T (un ) =
n −1
X
1
k=0
De esto resulta que
k
2k
φ (2 u n )
y
T ( vn ) =
n −1
X
1
k=0
2k
φ ( 2k v n ) .
n −1
X
1 φ ( 2k v n ) − φ ( 2k u n )
T ( vn ) − T ( u n )
=
.
vn − u n
vn − u n
2k
k=0
Puesto que vn − un =
1
2n ,
se sigue de
( a2∗ )
que
n −1
X
T ( vn ) − T ( u n )
1 φ ( 2k v n ) − φ ( 2k u n )
=
vn − u n
vn − u n
2k
k=0
=
n −1
X
1 φ(2k (vn − un ))
k=0
=
n −1
X
k=0
2k
vn − u n
±1.
cuyo límite, cuando n → ∞, no converge, lo cual constituye una contradicción ya que el Lema 3.1.44 nos garantiza que
T ′ ( x) = lı́m
n→∞
T ( vn ) − T ( u n )
vn − u n
existe.
Sec. 3.1 Propiedades Básicas
183
Esta contradicción establece que T no posee derivada finita en ningún punto de R y termina la
prueba.
Nota Adicional 3.1.1 El descubrimiento de funciones continuas nunca diferenciables conmocionó
a la comunidad matemática de la época que incluso, matemático de la talla de Charles
Hermite (1822-1901), en una carta dirigida a Stieltjes fechada el 20 de Mayo de 1893, le
decía:
“Je me détourne avec horreur et effroi de cette plaie lamentable des functions continue qui n’ont pas
de dérivé”.
(“Me alejo con horror y temor de esta plaga lamentable de las funciones continuas que no
poseen derivadas”).
Aunque en la actualidad existen variados ejemplos concretos de funciones continuas nunca
diferenciables, (véase, por ejemplo, Johan Thim [130]), encontrar una de ellas es casi una
proeza y, por supuesto, una curiosidad. Más aun, uno pudiera pensar, lo que es enteramente
natural, que este tipo de funciones son excepcionales, que es algo patológico y, de hecho,
hasta hace un poco más de cien años esa era la opinión expresada por la mayoría de los
matemáticos de la época; pero resulta, y este es lo que fundamentalmente debemos resaltar,
que la existencia de tales funciones constituye, desde el punto de vista topológico, la regla y
no la excepción. Existe un resultado, llamado el Teorema de Categoría de Baire (véase [23]
para conocer una impresionante variedad de aplicaciones de dicho teorema), que permite
demostrar la abundancia de tales funciones sin exhibir ningún ejemplo en particular.
3.1.6. Funciones Semicontinuas
Recordemos que una función f : [ a, b] → R es continua en x0 ∈ [ a, b] si, para cada ε > 0,
existe un entorno V de x0 tal que
f ( x0 ) − ε < f ( x ) < f ( x0 ) + ε
para todo
x ∈ V ∩ [ a, b].
Considerando por separado cada una de las desigualdades anteriores conduce a la siguiente
definición.
Definición 3.1.46. Sea f : [ a, b] → R una función. Se dice que f es semicontinua superiormente en
x0 ∈ [ a, b] si, para cada ε > 0, existe un entorno V de x0 tal que
f ( x ) < f ( x0 ) + ε
para todo
x ∈ V ∩ [ a, b] .
Similarmente, f es semicontinua inferiormente en x0 ∈ [ a, b] si, para cada ε > 0, existe un entorno
V de x0 tal que
f ( x0 ) − ε < f ( x) para todo x ∈ V ∩ [ a, b] .
La función f se dice que es semicontinua superiormente (respectivamente, semicontinua
inferiormente) sobre (o en) [ a, b], si ella es semicontinua superiormente (respectivamente, semicontinua inferiormente) en todos los puntos de [ a, b].
Denotemos por Sci([ a, b]) el conjunto de todas las funciones f : [ a, b] → R que son semicontinuas
inferiormente sobre [ a, b]. Similarmente, Scs([ a, b]) representará el conjunto de todas las funciones
184
Cap. 3 Funciones Continuas
f : [ a, b] → R que son semicontinuas superiormente sobre [ a, b]. Observe que la elección del
intervalo [ a, b] en la definición de semicontinuidad es intranscendente, por lo que puede ser
reemplazado por cualquier intervalo. En particular, cuando el intervalo es R escribiremos Scs(R )
y Sci(R ).
Definición 3.1.47. Una función f : [ a, b] → R se dice que es semicontinua, en notación f ∈ Sc([ a, b]),
si ella es semicontinua superiormente o semicontinua inferiormente.
Observe que
Sc([ a, b]) = Sci([ a, b]) ∪ Scs([ a, b])
y
Es fácil establecer que si f , g ∈ Sci([ a, b]), entonces
C ([ a, b]) = Sci([ a, b]) ∩ Scs([ a, b]).
( a) f + g ∈ Sci([a, b]).
(b) α f ∈ Sci([a, b]) para cualquier escalar α ≥ 0.
(c) mı́n{ f , g} ∈ Sci([a, b]).
Similares consideraciones valen para las funciones en Scs([ a, b]). Más aun,
f ∈ Sci([ a, b])
⇔
− f ∈ Scs([a, b]).
Esto último nos permite considerar, en todo lo que sigue, sólo las propiedades de la funciones
que son semicontinuas inferiormente. También es claro que si f es semicontinua inferiormente
sobre [ a, b], entonces ella es semicontinua inferiormente en cualquier subconjunto de [ a, b].
Ejemplo 3.1.4. Las funciones f , g : [−1, 1] → R definidas por


−1
−1
si −1 ≤ x ≤ 0
f ( x) =
y
g( x ) =
 1
 1
si 0 < x ≤ 1
si −1 ≤ x < 0
si
0≤x≤1
son, respectivamente, semicontinuas inferiormente y superiormente en x0 = 0.
Teorema 3.1.48. Sea f : [ a, b] → R una función. Son equivalentes:
(1) f es semicontinua inferiormente sobre [a, b].
(2) Gξ = x ∈ [a, b] : f ( x) > ξ es abierto en [a, b] para cada ξ ∈ R.
Prueba. (1) ⇒ (2). Suponga que f es semicontinua inferiormente en [ a, b]. Fijemos ξ ∈ R y
sea x0 ∈ Gξ . Puesto que f ( x0 ) > ξ, el número ε = f ( x0 ) − ξ > 0. Usemos ahora el hecho de
que f es semicontinua inferiormente en x0 para hallar un entorno V de x0 tal que
f ( x0 ) − ε = ξ < f ( x )
para todo
x ∈ V ∩ [ a, b].
De esto se sigue que el conjunto abierto V ⊆ Gξ y, por lo tanto, Gξ es abierto.
(2) ⇒ (1). Aceptemos que (2) se cumple y sean ε > 0 y x0 ∈ [a, b]. Puesto que Gξ =
f −1 ((ξ, +∞)) es abierto en [ a, b] para cualquier ξ ∈ R, resulta, en particular, que el conjunto
f −1 (( f ( x0 ) − ε, +∞)) es abierto y, por supuesto, contiene a x0 . Seleccione un δ > 0 tal que
( x0 − δ, x0 + δ) ⊆ f −1 (( f ( x0 ) − ε, +∞)). Finalmente, si tomamos V = [a, b] ∩ ( x0 − δ, x0 + δ)
entonces V es un entorno de x0 en [ a, b] y se cumple que
Esto termina la prueba.
f ( x0 ) − ε < f ( x )
para todo
x ∈ V.
Sec. 3.1 Propiedades Básicas
185
Corolario 3.1.49. Sea G ⊆ [ a, b]. Entonces χ G ∈ Sci([ a, b]) si, y sólo si, G es abierto.
Prueba. Sea ξ ∈ R. Si G es abierto, entonces todas las


∅



χ−1 (ξ, +∞) = G
G




[a, b]
imágenes inversas
si ξ ≥ 1
si 0 ≤ ξ < 1
si ξ < 0.
son abiertas y, por consiguiente, χ G ∈ Sci([ a, b]).
Aprovechando la caracterización dada en el Teorema 3.1.48 podemos definir la semicontinuidad de funciones f : X → R, donde X es un espacio topológico de Hausdorff del modo
siguiente: f ∈ Sci( X ) si f −1 ((ξ, +∞]) es abierto en X para cualquier ξ ∈ R. Análogamente,
f ∈ Scs( X ) si f −1 ([−∞, ξ )) es abierto en X para cualquier ξ ∈ R.
En la prueba de la implicación (1) ⇒ (2) del Teorema 3.1.48 obtuvimos el siguiente resultado,
el cual también es usado como la definición de semicontinuidad inferior en un punto.
Corolario 3.1.50. Si f : [ a, b] → R es una función semicontinua inferiormente en un punto x0 ∈
[a, b], entonces para cada ξ < f ( x0 ) existe un entorno V de x0 tal que
f ( x) > ξ
x ∈ V ∩ [ a, b].
para todo
Definición 3.1.51. Sea f : [ a, b] → R una función arbitraria. Se define el límite inferior de f en
x0 ∈ [ a, b] como
f ( x)
lı́m inf f ( x) = sup
ı́nf
x → x0
δ > 0 x ∈ V ( x0 ,δ)
donde V ( x0 , δ) = ( x0 − δ, x0 + δ) ∩ [ a, b].
Otro modo natural de caracterizar a las funciones semicontinuas inferiormente es por medio
de su límite inferior.
Teorema 3.1.52. Sea f : [ a, b] → R una función y sea x0 ∈ [ a, b]. Son equivalentes:
(1) f es semicontinua inferiormente en x0 .
(2) f ( x0 ) ≤ lı́m inf f ( x).
x → x0
Prueba. Suponga que f es semicontinua inferiormente en el punto x0 . Entonces, dado ε > 0,
existe un entorno V de x0 tal que
f ( x0 ) − ε < f ( x )
para todo
x ∈ V ∩ [ a, b].
Claramente podemos suponer que V = V ( x0 , δ) para algún δ > 0. De lo anterior se sigue que
f ( x0 ) <
ı́nf
x ∈ V ( x0 ,δ)
f ( x) + ε
y como nuestro ε es arbitrario, se concluye que
f ( x0 ) ≤ sup
ı́nf
δ>0 x ∈ V ( x0 ,δ)
f ( x ).
186
Cap. 3 Funciones Continuas
Recíprocamente, suponga que f ( x0 ) ≤ lı́m infx → x0 f ( x) pero que f no es semicontinua inferiormente en x0 . Esto significa que existe un ξ < f ( x0 ) tal que, para cualquier δ > 0, existe un
zδ ∈ V ( x0 , δ) para el cual f (zδ ) < ξ. Por lo tanto, para cada δ > 0,
ı́nf
x ∈V ( x0 ,δ)
f ( x ) ≤ f ( zδ ) < ξ
y, en consecuencia,
ξ < f ( x0 ) ≤ lı́m inf f ( x) = sup
x → x0
ı́nf
δ→0 x ∈ V ( x0 ,δ)
f ( x) < ξ,
lo cual es absurdo. Esto termina la prueba.
Observe que si f es semicontinua inferiormente en x0 y ( xn )∞
n =1 es cualquier sucesión en
[a, b] convergiendo a x0 , entonces
f ( x0 ) ≤ lı́m inf f ( xn ).
n→∞
De modo similar, el límite superior de f en x0 ∈ [ a, b] viene expresado en la forma
lı́m sup f ( x) = ı́nf
x → x0
sup
f ( x)
δ > 0 x ∈ V ( x0 ,δ)
y procediendo casi de manera idéntica a la demostración del resultado anterior se obtiene que:
Teorema 3.1.53. Sea f : [ a, b] → R una función y sea x0 ∈ [ a, b]. Son equivalentes:
(1) f es semicontinua superiormente en x0 .
(2) lı́m sup f ( x) ≤ f ( x0 ).
x → x0
Ejemplo 3.1.5. Si f : [ a, b] → R tiene un mínimo relativo en x0 ∈ [ a, b], esto es, existe un entorno
V de x0 tal que f ( x0 ) ≤ f ( x) para todo x ∈ V, entonces f es semicontinua inferiormente en x0 .
Ejemplo 3.1.6. Sea f : [0, 1] → R la función de Thomae, Ejemplo 3.1.1. Sabemos que f es discontinua
en cada racional de [0, 1], pero continua en cualquier irracional de [0, 1]. Por otro lado, puesto que
f tiene un máximo relativo en cada racional x ∈ [0, 1], se sigue entonces del ejemplo anterior que f
semicontinua superiormente en [0, 1].
Otras de las propiedades similares que comparten las funciones semicontinuas con las funciones continuas es la siguiente.
Teorema 3.1.54. Si f : [ a, b] → R es una función semicontinua inferiormente (respectivamente,
semicontinua superiormente) sobre [ a, b], entonces f alcanza su mínimo (respectivamente, alcanza
su máximo) en algún punto de [ a, b].
Sec. 3.1 Propiedades Básicas
187
Prueba. Suponga que f es semicontinua inferiormente sobre [ a, b] y sea
m = ı́nf f ( x) : x ∈ [ a, b] .
Vamos a demostrar que existe un x0 ∈ [ a, b] tal que m = f ( x0 ). Para ello, usemos las propiedades del ínfimo y escojamos una sucesión ( xn )∞
n =1 en [ a, b] tal que lı́mn →∞ f ( xn ) = m. Por
ser [ a, b] compacto, se sigue del Teorema 2.1.25 que existe una subsucesión ( xnk )∞
k=1 de la sucesión ( xn )∞
que
converge
a
algún
punto
x
∈
[
a,
b
]
.
Ahora
bien,
como
f
es
semicontinua
0
n =1
inferiormente en x0 , resulta del Teorema 3.1.52 que
f ( x0 ) ≤ lı́m inf f ( xnk ) = lı́m f ( xn ) = m.
n→∞
k→∞
Esto prueba que m = f ( x0 ) ya que m ≤ f ( x0 ).
En particular, cada función semicontinua inferiormente f : [ a, b] → R está acotada por debajo
en [ a, b], esto es, existe una constante m > 0 tal que
m ≤ f ( x)
para todo
x ∈ [ a, b].
Similarmente, si f : [ a, b] → R es semicontinua superiormente, entonces f está acotada por
arriba en [ a, b], lo cual significa que existe una constante M > 0 tal que
f ( x) ≤ M
para todo
x ∈ [ a, b].
3.1.7. Convergencia Puntual en Sc([ a, b])
El objetivo de esta sección es caracterizar las funciones en Sc([ a, b]) a través de la convergencia
puntual de sucesiones monótonas de funciones continuas. Una de las propiedades que mejor
identifica a las funciones semicontinuas son los siguientes dos resultados.
Teorema 3.1.55. Si f : [ a, b] → R es una función semicontinua inferiormente sobre [ a, b], entonces
existe una sucesión creciente ( f n )∞
n =1 en C ([ a, b]) tal que
f ( x) = lı́m f n ( x)
n→∞
para cada x ∈ [ a, b] .
Prueba. Para cada n ∈ N, defina la función f n : [ a, b] → R por
f n ( x) = ı́nf f (t) + n|t − x| : t ∈ [ a, b] ,
x ∈ [ a, b].
Puesto que f es acotada por debajo, la función f n es finita. Claramente
f1 ≤ f2 ≤ · · · ≤ f n ≤ · · · ≤ f .
( 1)
Afirmamos que cada f n es continua sobre [ a, b]. Para ver esto, observe que si x, y ∈ [ a, b],
entonces
f n ( x) = ı́nf f (t) + n|t − x| : t ∈ [ a, b]
≤ ı́nf f (t) + n|t − y| + n|y − x| : t ∈ [a, b]
= f n ( y) + n | x − y|
188
Cap. 3 Funciones Continuas
De esto último se sigue que
| f n ( x) − f n (y)| ≤ n| x − y|,
( 2)
lo cual muestra que f n es Lipschitz. En particular, f n es uniformemente continua sobre [ a, b]. .
Veamos ahora que f ( x) = lı́mn→∞ f n ( x) para cada x ∈ [ a, b]. En efecto, fijemos x ∈ [ a, b] y
observe que, gracias a (1), lı́mn→∞ f n ( x) ≤ f ( x). Para demostrar la otra desigualdad, tomemos
cualquier número ξ y suponga que f ( x) > ξ. Puesto que f es semicontinua inferiormente en
x, el Corolario 3.1.50 nos garantiza la existencia de un δ > 0 tal que
para todo t ∈ V ( x, δ) = ( x − δ, x + δ) ∩ [ a, b].
f ( t) > ξ
De esto se sigue que
ı́nf f (t) + n|t − x| : t ∈ V ( x, δ)
≥ ξ.
Por otro lado, para cualquier t ∈ [ a, b] \ V ( x, δ) se cumple que n|t − x| ≥ nδ y, en consecuencia,
ı́nf f (t) + n|t − x| : t ∈ [ a, b] \ V ( x, δ)
= ı́nf f (t) : t ∈ [a, b] \ V ( x, δ) + ı́nf n|t − x| : t ∈ [a, b] \ V ( x, δ)
≥ ı́nf f (t) : t ∈ [a, b] + nδ
= m + nδ.
donde m = ı́nf{ f ( x) : x ∈ [ a, b]}. Si ahora elegimos un n0 ∈ N adecuadamente de modo
m + n0 δ > ξ, resultará f n ( x) ≥ ξ para todo n ≥ n0 y, por consiguiente, lı́mn→∞ f n ( x) ≥ ξ.
Hemos demostrado que
lı́m f n ( x) ≥ ξ
n→∞
cada vez que f ( x) > ξ.
Se sigue del Teorema 2.1.30, página 97, que lı́mn→∞ f n ( x) ≥ f ( x). Esto completa la prueba.
Teorema 3.1.56. Si f : [ a, b] → R es una función semicontinua superiormente, sobre [ a, b], entonces
existe una sucesión decreciente ( f n )∞
n =1 en C ([ a, b]) tal que
f ( x) = lı́m f n ( x)
n→∞
para cada x ∈ [ a, b] .
Prueba. Es inmediata del resultado anterior.
Los dos teoremas anteriores, Teoremas 3.1.55 y 3.1.56, nos indican que:
Corolario 3.1.57. Si f : [ a, b] → R es semicontinua superiormente (resp. semicontinua inferiormente), entonces f ∈ B1 ([ a, b]). En particular, PC( f ) es un Gδ -denso en [ a, b] para cualquier
f ∈ Sc([ a, b]).
Lo anterior se puede resumir en la forma:
C ([ a, b]) ⊆ Sc([ a, b]) ⊆ B1 ([ a, b]).
En el siguiente ejemplo se muestra que ninguna de las clases Sci([ a, b]) y Scs([ a, b]) son
cerradas bajo la convergencia puntual, es decir, si ( f n )∞
n =1 ∈ Sci([ a, b]) converge puntualmente a
una función f : [ a, b] → R, entonces no necesariamente f ∈ Sci([ a, b]). Veamos un ejemplo.
Sec. 3.1 Propiedades Básicas
189
Ejemplo 3.1.7. Existe una sucesión ( f n )∞
n =1 ∈ Sci([0, 1]) que converge puntualmente a una función
f 6∈ Sci([0, 1]).
Prueba. Sea R = {qn ∈ [0, 1] ∩ Q } una enumeración de los racionales en [0, 1]. Para cada
n ∈ N, defina f n : [0, 1] → R por f n ( x) = χ[0,1]\{q ,...,q } ( x). Puesto que cada f n alcanza un
1
n
mínimo relativo en cada racional incluido en {q1 , . . . , qn }, resulta que tal función es semicontinua
inferiormente sobre [0, 1], pero lı́mn→∞ f n = χ[0,1]\ R no es semicontinua inferiormente sobre
[0, 1].
A pesar del ejemplo anterior, existen condiciones que garantizan que el límite puntual de una
sucesión de funciones semicontinuas (inferiormente o superiormente) preserve dicha propiedad.
Teorema 3.1.58. Sea ( f n )∞
n =1 una sucesión creciente en Sci([ a, b]) y suponga que ella converge puntualmente a una función f : [ a, b] → R. Entonces f ∈ Sci([ a, b]).
Prueba. Fijemos un número real ξ. Puesto que f n → f puntualmente, resulta que
x ∈ [ a, b] : f ( x) > ξ
∞
[
=
n =1
x ∈ [ a, b] : f n ( x) > ξ .
Como cada conjunto x ∈ [ a, b] : f n ( x) > ξ es abierto, entonces x ∈ [ a, b] : f ( x) > ξ
es abierto y, por lo tanto, f ∈ Sci([ a, b]) gracias al Teorema 3.1.48.
también
Combinando los Teoremas 3.1.55, 3.1.56 y 3.1.58, se obtiene la siguiente caracterización de
las funciones semicontinuas.
Corolario 3.1.59. Sea f : [ a, b] → R una función.
( a) f ∈ Sci([a, b]) si, y sólo si, existe una sucesión creciente ( f n )∞
n =1 en C ([ a, b]) que converge
puntualmente a f .
(b) f ∈ Scs([a, b]) si, y sólo si, existe una sucesión decreciente ( f n )∞
n =1 en C ([ a, b]) que converge
puntualmente a f .
3.1.8. Funciones Acotadas en Sc([ a, b])
Sea f : [ a, b] → R una función acotada sobre [ a, b] y considere los conjuntos
Finf ( f ) =
g ∈ Sci([ a, b]) : g ≤ f
y
Gsup ( f ) =
Observe que para cada x ∈ [ a, b], el conjunto
Fx =
h ∈ Scs([ a, b]) : h ≥ f .
g( x) : g ∈ Finf ( f )
es acotado, por lo que la función f sup : [ a, b] → R dada por
f sup ( x) = sup g( x) : g ∈ Finf ( f )
para cada x ∈ [ a, b] ,
190
Cap. 3 Funciones Continuas
está bien definida y, además, es semicontinua inferiormente sobre [ a, b]. Para ver esto, sea ξ ∈ R
y nótese que
[
x ∈ [ a, b] : f sup ( x) > ξ =
{ x ∈ [a, b] : g( x) > ξ },
g∈Finf ( f )
es un conjunto abierto ya que cada g es semicontinua inferiormente sobre [ a, b]. Similarmente,
para cada x ∈ [ a, b], el conjunto Gx = h( x) : g ∈ Gsup ( f ) es acotado y, por lo tanto, la función
finf ( x) = ı́nf h( x) : h ∈ Gsup ( f )
para cada x ∈ [ a, b] ,
está bien definida y es semicontinua superiormente sobre [ a, b] pues
x ∈ [ a, b] : finf ( x) ≥ ξ
\
=
h∈Gsup ( f )
{ x ∈ [a, b] : h( x) ≥ ξ },
es cerrado para cualquier ξ ∈ R. Estas consideraciones prueban que:
Teorema 3.1.60. Sea f : [ a, b] → R una función acotada sobre [ a, b] y considere las familias
Finf ( f ) =
Entonces
Además, se cumple que
g ∈ Sci([ a, b]) : g ≤ f
f sup ∈ Sci([ a, b])
y Gsup ( f ) =
y
h ∈ Scs([ a, b]) : h ≥ f .
finf ∈ Scs([ a, b])
f sup ≤ f ≤ finf .
(1a).
(1b)
La información recopilada en el resultado anterior permite obtener la siguiente caracterización
de las funciones acotadas semicontinuas.
Teorema 3.1.61. Sea f : [ a, b] → R una función acotada sobre [ a, b]. Son equivalentes:
(1) f ∈ Sci([a, b]) (respectivamente, f ∈ Scs([a, b])).
(2) f = f sup , (respectivamente, f = f inf ).
Prueba. (2) ⇒ (1) es inmediata ya que f sup es semicontinua inferiormente. Suponga entonces
que (1) se cumple. Por (1b) del Teorema 3.1.60 sabemos que f sup ≤ f , de modo que sólo basta
demostrar la otra desigualdad. Suponga, para generar una contradicción, que existe algún x0 ∈
[a, b] tal que f sup ( x0 ) < f ( x0 ). Como f es semicontinua inferiormente, el Teorema 3.1.55 nos
garantiza la existencia de una sucesión creciente ( f n )∞
n =1 de funciones continuas tal que f n ≤ f
para todo n ≥ 1 y lı́mn→∞ f n ( x) = f ( x) para cada x ∈ [ a, b]. En particular, lı́mn→∞ f n ( x0 ) =
f ( x0 ). Tome cualquier 0 < ε < f ( x0 ) − f sup ( x0 ) y elija un N ∈ N lo suficientemente grande de
modo tal que 0 ≤ f ( x0 ) − f N ( x0 ) < ε. Puesto que f N ∈ Sci([ a, b]) y f N ≤ f tenemos que
f ( x0 ) < f N ( x0 ) + ε ≤ f sup ( x0 ) + ε < f ( x0 ).
Esta contradicción establece que f ( x) = f sup ( x) para todo x ∈ [ a, b] y termina la prueba.
Sec. 3.2 Problemas
191
3.2. Problemas
(1) Construya un subconjunto en I = R \ Q que sea perfecto y nunca-denso.
(2) Sea f : R → R la función definida por
f ( x) =

x
si x es irracional
 p · sen(1/q)
si x = p/q es un racional en forma irreducible.
Pruebe que f es continua en los irracionales y en x = 0, pero es discontinua en cada número
racional distinto de cero.
(3) Considere la función de Dirichlet D : R → R dada por
D ( x) = lı́m lı́m
n→∞ m→∞
cos(2πn!x)
m
.
Pruebe que D 6∈ B1 (R ), es decir, no existe ninguna sucesión de funciones continuas, digamos
( f n )∞
n =1 , tal que D ( x ) = lı́mn →∞ f n ( x ).
(4) Una función continua p : [a, b] → R se dice que es lineal a trozos si existe una partición
P = {a = x0 < x1 < · · · < xn = b} del intervalo [ a, b] tal que p es lineal en cada intervalo
[ xk−1 , xk ] k = 1, . . . , n. Pruebe que para cada función continua f : [a, b] → R y cada ε > 0,
existe una función continua lineal a trozos p tal que | f ( x) − p( x)| < ε para todo x ∈ [ a, b].
(5) Teorema de Aproximación de Weierstrass. Suponga que f ∈ C ([a, b]). Pruebe que existe una
sucesión ( pn )∞
n =1 de polinomios tal que
lı́m pn = f
n→∞
uniformemente sobre [ a, b] .
(6) Sea F una familia de funciones definidas sobre un conjunto compacto K y a valores reales.
(i) F se dice equi-continua si, dado ε > 0, existe un δ > 0 tal que para cualquier f ∈ F se
cumple que
| f ( x) − f (y)| < ε
para todo x, y ∈ K con | x − y| < δ.
(ii) F se dice puntualmente acotada si, para cada x ∈ K, existe una constante Mx > 0 tal
que | f ( x)| ≤ Mx para toda f ∈ F.
(iii) F se dice que es uniformemente acotada sobre K si existe una constante M > 0 tal
que | f ( x)| ≤ M para toda f ∈ F y todo x ∈ K.
( a) Suponga que ( f n )∞
n =1 es una sucesión en C ( K ) convergiendo uniformemente a una
función f . Pruebe que ( f n )∞
n =1 es equicontinua.
(b) Suponga que ( f n )∞
n =1 es una sucesión equi-continua en C ( K ) puntualmente acotada.
∞
Pruebe que ( f n )n=1 es uniformemente acotada y, que además, posee una subsucesión que
converge uniformemente a una función f ∈ C (K ).
192
Cap. 3 Funciones Continuas
(7) Sea ( an )∞
n =1 una sucesión de números reales con xn 6 = 0 para todo n ≥ 1 y defina
p n = a1 a2 . . . a n =
n
Y
ak
k=1
Q∞
n ≥ 1.
Recordemos que el producto infinito n=1 an es convergente si la sucesión ( pn )∞
n =1 tiene un
∞
límite finito no nulo. Si la Q
sucesión ( pn )n=1 carece de límite finito, o si tiende a cero, se dice
que el producto infinito ∞
n =1 an es divergente.
P∞
Q∞
an converge.
Pruebe que una serie
n =1 an converge si, sólo si, el producto infinito
n =1 e
En consecuencia,

∞
X
P∞


e n=1 an si
an < + ∞

∞

Y
an
n
=
1
e =
∞
X


n =1

0
si
an = +∞.


n =1
(8) Sean f , g ∈ Sci([a, b]) ambas no-negativas. Pruebe que f · g ∈ Sci([a, b]).
(9) Pruebe que f ∈ Sci([a, b]) si, y sólo si, el conjunto {( x, f ( x)) : f ( x) ≤ x} es cerrado.
CAPÍTULO
4
Desigualdades de Hölder y Minkowski en R n
Este capítulo está dedicado a presentar, fundamentalmente, las desigualdades de Hölder y
Minkowski en R n . Para lograr dicho objetivo nos pasearemos brevemente por otras importantísimas desigualdades conocidas como las desigualdades de la Media Aritmética y la Media
Geométrica.
4.1. Convexidad
La noción de convexidad juega un papel de primer orden en Matemáticas. Recordemos que
si X es un espacio vectorial sobre R, un subconjunto G de X se llama convexo si, cualesquiera
sean x, y ∈ G y λ ∈ [0, 1], se cumple que
λx + (1 − λ)y ∈ G.
Es claro que cualquier subintervalo de R es un conjunto convexo. Lo interesante es que en R,
todo conjunto convexo es un intervalo. Si x1 , . . . , xn son elementos de un conjunto G (no necesariamente convexo), entonces cualquier combinación de la forma
λ 1 x1 + · · · + λ n x n
donde los λ1 , . . . , λn son no-negativos y satisfacen λ1 + · · · + λn = 1 es llamada una combinación convexa de G. El conjunto de todas las combinaciones convexas de elementos de G
constituye un conjunto convexo que llamaremos la cápsula convexa de G y denotado por co( G ).
De hecho, co( G ) representa el conjunto convexo más pequeño conteniendo a G. Por supuesto,
si G es convexo, entonces G = co( G ).
Definición 4.1.1. Sea I un subintervalo de R. Una función f : I → R se dice que es convexa en I si
f (λx + (1 − λ)y) ≤ λ f ( x) + (1 − λ) f (y)
cualesquiera sean x, y ∈ I y λ ∈ [0, 1].
194
Cap. 4 Desigualdades de Hölder y Minkowski en R n
λ f ( x1 ) + ( 1 − λ ) f ( x2 )
f
b
( x2 , f ( x2 ))
b
( x1 , f ( x1 ))
b
b
|
x1
|
x
q
λx1 + (1 − λ) x2
|
x2
Geométricamente, la convexidad de f significa que para cada par de puntos x1 , x2 ∈ I con
x1 6= x2 , el segmento de línea que une a los puntos ( x1 , f ( x1 )) y ( x2 , f ( x2 )) está por encima de
la curva entre x1 y x2 (véase la gráfica).
La siguiente desigualdad, válida para cualquier función convexa, es fundamental para la obtención de una versión de la Desigualdad de Jensen para integrales.
Lema 4.1.2. Si g : I → R es una función convexa en I , entonces existen a, b ∈ R tales que
g( x) ≥ ax + b
para todo x ∈ I.
Prueba. Sean x, y ∈ I con x < y y sea x < x0 < y. Entonces x0 = λx + (1 − λ)y, donde
y− x
λ = y− x0 ∈ (0, 1) y por convexidad,
y − x0
g( x0 ) ≤ λg( x) + (1 − λ) g(y) =
g( x ) +
y−x
y − x0
1−
g( y).
y−x
Multiplicando el lado izquierdo de la desigualdad anterior por 1 =
resulta que
g ( x0 ) − g ( x )
g ( y ) − g ( x0 )
≤
,
x0 − x
y − x0
( y− x0 )+( x0 − x )
y− x
y reagrupando,
cualquiera sean x < x0 < y y, por lo tanto, gracias al Teorema 2.1.9, página 87, se tiene que
A = sup
x < x0
g ( x0 ) − g ( x )
g ( y ) − g ( x0 )
≤ ı́nf
= B.
y > x0
x0 − x
y − x0
Seleccione un a tal que A ≤ a ≤ B y observe finalmente que
g( x) ≥ a( x − x0 ) + g( x0 ) = ax + ( g( x0 ) − ax0 ).
La prueba es completa.
Cualquier recta L( x) = a( x − x0 ) + g( x0 ) obtenida en el resultado anterior, se llama una
línea tangente para f en x0 . Si f no es diferenciable en x0 , la pendiente de la recta tangente
puede que no esté unívocamente determinada. Sin embrago, cuando f es diferenciable en I,
resulta que a se puede reemplazar por f ′ ( x0 ) y, en consecuencia, la línea tangente L es única.
Más aun, se tiene el siguiente resultado.
Sec. 4.1 Convexidad
195
Teorema 4.1.3. Sea I un intervalo abierto y f : I → R una función dos veces diferenciable en I. Si
f ′′ ( x) ≥ 0 para todo x ∈ I, entonces f es convexa en I.
Prueba. Sean x, y ∈ I. Para cada x ≤ z ≤ y, existe un escalar λ ∈ [0, 1] tal que z =
λx + (1 − λ)y. Puesto que f ′′ ≥ 0, entonces f ′ es creciente y, en consecuencia, gracias al
Teorema del Valor Medio para derivadas, existen ξ 1 ∈ ( x, z) y ξ 2 ∈ (z, y) tales que
Como 1 − λ =
z− x
y− x ,
f ( z) − f ( x )
f ( y) − f ( z)
= f ′ (ξ 1 ) ≤ f ′ (ξ 2 ) =
.
z−x
y−z
resulta que z − x = (1 − λ)(y − x) de donde se obtiene que
f ( z) − f ( x )
f ( z) − f ( x )
f ( y) − f ( z)
=
.
≤
(1 − λ)(y − x)
z−x
y−z
Finalmente, si multiplicamos a ambos lados de esta última desigualdad por el número positivo
x
(1 − λ)(y − x) > 0 y teniendo en cuenta, además, que λ1 = yy−
− z resulta entonces que
f (λx + (1 − λ)y) = f (z) ≤ λ f ( x) + (1 − λ) f (y).
La prueba es completa.
El Teorema 4.1.3 permite verificar que la función f : [0, +∞) → R definida por
f ( x) = x p ,
para p ≥ 1
es convexa. Similarmente, la función g( x) = ex para todo x ∈ R, es convexa.
Es una tarea fácil de comprobar, usando el Lema 4.1.2, que toda función convexa cuyo dominio
es un intervalo abierto es continua. Por supuesto, existen funciones convexas definidas sobre un
intervalo compacto I = [ a, b] que no son continuas. Por ejemplo, la función f : [0, 1] → R
definida por
(
si x ∈ (0, 1]
x2
f ( x) =
1/2 si x = 0
es convexa, pero no continua. Se puede probar, además, que: si f es continua sobre [ a, b], entonces
f es convexa si, y sólo si,
1
1
1
1
f
x + y ≤ f ( x ) + f ( y).
2
2
2
2
para todo x, y ∈ [ a, b].
4.1.1. Las Desigualdades AM-GM
Algunas desigualdades útiles en Análisis y que ahora presentaremos se derivan de los resultados anteriores. Comencemos.
Teorema 4.1.4 (Desigualdad de Jensen finita). Sea f : I → R una función convexa en I y considere cualquier conjunto finito de puntos x1 , . . . , xn ∈ I. Entonces
X
n
n
X
f
λi xi ≤
λi f ( xi )
( 1)
i=1
i=1
cualesquiera sean λ1 , . . . , λn ∈ [0, 1] satisfaciendo λ1 + · · · + λn = 1.
196
Cap. 4 Desigualdades de Hölder y Minkowski en R n
Prueba. Usemos inducción sobre n. Claramente la conclusión es trivial si n = 1. Suponga que la
desigualdad (1) es válida para cualquier conjunto de n − 1 en I sea n > 1. Seleccione cualquier
conjunto finito de números λ1 , . . . , λn ∈ [0, 1] satisfaciendo λ1 + · · · + λn = 1. Defina
β = λ1 + · · · + λ n −1 .
Resulta que λn = 1 − β y como 0 ≤ λi /β ≤ 1 para i = 1, . . . , n − 1, entonces
donde se concluye, usando la hipótesis inductiva, que
f
X
n
λi xi
i=1
≤ βf
≤ β
=
X
n −1
i=1
n
−
1
X λi
i=1
n
X
β
Pn −1
λi
i=1 β
= 1, de
λi
xi + (1 − β ) f ( xn )
β
f ( xi ) + (1 − β ) f ( xn )
λ i f ( xi ).
i=1
La prueba es completa.
Definición 4.1.5. Si x1 , . . . , xn son números positivos, su media aritmética y su media geométrica se
definen, respectivamente, como
x1 + · · · + x n
n
√
n
y
x1 · . . . · x n .
Una de las desigualdades más importantes y con un amplio abanico de aplicaciones la constituye la siguiente la desigualdad
√
n
x1 · . . . · x n ≤
x1 + · · · + x n
,
n
(AM-GM)n
llamada la desigualdad AM-GM. En [27] se pueden ver 78 demostraciones de dicha desigualdad.
De modo más general, si λ1 , . . . , λn ∈ [0, 1] satisfacen la igualdad λ1 + · · · + λn = 1, entonces
las medias aritmética y geométrica correspondientes a los pesos λi se definen como
λ 1 x1 + · · · + λ n x n
y
x1λ1 · . . . · xnλn .
Teorema 4.1.6 (Desigualdad AM-GM). Sean x1 , . . . , xn , λ1 , . . . , λn números positivos y suponga que
λ1 + · · · + λn = 1. Entonces
x1λ1 · . . . · xnλn ≤ λ1 x1 + · · · + λn xn .
Prueba. Sea f : R → R definida por f ( x) = ex . Sabemos que f es convexa, de modo que si
tomamos ti = ln( xi ) para i = 1, . . . , n tendremos, por la Desigualdad de Jensen, que
eλ1 t1 + ··· + λn tn ≤ λ1 et1 + · · · + λn etn
la cual no es otra cosa que la desigualdad requerida ya que eti = xi para cada i = 1, . . . , n.
Sec. 4.1 Convexidad
197
Observe que, tomando λi = 1/n para i = 1, . . . , n en el resultado anterior se obtiene la
desigualdad (AM-GM)n .
k ◮ Existencia de e y su irracionalidad.
Recordemos que el número e se define, tal vez la más común de todas, como
∞
X
1
.
e =
n!
n =0
Nuestro objetivo es ver que él es irracional y usar la Desigualdad AM-GM para expresar a e
como
n
1
e = lı́m 1 +
.
n→∞
n
k ◮ e es irracional.
Prueba. Observe, en primer lugar, que
1
1
1
1
+
+
+ ··· =
( n + 1) !
( n + 2) !
( n + 3) !
( n + 1) !
1
1
1 +
+
+ ···
n+2
(n + 3)(n + 2)
1
1
1
<
1 +
+
+
·
·
·
( n + 1) !
n+1
( n + 1) 2
∞
X
1
1
=
( n + 1) !
( n + 1) k
k=0
=
de donde se sigue que
1 +
1
1
1
n+1
1
=
·
·
=
,
1
( n + 1) ! 1 − n + 1
( n + 1) !
n
nn!
1
1
1
1
1
1
1
+
+ ··· +
< e < 1 +
+
+ ··· +
+
.
1!
2!
n!
1!
2!
n!
nn!
( 2)
Esta última desigualdad permite estimar a e tanto como se desee con sólo elegir a n lo suficientemente grande: por ejemplo, podemos escribir e ≈ 2,718281828459 . . . Suponga ahora que
e es un racional, digamos e = p/q escrito en forma reducida. Nótese que q ≥ 2 y que q! · e
es un número natural. Si en las desigualdades obtenidas en (2) reemplazamos n por q y las
multiplicamos por q!, obtenemos
1
1
1
1
1
1
1
q! · 1 +
+
+ ··· +
< q! · e < q! · 1 +
+
+ ··· +
+
1!
2!
q!
1!
2!
q!
q
lo cual conduce a la siguiente contradicción: como q! · e y q!(1 + 1/1! + 1/2! + · · · + 1/q!) son
números enteros, resulta que
1
1
1
1
0 < q! · e − q! · 1 +
+
+ ··· +
<
1!
2!
q!
q
|
{z
}
un entero
198
Cap. 4 Desigualdades de Hölder y Minkowski en R n
Esta contradicción establece que e es un número irracional.
k ◮ La Desigualdad AM-GM puede ser utilizada para demostrar que las sucesiones ( an )∞
n =1 y
∞
(bn )n=1 definidas por
an =
1+
1
n
n
y
bn =
n +1
1
1+
,
n
n = 1, 2, . . .
son monótonas y ambas convergen al mismo número. De hecho, ( an )∞
n =1 es estrictamente creciente,
∞
mientras que (bn )n=1 es estrictamente decreciente. En efecto, si en (AM-GM)n tomamos:
( a) x1 = 1 y x2 = · · · = xn+1 = 1 + n1 , resulta que
1
1+
n
n+n 1
=
1
x1 · x2 · . . . · x n + 1 ) n +1 <
x1 + x2 + · · · + x n + 1
1
= 1+
,
n+1
n+1
de donde se obtiene, elevando a la potencia n + 1 a ambos lados de la desigualdad anterior, que
a n < a n +1 .
(b) Similarmente, si x1 = 1 y x2 = · · · = xn+2 = 1 − n1 , resulta que
1
1−
n+1
nn++12
=
1
x1 · x2 · . . . · x n + 2 ) n +2 <
x1 + x2 + · · · + x n + 2
n+1
=
n+2
n+2
y, como antes, elevando a la potencia n + 2 en ambos lados de esta desigualdad y luego tomando
recíprocos, se tiene que
bn + 1 < bn .
Puesto que ambas sucesiones son acotadas y satisfacen las desigualdades
0 < a1 < · · · < an < an+1 < · · · < bn+1 < bn < · · · < b1 = 4,
se concluye que ellas convergen y lo hacen hacia un único número. Definamos entonces
e = lı́m
n→∞
1
1+
n
n
= lı́m
n→∞
1
1+
n
n +1
De lo anterior se sigue que
a n < a n + 1 < e < bn + 1 < bn
para todo n ≥ 1.
Existen otras desigualdades más generales que la AM - GM. Ellas son conocidas como las
desigualdades de la Media Generalizada.
Teorema 4.1.7 (Desigualdad de la Media Generalizada). Sean x1 , . . . , xn números positivos y sean
λ1 , . . . , λn ∈ [0, 1] tales que λ1 + · · · + λn = 1. Entonces, para cualquier par p, q ∈ R con 0 ≤ p < q,
se cumple que
p
p 1/p
q
q 1/q
λ 1 x1 + · · · + λ n x n
≤ λ 1 x1 + · · · + λ n x n
.
Sec. 4.1 Convexidad
199
Prueba. Si p = 1 y q > 1, la Desigualdad de la Media Generalizada toma la forma
q
q
q
λ 1 x1 + · · · + λ n x n ≤ λ 1 x1 + · · · + λ n x n
la cual sigue inmediatamente de la convexidad de la función f ( x) = xq . Suponga ahora que
0 < p < q. Puesto que q/p > 1, de lo anterior vemos que
p q/p
p
λ 1 x1 + · · · + λ n x n
p
p
≤ λ1 ( x1 )q/p + · · · + λn ( xn )q/p
la cual no es otra cosa que la desigualdad requerida. El caso en que p
negativos se deja a cargo del lector.
o q toman valores
Una de las desigualdades importantes que permite definir una norma completa en los espacios
L p (µ) para p ≥ 1, es la siguiente:
Teorema 4.1.8 (Desigualdad de Young). Sean x, y ∈ [0, +∞). Si p, q ∈ (1, +∞) son tales que
1/p + 1/q = 1, entonces
xp
xq
xy ≤
+
.
p
q
Prueba. Esto es consecuencia de la Desigualdad AM - GM ya que
xp
xy =
1/p
yq
1/q
≤
1 p
1
x + y q.
p
q
4.1.2. Las Desigualdades de Hölder y Minkowski
Existen otras dos desigualdades famosas llamadas la Desigualdad de Hölder y la Desigualdad
de Minkowski que son las encargadas de garantizarnos que una cierta aplicación definida sobre
R n constituye, de hecho, una norma sobre R n .
Recordemos que, para cada n ∈ N, R n denota la colección de todas las n-uplas de números
reales x = ( x1 , . . . , xn ). Entonces R n es un espacio vectorial sobre R con las operaciones usuales
de sumas de n-uplas y multiplicación de un escalar por una n-upla. La base estándar de R n la
denotaremos por Bn = {e1 , . . . , en }, donde
e1 = (1, 0, . . . , 0),
e2 = (0, 1, 0, . . . , 0), . . . , en = (0, 0, . . . , 0, 1).
Esto significa que cada x = ( x1 , . . . , xn ) se expresa de modo único en la forma
x = x1 · e1 + · · · + x n · x n .
También, sobre R se define el producto interno usual h·, ·i : R n × R n → R dado por
h x, yi =
n
X
i=1
xi · yi
para todo x, y ∈ R n .
Este producto interno induce una norma sobre R n , llamada la norma euclídea y definida por
q
1/2
h x, xi = x12 + · · · + x2n
.
k x k2 =
200
Cap. 4 Desigualdades de Hölder y Minkowski en R n
En general, si para cada número p ∈ [1, +∞), definimos la aplicación k · k p : R n → [0, +∞) por
k ( x1 , . . . , x n ) k p =
X
n
i=1
| xi |
p
1/p
entonces k · k p es una norma sobre R n , llamada la p-norma. Si p = +∞, pondremos
k x k∞ = máx | xi |,
1≤ i ≤ n
para cualquier x ∈ R n . Es claro que si p ∈ {1, +∞}, entonces k · k p es un norma. De hecho,
lo mismo es cierto para cualquier p ∈ (1, +∞). Para ver esto, observe que k · k p satisface las
propiedades (1) − (3) que definen una norma. Falta verificar la desigualdad triangular la cual
es la conclusión del siguiente resultado también conocido como:
Teorema 4.1.9 (Desigualdad de Minkowski). Sea p ∈ [1, +∞). Entonces
X
n
i=1
| xi + yi |
p
1/p
≤
X
n
i=1
| xi |
p
1/p
+
X
n
i=1
|yi |
p
1/p
.
para cualesquiera x = ( x1 , . . . , xn ) y y = (y1 , . . . , yn ) en R n .
Prueba. Puesto que p ≥ 1, la función x 7→ | x| p es convexa. De esto se sigue que si λ ∈ [0, 1],
entonces
k λ · x + (1 − λ ) ·
p
y kp
=
≤
n
X
i=1
n
X
i=1
λxi + (1 − λ)yi
p
λ| xi | p + (1 − λ)|yi | p
= λ k x k pp + (1 − λ) k x k pp
para todo x, y ∈ R n . En particular, si k x k p = k y k p = 1, entonces
k λ · x + (1 − λ) · y k p ≤ 1.
Para ver el caso general, suponga que x y y son vectores no-nulos en R n . Entonces x/ k x k p
y y/ k y k p son vectores de norma igual a 1 y así, por la primera parte,
k x + y kp
k x kp + k y kp
Esto termina la prueba.
=
k x kp
k y kp
x
y
+
k x kp + k y kp k x kp
k x kp + k y kp k y kp
p
≤ 1
La siguiente desigualdad, comúnmente conocida como la Desigualdad de Hölder, o también como Desigualdad de Cauchy-Schwarz para el caso cuando p = q = 2, se obtiene como consecuencia
de la Desigualdad de Young. En muchos textos ella es usada para dar otra demostración de la
Desigualdad de Minkowski.
Sec. 4.1 Convexidad
201
Teorema 4.1.10 (Desigualdad de Hölder). Sean x, y ∈ R n y suponga que p, q ∈ (1, +∞) satisfacen
la igualdad 1/p + 1/q = 1. Entonces
h x, yi ≤ k x k p k y kq .
Prueba. Pongamos x = ( x1 , . . . , xn ) y y = (y1 , . . . , yn ). Por la Desigualdad de Young
h x, yi ≤ | x1 y1 | + · · · + | xn yn |
≤
| x1 | p + · · · + | x n | p
|y | q + · · · + |yn | q
+ 1
p
q
=
k x k pp
p
+
k y kqq
q
.
En particular, si k x k p = k y k q = 1, entonces h x, yi ≤ 1. Para el caso general, sean x y y
vectores no-nulos en R n . Entonces x/k x k p y y/k y kq son vectores unitarios y así, gracias a la
primera parte,
x
y
,
≤ 1.
k y k p k y kq
De esto se concluye la prueba.
En lo que sigue escribiremos ℓnp para designar a R n provisto de la norma k · k p , para cualquier p ∈ [1, +∞]. El siguiente resultado indica que todas las normas k · k p sobre R n son
equivalente mostrando, además, cómo se comparan tales normas.
Teorema 4.1.11 (Equivalencia de las p-normas sobre R n ). Todas las p-normas sobre R n son equivalentes, p ∈ [1, +∞]. Más aun, para todo x ∈ R n :
(1) Si 1 ≤ p ≤ +∞, entonces
k x k∞ ≤ k x k p ≤ n1/p k x k∞ .
( 1)
(2) Si 1 ≤ p < q < +∞, entonces existe una constante a > 0 tal que
( 2)
k x k p ≤ a · k x kq .
p
p
p
p
Prueba. Sea x = ( x1 , . . . , xn ) ∈ R n . Puesto | xi | = | xi | p ≤ | x1 | p + · · · + | xn | p = k x k p para
cada i = 1, . . . , n, resulta que
q
p
p
p
+ · · · + k x k∞
= n1/p k x k∞ .
k x k∞ = máx | x1 |, . . . , | xn | ≤ k x k p ≤
k x k∞
Esto prueba (1). Para demostrar (2), sea x ∈ R n y suponga que 1 ≤ p < q < +∞. Defina
r = q/p > 1 y elija s > 1 tal que 1/r + 1/s = 1. Usando la Desigualdad de Hölder y el hecho
de que q = pr, se tiene que
k x k pp =
≤
n
X
i=1
| xi | p · 1
X
n
i=1
| xi |
p r
= k x kqp · n1/s .
1/r X
n
i=1
1
s
1/s
202
Cap. 4 Desigualdades de Hölder y Minkowski en R n
Puesto que 1/ps = 1/p − 1/q, resulta que tomando a = n1/ps se obtiene el resultado deseado.
Una consecuencia importante de estas desigualdades es que cualquier transformación lineal
de R n en R m es continua. Recordemos que toda aplicación T : R n → R m que cumple con las
propiedades:
y
T ( x + y) = T ( x ) + T ( y)
T (λ · x) = λ · T ( x)
para todo x, y ∈ R y todo λ ∈ R, es llamada una Transformación Lineal.
Teorema 4.1.12. Si T : (R n , k · k p ) → (R m , k · k p ) es una transformación lineal, entonces T es
continua.
Prueba. Sea x ∈ R n y sea q ≥ 1 tal que 1/p + 1/q = 1. Por la linealidad de T tenemos que
T ( x ) = T ( x1 e1 + · · · + x n e n ) = x1 · T ( e1 ) + · · · + x n · T ( e n )
y entonces, por la desigualdad triangular de la norma, resulta que
k T ( x ) k p = k x1 · T ( e1 ) + · · · + x n · T ( e n ) k p ≤
Si definimos
M =
v
u n
u
q X
t
i=1
n
X
i=1
| xi | k T ( ei ) k p .
k T (ei ) kqp ,
entonces la Desigualdad de Hölder nos muestra que
k Tx k p ≤ M · k x k p .
Finalmente, si x, y ∈ R, entonces como T ( x − y) = T ( x) − T (y) se obtiene que
k T ( x ) − T ( y) k p ≤ M · k x − y k p
y termina la prueba.
Si T : (R n , k · k) → (R m , k · k) es una transformación lineal, se sigue del resultado anterior
que ella es continua, de hecho T es Lipschitz. Esto permite definir
k T kop = ı́nf c > 0 : k Tx k ≤ c k x k para todo x ∈ R n .
Es fácil establecer que k · kop es una norma sobre el espacio vectorial L(R n , R m ) formado por todas
las transformaciones lineales (continuas) de R n en R m . Más aun, si T ∈ L(R n , R m ), entonces
de donde resulta que
k T kop = sup k Tx k : k x k ≤ 1 ,
k T ( x) k ≤ k T kop k x k
para todo x ∈ R n .
Sec. 4.1 Convexidad
203
En un espacio normado ( X, k · k), decir que una sucesión ( xn )∞
n =1 en converge (en la norma)
a un vector x, significa que
lı́m k xn − x k = 0.
n→∞
Observe que, gracias a (1), si la sucesión ( xn )∞
n =1 converge a x, entonces
lı́m k xn k = k x k ,
n→∞
pero el recíproco no siempre es cierto. Un subconjunto A de X se dice que norma-acotado o,
simplemente, acotado, si existe una constante M > 0 tal que k x k ≤ M para todo x ∈ A. Si
( X, d) es un espacio métrico completo, donde la métrica d es dada por (2a), entonces diremos
que ( X, k · k) es un espacio de Banach. El ejemplo clásico de un espacio de Banach lo constituye
(R n , k · k p ), para cada n ≥ 1, donde
X
n
k ( x1 , . . . , x n ) k p =
i=1
| xi |
p
1/p
P∞
para p ≥ 1. Dada unaPsucesión ( xn )∞
n =1 xn converge (en la
n =1 en X, diremos que la serie
n
∞
norma) si la sucesión ( k=1 xk )n=1 de sus sumas parciales converge a algún x ∈ X, esto es,
lı́m
n→∞
n
X
k=1
xk − x
= 0.
P∞
P∞
Si este es el caso escribiremos, como es usual,
n =1 xn es
P∞ x = n=1 xn y diremos que la serie
convergente y que x es su suma. La serie
x
se
dice
que
es
absolutamente
convergente
si
n =1 n
∞
X
n =1
k xn k < +∞.
Observe que si ( xn )∞
n =1 es cualquier sucesión en X, entonces para cualquier n ≥ 2,
x n = x1 +
n
X
k=2
xk − xk−1 ,
P∞
lo cual permite concluir que la sucesión ( xn )∞
k=2 xk − xk−1 poseen un romance
n =1 y la serie
en extremo: o ambas convergen o ambas divergen. Este controversial romance interviene de
modo directo en la demostración del siguiente resultado fundamental.
Lema 4.1.13. Sea ( X, k · k) un espacio normado. Las siguientes condiciones son equivalentes:
(1) ( X, k · k) es un espacio de Banach.
(2) Toda serie absolutamente convergente es convergente.
P∞
Prueba. (1) ⇒ (2). Suponga que ( X, k · k) es un espacioPde Banach y sea
n =1 xn una serie
∞
absolutamente convergente. Para demostrar que la serie
x
converge
en
X, es suficiente
n
n =1
∞
demostrar
que
la
sucesión
de
sus
sumas
parciales
(
s
)
es
de
Cauchy
en
X,
donde sn =
n n =1
Pn
k=1 xk para cada n ∈ N. Observe que cualesquiera sean m, n ∈ N con m > n, se tiene que
k sm − sn k =
m
X
k= n +1
xk
≤
m
X
k= n +1
k xk k
204
Cap. 4 Desigualdades de Hölder y Minkowski en R n
P
Pm
y como la serie ∞
n =1 k xn k converge, resulta entonces que
k= n +1 k xk k → 0 cuando m, n → ∞.
Esto prueba que la sucesión de sumas parciales (sn )∞
es
de
Cauchy en X y, en consecuencia,
n =1
converge ya que ( X, k · k) es completo.
(2) ⇒ (1). Suponga que toda serie absolutamente convergente es convergente y sea ( xn )∞
n =1 una
sucesión de Cauchy en X. Para demostrar que ella converge en X, es suficiente encontrar una
subsucesión de ( xn )∞
n =1 que converja. Para lograr tal objetivo, use el hecho de que la sucesión
( xn ) ∞
es
de
Cauchy
para determinar una subsucesión ( xnk )∞
n =1
k=1 que satisfaga
k xk+1 − xk k < 2−k para todo k ≥ 1.
P∞
De esto se sigue que la serie
es absolutamente convergente ya que
k = 1 x n k +1 − x n k
∞
X
k=1
x n k +1 − x n k
<
∞
X
2−k < +∞.
k=1
P∞
Haciendo uso de nuestra hipótesis, se tiene que la serie
k=1 ( xn k +1 − xn k ) converge en X y, en
consecuencia, como fue observado anteriormente, la subsucesión ( xnk )∞
k=1 converge pues
x n m +1 = x n 1 +
m
X
k=1
( x n k +1 − x n k ) .
Esto termina la prueba.
4.2. Problemas
(1) Pruebe que una función f : R → R es convexa si, y sólo si,
f ( y) − f ( x )
f ( z) − f ( x )
f ( z) − f ( y)
≤
≤
y−x
z−x
z−y
para todo x, y, z ∈ R con x < y < z. Deduzca de esto que las derivadas laterales f −′ y f +′
son funciones crecientes.
(2) Sea f : R → R una función convexa y para cada a, b ∈ R con a < b, considere el número
M = máx{− f +′ ( a), f −′ (b)}. Pruebe que
| f ( x) − f (y)| ≤ M | x − y| para todo x, y ∈ [a, b].
En particular, f es continua en todo punto de R. Concluya que f es convexa si, y sólo si,
1
1
1
1
f
x + y ≤ f ( x ) + f ( y).
2
2
2
2
para todo x, y ∈ R.
(3) Sea f : R → R una función convexa. Pruebe que
f (λx + (1 − λ)y) ≥ λ f ( x) + (1 − λ) f (y)
para todo λ ∈ R \ [0, 1].
Sec. 4.2 Problemas
205
(4) Sea f : R → R una función convexa y sea
Z f = x ∈ R : f no es diferenciable en x .
Pruebe que Z f es a lo más numerable.
(5) Sea f : R → R una función convexa y para cada x ∈ R considere el intervalo cerrado
∂ f ( x) = [ f −′ ( x), f +′ ( x)].
Pruebe que:
(i) f es diferenciable en x si, y sólo si, ∂ f ( x) consiste de un sólo punto.
(ii) Para cada x0 ∈ R y cada s ∈ ∂ f ( x0 ), se cumple
f ( x ) ≥ f ( x0 ) + s · ( x − x0 )
para todo x ∈ R.
(iii) Para cada x, y ∈ R con x < y, existe c ∈ ( x, y) tal que
f ( y) − f ( x )
∈ ∂ f ( c ).
y−x
(6) Sea f : (0, +∞) → R una función convexa y defina la función F : (0, +∞) → R por
Z
1 x
F ( x) =
f (t) dt para todo x > 0.
x 0
Pruebe que F es convexa.
(7) Sean x1 , . . . , xn , y1 , . . . , yn ∈ (0, +∞). Pruebe que
r
r
√
√
x1 y1 + · · · + x n y n
x1 + · · · + x n y1 + · · · + y n
≤
.
n
n
n
(8) Sean λ, ν ∈ [0, 1] tales que λ + ν = 1. Pruebe que
x1λ y1ν + · · · + xnλ yνn
≤
n
x1 + · · · + x n
n
λ y1 + · · · + y n
n
ν
.
(9) Pruebe que (C ([a, b]), k · k∞ ) es un espacio de Banach.
(10) Sea f : [a, b] → R una función acotada. Pruebe que f es continua en [a, b] si, y sólo si,
Gra( f ) = {( x, f ( x)) : x ∈ [ a, b]} es cerrado en R2 .
(11) ( a) Sea (rn )∞
n =1 una enumeración de los racionales en (0, 1) y considere, para cada n ≥ 1,
la función f n : [0, 1] → R definida por
(
0
si x ∈ [0, rn ),
f n ( x) =
n
1/2 si x ∈ [rn , 1].
P∞
Sea f =
n =1 f n . Pruebe que f es creciente, acotada y discontinua precisamente en los
racionales de (0, 1).
206
Cap. 4 Desigualdades de Hölder y Minkowski en R n
(b) Sea f : [0, 1] → R definida por
f ( x) =
X
0≤
m
n
1
,
n3
≤x
(m, n) = 1
para cada x ∈ [0, 1]. Pruebe que f es creciente, continua en los irracionales y discontinua en
los racionales.
(12) Sea W : [0, 1] → R definida por
W ( x) =
∞
X
10−n f (10n x),
n =0
donde f ( x) = | x − k| siempre que x ∈ [k − (1/2), x + (1/2)], k ∈ Z. Pruebe que la función
W es continua pero nunca-diferenciable en [0, 1].
(13) Sea G ⊆ R. Pruebe que χ G : R → R es semicontinua inferiormente (resp. superiormente)
si, y sólo si G es abierto (resp. cerrado).
(14) Para cada x ∈ [a, b], sea Nx la familia de todos los entornos abiertos de x. Suponga que
f : [ a, b] → R es una función arbitraria y defina
f ( x) = sup ı́nf f (ζ )
V ∈ Nx ζ ∈ V
y
f ( x) =
ı́nf sup f (ζ )
V ∈ Nx ζ ∈ V
para cada x ∈ [ a, b]. Pruebe que:
( a) Si ( In )∞
n =1 es cualquier sucesión decreciente de intervalos tal que ℓ( In ) → 0 y x ∈ int( In )
para cada n, entonces
f ( x) = lı́m ı́nf f (ζ )
f ( x) = lı́m sup f (ζ ) .
y
n→∞
ζ ∈ In
n→∞
ζ ∈ In
(b) f ≤ f ≤ f .
(c) f es semicontinua inferiormente y f es semicontinua superiormente.
(d) f es semicontinua inferiormente (respectivamente, semicontinua superiormente) si, y
sólo si, f = f (respectivamente, f = f ).
(15) Sea J ⊆ [0, 1]. Una familia (Vj ) j∈ J de subconjuntos de [0, 1] se dice que es un cubrimiento
creciente de [0, 1] si
[
[0, 1] =
Vj
y
Vi ⊆ Vj siempre que i ≤ j.
j∈ J
Asocie, a cada cubrimiento creciente (Vj ) j∈ J de [0, 1], la función f : [0, 1] → R definida por
f ( x) = ı́nf j ∈ J : x ∈ Vj .
Pruebe que si J es denso en [0, 1] y los Vj son cerrados (respectivamente, abiertos), entonces
f es semicontinua inferiormente, (respectivamente, superiormente).
Sec. 4.2 Problemas
207
(16) Sea { Aα : α ∈ D } una familia arbitraria de conjuntos y sean
[
\
G =
Aα
y
F =
Aα .
α∈ D
α∈ D
Pruebe que
χ G = sup χ A
(17) Sea An
∞
n =1
α∈ D
α
y
χ F = ı́nf χ A .
α∈ D
α
una sucesión de conjuntos. Pruebe que
χ
lı́m A n
n→∞
(18) Demuestre que
infinitos n’s.
P∞
= lı́m χ An
n =0 an /n!
n→∞
y
χ lı́m
n→∞
An
= lı́m χ An
n→∞
es un número irracional si cada an ∈ {0, 1} y si an = 1 para
208
Cap. 4 Desigualdades de Hölder y Minkowski en R n
CAPÍTULO
5
El Conjunto de Cantor y su Media Hermana
Esta sección esta dedicada fundamental a la construcción del Conjunto Ternario de Cantor,
un conjunto que constituye una fuente casi inagotable de ejemplos y contra-ejemplos en muchas
ramas de las matemáticas. Su construcción se lleva a cabo por medio de un proceso infinito de
eliminación de ciertos intervalos abiertos y lo que queda de tal proceso es el conjunto de Cantor.
De inmediato se comienzan a mostrar las casi inimaginables propiedades que dicho conjunto
posee. Luego pasamos a construir a sus parientes más cercanos: los así llamados Conjuntos
Tipo-Cantor con propiedades muy similares al conjunto de Cantor y se finaliza con la Función de
Cantor, una función también con característica muy especiales.
5.1. Representaciones Ternarias y Binarias
Para poder entender en profundidad las propiedades que posee el Conjunto Ternario de Cantor debemos pasearnos antes por conocer las propiedades de las representaciones ternarias de los
puntos que habitan en [0, 1].
∞
Dada una sucesión de
( sn ) ∞
n =1 de sus sumas
Pnnúmeros reales, ( xn )n=1 , considere la sucesión
∞
parciales, donde sn =
x
para
todo
n
∈
N.
Si
la
sucesión
(
s
)
converge
a un punto
n n =1
j=1 j
s ∈ R, escribiremos
∞
X
s =
xn = lı́m sn
y diremos que la serie
sabemos que
P∞
n =1
n =1
n→∞
xn converge a s. Por ejemplo, para cada x ∈ R y cada n ∈ N,
n
X
j=0

n +1

1 − x
1−x
xj =


n+1
si x 6= 1
si x = 1
y que si | x| < 1, entonces lı́mn→∞ xn = 0. De esto se sigue el siguiente resultado conocido como
el Teorema de la Serie Geométrica.
210
Cap. 5 El Conjunto de Cantor y su Media Hermana
Teorema 5.1.1 (Serie Geométrica). Para cada x ∈ R, la serie geométrica
y sólo si, | x| < 1. En este caso,
∞
X
1
xn =
.
1−x
P∞
n =0
xn converge en R si,
n =0
Observe que para cualquier m ≥ 0,
∞
X
∞
X
xn =
n =0
n=m
xm+n = xm ·
X
∞
xn
n =0
= xm
1
1−x
,
siempre que | x| < 1. Por ejemplo, si x = 1/k, donde k ∈ {2, 3, . . . , 9}, entonces
∞
X
n = m +1
1
1
= m +1
n
k
k
1
1−
1
k
!
=
1
k m ( k − 1)
.
(1km )
En particular, tomando k = 3 en la igualdad anterior, resulta que
∞
X
n = m +1
2
1
= m.
n
3
3
(13m )
Por consiguiente,
∞
X
2
= 1,
3n
∞
X
2
1
= ,
n
3
3
n =2
n =1
y así,
∞
X
2
2
1
+
= ,
n
3
3
3
n =2
∞
X
2
1
= 2, ···
n
3
3
n =3
∞
X
2
2
7
+
= 2,···
n
3
3
3
n =3
5.1.1. Representaciones Ternarias
Suponga que para n ∈ N, an P
∈ {0, 1, 2}. Entonces, 0 ≤ an /3 < 1 y se sigue del Teorema de
∞
n
la Serie Geométrica que la serie
n =1 an /3 converge a un elemento x ∈ R. En este caso a x
también lo representaremos en la forma
x = ( α 0 , a1 a2 a3 . . . ) 3
y diremos que (α0 , a1 a2 a3 . . . )3 es una representación ternaria de x. Los números 0, 1 y 2 son
llamados los dígitos ternarios.
Lema 5.1.2. Sea x ∈ R con 0 < x < 1. Entonces, para cada n ∈ N, existen dígitos ternarios
a1 , . . . , an tales que
a1
a2
an
a
a2
an
1
+ 2 + ··· + n ≤ x < 1 + 2 + ··· + n + n.
3
3
3
3
3
3
3
( 1)
Sec. 5.1 Representaciones Ternarias y Binarias
211
Prueba. La prueba es por inducción sobre n. Puesto que 0 < x < 1, entonces 0 < 3x < 3, de
modo que si definimos a1 = [3x], la parte entera de 3x, tendremos que a1 es un dígito ternario
tal que a1 ≤ 3x < a1 + 1. De aquí se sigue que
a1
a
1
≤ x < 1 + ,
3
3
3
lo cual es (1) para n = 1. Suponga que han sido construidos los dígitos ternarios a1 , . . . , an
satisfaciendo (1) y defina
a1
a2
an
qn =
+ 2 + ··· + n.
3
3
3
Entonces (1) es igual a
1
qn ≤ x < qn + n
3
de donde se obtiene que
0 ≤ 3n+1 x − qn ) < 3.
Si ahora definimos an+1 = [3n+1 x − qn )], tendremos que an+1 ∈ {0, 1, 2} y se cumple que
an+1 ≤ 3n+1 x − qn ) < an+1 + 1,
es decir,
qn +
a n +1
a 1
1
≤ x < qn + nn+
+ n +1 ,
n
+
1
+
1
3
3
3
lo cual es (1) para k = n + 1.
Puesto que los números 0 y 1 poseen las representaciones ternarias
0 = (0,000 . . . )3
y
1 = (0, 222 . . . )3 ,
entonces, del Lema 5.1.2, se concluye que:
Corolario 5.1.3. Cada x ∈ [0, 1] posee al menos una representación ternaria.
Por otro lado, observe que las fracciones
1
= (0,100 . . . )3 = (0,0222 . . . )3 ,
3
1 2
3, 3
se pueden representar en la forma:
2
= (0,200 . . . )3 = (0,1222 . . . )3 .
3
En general, cualquier racional de la forma m/3n admite dos representaciones ternarias, pues
∞
X
m
m−1
1
m−1
2
=
+ n =
+
.
n
n
n
3
3
3
3
3k
k= n +1
Estos ejemplos ponen en evidencian que hay números reales que poseen al menos dos representaciones ternarias. El siguiente resultado establece que la representación ternaria de cualquier
x ∈ (0, 1) no puede ser más de dos.
Teorema 5.1.4. Sea x ∈ R con 0 < x < 1. Entonces x posee a lo sumo dos representaciones
ternarias.
212
Cap. 5 El Conjunto de Cantor y su Media Hermana
Prueba. Suponga que x posee al menos dos representaciones ternarias, digamos
x = (0, a1 a2 a3 . . . )3
= (0, b1 b2 b3 . . . )3
Sea m el primer valor de n para el cual am 6= bm , es decir, suponga que
a1 = b1 , a2 = b2 , . . . , am−1 = bm−1 ,
pero
a m 6 = bm
Sin perder generalidad podemos asumir que am < bm . Como am , bm ∈ {0, 1, 2}, resulta que
1 ≤ am + 1 ≤ bm ≤ 2.
De aquí se sigue que
x =
m
−1
X
n =1
≤
=
=
≤
≤
−1
m
X
n =1
an
a
+ m
+
n
3
3m
an
am
+ m +
n
3
3
∞
X
an
3n
n = m +1
∞
X
n = m +1
m
−1
X
an
am
1
+ m + m
n
3
3
3
n =1
m
−1
X
bn
bm
+ m
n
3
3
n =1
m
−1
X
n =1
−1
m
X
n =1
2
3n
an
a +1
+ mm
3n
3
bn
b
+ m
+
n
3
3m
= x
∞
X
bn
3n
n = m +1
de donde se concluye que todas las desigualdades anteriores se convierten en igualdades y, en
consecuencia,
a m + 1 = bm
y
an = 2,
bn = 0 para todo n ≥ m + 1.
Estas relaciones muestran que x no puede tener otra representación ternaria.
Ejemplo 5.1.1. Recordemos que
1
1
0
0
=
+ 2 + 3 + · · · = (0,100 . . . )3
3
3
3
3
0
2
2
=
+ 2 + 3 + · · · = (0,022 . . . )3 .
3
3
3
También,
2
2
0
0
=
+ 2 + 3 + · · · = (0,200 . . . )3
3
3
3
3
1
2
2
=
+ 2 + 3 + · · · = (0,122 . . . )3
3
3
3
Sec. 5.1 Representaciones Ternarias y Binarias
213
Lo interesante de las dos representaciones ternarias tanto de 1/3 así como de 2/3 es que
una de ellas usa el dígito 1, mientras que la otra no lo usa en ningún lugar. En general, todo x con representación ternaria x = (0, a1 a2 . . . am−1 1000 . . . )3 se puede escribir como x =
(0, a1 a2 . . . am−1 0222 . . . )3 . En efecto, por (13m ) se tiene que
(0, a1 a2 . . . am−1 1000 . . . )3 =
=
−1
m
X
n =1
−1
m
X
n =1
an
1
+ m
n
3
3
an
0
+ m +
3n
3
∞
X
n = m +1
2
3n
= (0, a1 a2 . . . am−1 0222 . . . )3
Similarmente,
(0, a1 a2 . . . am−1 1222 . . . )3 =
m
−1
X
an
1
+ m +
n
3
3
=
m
−1
X
an
1
1
+ m + m
n
3
3
3
n =1
n =1
=
m
−1
X
n =1
∞
X
n = m +1
2
3n
an
2
+ m
3n
3
= (0, a1 a2 . . . am−1 2000 . . . )3
5.1.2. Representaciones Binarias
Similar a la representación ternaria se define la representación binaria de un número real
x ∈ [0, 1]. En efecto, para cada n ∈ N, considere an ∈ {0, 1}. Entonces 0 ≤ an /2n < 1 y se
sigue del Teorema de la Serie Geométrica que la serie
∞
X
an
2n
n =1
converge a un único elemento x ∈ [0, 1] al que representaremos en la forma
x = (0, a1 a2 a3 . . .)2
y, como antes, diremos que (0, a1 a2 a3 . . . )2 es una representación binaria de x. Los números 0 y
1 son llamados los dígitos binarios.
Es fácil establecer, similar a como se hizo en el caso de la representación ternaria, que todo
x ∈ [0, 1] posee al menos una, pero no más de dos, representaciones binarias. Por ejemplo, la
única representación binaria de 0 es
0 = (0, 000 . . . )2
214
Cap. 5 El Conjunto de Cantor y su Media Hermana
pero 1 se puede representar de dos formas distintas:
1 = (1, 000 . . . )2 = (0, 111 . . . )2
Más aun, cualquier 0 < x < 1 que posea una representación binaria, digamos en la forma,
x = ( a1 a2 . . . an 1000 . . . )2 donde los a1 , . . . , an ∈ {0, 1}, también se puede escribir como
x = (0, a1 a2 . . . an 0 111 . . . )2
A tal expresión la llamaremos la representación binaria infinita de x.
Corolario 5.1.5. Si 0 < x < 1, entonces x posee una, y sólo una, representación binaria infinita.
5.1.3. El Conjunto Ternario de Cantor
En el siglo XIX, tres matemáticos descubrieron, cada uno e independientemente de los otros
dos, una familia de conjuntos de números reales, ahora conocidos bajo el nombre de conjuntos tipo-Cantor, con propiedades muy sorprendentes y que fueron utilizados fundamentalmente
para construir algunos contraejemplos problemáticos. El primero de esos conjuntos fue descubierto por el inglés Henry J. S. Smith (1826-1883) en el año 1875. Este trabajo de Smith pasó casi
desapercibido para la época por la sencilla razón de que muy poca atención se le prestaba a la
investigación matemática proveniente de Inglaterra o de cualquier otra parte de Europa que no
fuese Alemania pues el prestigio de las universidades alemanas constituían el centro del mundo
matemático. De modo similar, en el año 1881, el brillante físico-matemático italiano Vito Volterra
(1860-1940), publicó un resultado similar al de Smith que le sirvió para demostrar la existencia
de una derivada acotada que no era Riemann integrable imponiendo, de este modo, una severa
limitación al Teorema Fundamental del Cálculo para la integral de Riemann y que originó una
profunda revisión de la noción de integral por parte de Lebesgue. Finalmente, en el año 1883 aparece el más conocido y famoso ejemplo de este tipo de conjuntos llamado el conjunto ternario de
Cantor o simplemente conjunto SVC(3) (3 por ternario y SVC por Smith, Volterra y Cantor).
El conjunto ternario de Cantor, al que denotaremos en lo sucesivo por Γ, es un subconjunto
de [0, 1] que se construye ejecutando, en infinitos pasos, la eliminación de ciertos subintervalos
abiertos en [0, 1]. Desde su descubrimiento se ha convertido en una suerte de caja de sorpresas:
aparte de poseer unas propiedades extraordinarias y, por demás, sorprendentes, lo que le confiere
un estatus de privilegio y una fuente casi inagotable de contraejemplos en Analysis, Topología,
Teoría de la Medida, etc. dicho conjunto es una herramienta fundamental en la Teoría de los
Sistemas Dinámicos, la Teoría de Fractales, etc., El proceso de construcción de dicho conjunto,
como ya mencionamos, se llevará a cabo en el intervalo [0, 1], aunque debemos advertir que
la elección de ese intervalo se hace sólo para simplificar los cálculos por lo que la construcción
de un conjunto ternario de Cantor se puede realizar en cualquier intervalo cerrado [ a, b] y, en
consecuencia, en cualquier intervalo abierto ya que éstos contienen en su interior a un intervalo
cerrado y acotado.
k ◮ Construcción del Conjunto Ternario de Cantor.
(1) Divida el intervalo I = [0, 1] en tres subintervalos de igual longitud y luego elimine el
subintervalo abierto que se encuentra ubicado en el centro, es decir, elimine el intervalo
J1 (1) = ( 13 , 23 ) y retenga los intervalos cerrados [0, 1/3] y [2/3, 1].
Sec. 5.1 Representaciones Ternarias y Binarias
215
2
3
1
3
0
(
1
)
↓
Γ1
J1 (1) = ( 13 , 23 )
Definiendo
Γ1 = [0, 1] \ J1 = [0, 1/3] ∪ [2/3, 1],
donde J1 = J1 (1), resulta que Γ1 es compacto. Más aun, si hacemos
F11 = [0, 1/3]
y
F12 = [2/3, 1],
se tiene que la longitud de cada uno de estos intervalos cerrados es 1/3 y, en consecuencia,
la longitud de Γ1 es 2/3.
(2) En la segunda etapa se subdivide cada uno de los dos intervalos cerrados retenidos anteriormente, F11 y F12 , en tres partes iguales eliminándose, como antes, los intervalos abiertos
centrales J2 (1) = ( 19 , 29 ) y J2 (2) = ( 79 , 89 ), respectivamente, pero conservando los cuatro
intervalos restantes.
1
9
0
(
↓
J2 (1) =
2
9
2
3
1
3
)
(
1 2
,
32 32
7
9
)
J2 (2) =
(
7 8
,
32 32
Formemos el conjunto J2 = J1 (1) ∪ J2 (1) ∪ J2 (2) y defina
8
9
1
)
↓
=
Γ2
2
3
+ 312 , 23 +
2
32
Γ2 = [0, 1] \ J1 (1) ∪ J2 (1) ∪ J2 (2))
2
=
2
[
F2j ,
j=1
donde
F21 =
1
2 3
6 7
8
0, 2 , F22 =
,
, F23 =
,
, F24 =
,1 .
3
32 32
32 32
32
Como antes, Γ2 es compacto y su longitud es 4/32 ya que la longitud de cada F2j , j =
1, . . . , 22 , es 1/32 . Más aun, Γ1 ⊇ Γ2 .
Γ0
Γ1
Γ2
(3) Si se continúa de este modo indefinidamente se obtienen dos sucesiones de conjuntos, ( Jn )∞
n =1
y (Γn )∞
n =1 con las siguientes propiedades: para cada entero n ≥ 1,
( a) Jn es la unión disjunta de 2n − 1 intervalos abiertos: Jn (1), . . . , Jn (2n − 1).
216
Cap. 5 El Conjunto de Cantor y su Media Hermana
(b) (Γn )∞
n =1 es una sucesión decreciente de conjuntos cerrados, donde cada Γ n es la unión
disjunta de 2n intervalos cerrados:
Γn = Fn1 ∪ · · · ∪ Fn2n = [0, 1] \ J1 ∪ J2 ∪ · · · ∪ Jn .
(c) Cada uno de los intervalos que definen a Jn+1 es el centro de alguno de los intervalos
que componen a Γn , n = 1, 2, . . ..
(d) La longitud de cada una de las componentes tanto de Jn así como de Γn es 1/3n . Luego,
la suma total de todas las longitudes de los intervalos de Jn y Γn son, respectivamente:
1
1
n −1
n
ℓ( Jn ) = 2
y
ℓ(Γn ) = 2
.
n
3
3n
Finalmente, sean
G=
∞
[
y
Jn
Γ =
n =1
∞
\
n =1
Γn = [0, 1] \ G.
Observe que G es un conjunto abierto no vacío y como (Γn )∞
n =1 es una sucesión decreciente de conjuntos compactos no vacíos, se sigue del Corolario 2.2.35, página 135, que Γ es
también no vacío. A este conjunto Γ es al que llamaremos conjunto ternario de Cantor, o
simplemente, conjunto de Cantor.
En el siguiente gráfico se muestra la representación del conjunto ternario de Cantor a través
de un árbol binario.
I
F11
Γ1
F12
F21
Γ2
F31
Γ3
..
.
F23
F22
F32
..
.
F33
..
.
F34
F35
..
.
..
.
F24
F36
F37
..
.
F38
..
.
Antes de comenzar a describir algunas de las formidables propiedades que posee el conjunto
ternario de Cantor, es imprescindible que podamos entender cómo se expresan las representaciones ternarias de los extremos de cada uno de los intervalos cerrados que definen a Γn .
La siguiente lista da una idea precisa de tal proceso. Para cada n ∈ N, denotemos por ext(Γn )
los puntos extremos de los intervalos que definen a Γn . Así,
3 [
1 2 3
6 7 8 9
k
ext(Γ1 ) = 0, , ,
∪ 2, 2, 2, 2 =
3 3 3
3 3 3 3
3
k=0
ext(Γ2 ) =
0,
1 2 3
, ,
32 32 32
∪
6 7 8 9
, , ,
32 32 32 32
=
3 [
1 [
k + 3(2i1 )
32
k = 0 i1 = 0
Sec. 5.1 Representaciones Ternarias y Binarias
217
6 7 8 9
18 19 20 21
24 25 26 27
1 2 3
ext(Γ3 ) = 0, 3 , 3 , 3 ∪
, , ,
∪
, , ,
∪
, , ,
3 3 3
33 33 33 33
33 33 33 33
33 33 33 33
1
1 3 [
[
[
k + 3(2i1 ) + 32 (2i2 )
=
33
k = 0 i1 = 0 i2 = 0
..
.
ext(Γn ) =
1
3 [
1
[
[
k = 0 i1 = 0 i2 = 0
1
[
k + 3(2i1 ) + 32 (2i2 ) + · · · + 3n−1 (2in−1 )
···
3n
i n −1 = 0
Observe que ext (Γ1 ) ⊆ ext (Γ2 ) ⊆ · · · ⊆ ext (Γn ) ⊆ · · · Definamos ahora
ext(Γ) =
∞
[
n =1
ext (Γn ) ⊆ Γ
y nótese
P que si x es cualquier elemento en [0, 1] con representación ternaria finita, digamos
x = nk=1 ck 3−k , entonces
n
X
ck
∈ ext(Γ)
x =
3k
siempre que
k=1
c1 , . . . , cn ∈ {0, 2}.
(5.1.1)
Más adelante veremos que ext(Γ) es, de hecho, denso en Γ. También observe que los pares
centrales en cada uno de los conjuntos que definen a ext(Γn ), dibujados en azul, constituyen los
extremos de los intervalos abiertos Jn (k) eliminados en el n-ésimo paso. Dicha fórmula permite
describir tales extremos como
ext( Jn ) =
1
2 [
1
[
[
k = 1 i1 = 0 i2 = 0
donde Jn =
S2 n − 1
k=1
1
[
k + 3(2i1 ) + 32 (2i2 ) + · · · + 3n−1 (2in−1 )
···
,
3n
i n −1 = 0
Jn (k). De modo explícito
J1 (1) =
1 2
J2 (1) =
,
,
32 32
1 2
J3 (1) =
,
,
33 33
2
1 2
2
J3 (3) =
+ 3, + 3 ,
3 3 3 3
1 2
,
3 3
J2 (2) =
J3 (2) =
J3 (4) =
2
1 2
2
+ 2, + 2
3 3 3 3
2
1 2
2
+ ,
+
32 33 32 33
2
2
1 2
2
2
+ + , + +
3 32 33 3 32 33
218
Cap. 5 El Conjunto de Cantor y su Media Hermana
J4 (1) =
1 2
,
,
34 34
J4 (2) =
2
1 2
2
J4 (3) =
+ ,
+
,
32 34 32 34
2
1 2
2
J4 (5) =
+ , +
,
3 34 3 34
y note que ext(Γ) = ext(
S∞
2
1 2
2
+ 4, 3 + 4
3
3
3 3
3
2
2
1 2
2
2
+ 3 + 4, 2 + 3 + 4
J4 (4) =
2
3
3
3 3
3
3
2
2
1 2
2
2
J4 (6) =
+ + , + +
3 33 34 3 33 34
..
.
Pongamos
..
.
[
∞
∞
[
Jn =
ext( Jn ) ⊆ Γ.
ext
n =1
n =1 Jn ) ∪
n =1
{0, 1}. Lo anterior se puede resumir en la forma siguiente:
(P0 ) k Si para cada n ∈ N y cada 1 ≤ k ≤ 2n−1 indicamos con ank y bkn los extremos del
intervalo abierto Jn (k) borrado en el n-ésimo paso, entonces
a1n =
1
3n
y
b1n =
2
3n
y para k ≥ 2, existen 1 ≤ n1 < n2 < · · · < nk < n tales que
2
2
1
2
ank =
+ n,
+
+
·
·
·
+
3n 1
3n 2
3n k
3
2
2
2
2
n
bk =
+ n +···+ n
+ n.
n
3 1
3 2
3 k
3
(5.1.2)
(5.1.3)
De aquí se concluye que las representaciones ternarias de ank y bkn vienen dadas, respectivamente, por
ank = (0, c1 c2 · · · cn−1 100 . . . )3 = (0, c1 c2 · · · cn−1 022 . . . )3 ,
bkn = (0, c1 c2 · · · cn−1 200 . . . )3
donde c1 , . . . , cn−1 ∈ {0, 2}.
5.1.4. Propiedades del Conjunto Ternario de Cantor
Las siguientes propiedades del conjunto ternario de Cantor, sólo mostramos algunas, son las
que le confieren a dicho conjunto los calificativos de extraordinario, sorprendente, especial y,
por supuesto, un estatus de privilegio entre los muchos subconjuntos de R que también poseen
propiedades muy especiales.
(K1 ) Γ es compacto.
Prueba. Observe que cada conjunto Γn es compacto por ser cerrado y acotado, o si prefieres,
por ser una unión finita de intervalos compactos. Más aun,
Γ1 ⊇ Γ2 ⊇ · · · ⊇ Γ n ⊇ · · ·
Sec. 5.1 Representaciones Ternarias y Binarias
219
Se sigue entonces del Corolario 2.2.35 que Γ =
T∞
n =1 Γ n
es compacto y no vacío.
De hecho, todos los puntos extremos de los intervalos que definen a Γn para cada n ∈ N,
pertenecen a Γ. Por ejemplo, todas las fracciones
0, 1,
1 2 1 2 7 8 1 2 7 8 19 20 25 26 1 2
, , , , , ,
,
,
,
,
,
,
,
,
,
, ...
3 3 9 9 9 9 27 27 27 27 27 27 27 27 81 81
están en Γ.
(K2 ) µ(Γ) = 0, donde µ es la medida de Lebesgue sobre R. Véase el Corolario 6.3.41, página 283. En particular, Γ no contiene ningún intervalo.
Tal vez podamos convencer al lector de que la “longitud” de Γ es cero argumentando del
modo siguiente: Recordemos que en el primer paso, en la construcción de Γ, removimos
el intervalo abierto J1 (1) de longitud 1/3. En el segundo paso eliminamos dos intervalos
abiertos J2 (1) y J2 (2), cada uno de longitud 1/32 , de modo que en estas dos etapas hemos
quitado de [0, 1] una longitud total de 13 + 2 312 . En el n-ésimo paso habíamos eliminado
2n−1 intervalos Jn (1), . . . , Jn (2n−1 ) cada uno de ellos de longitud 1/3n , por lo que la suma
de todas las longitudes eliminadas hasta el paso n es:
Sn =
1
1
1
1
+ 2 2 + 22 3 + · · · + 2n−1 n .
3
3
3
3
Una vez construido Γ, se observa que la totalidad de las longitudes de los intervalos eliminados de [0, 1] es la siguiente:
∞
X
ℓ( Jn ) =
n =1
∞
X
n =1
∞
2
n −1
1
1X
=
3n
2
n =1
n
1
2/3
2
= 1.
= ·
3
2 1 − 2/3
Pero 1 es la longitud de [0, 1], de modo que Γ debe “medir” cero. Aunque esta conclusión
es cierta, resulta que cada una de estas afirmaciones necesitan una justificación. Ellas serán
dadas más adelante cuando veamos la noción de medida de Lebesgue.
(K3 ) Γ es totalmente disconexo. Puesto que Γ no contiene, gracias al resultado anterior, ningún
intervalo y como los únicos subconjuntos conexos de R son los intervalos y los puntos,
Teorema 2.2.7, página 123, resulta que las componentes conexas de Γ son sus puntos.
(K4 ) Γ es nunca-denso. Esto es consecuencia inmediata del (K2 ). Más aun, el conjunto G =
[0, 1] \ Γ es denso en [0, 1]. Para ver esto, observe que como Γ es nunca-denso, entonces
int(Γ) = ∅ y se sigue del Teorema 2.2.39, página 137, que
[0, 1] = [0, 1] \ int(Γ) = [0, 1] \ Γ = G.
La siguiente importantísima descripción de los elementos de Γ es la que permite determinar con exactitud si un elemento dado en [0, 1] pertenece o no a dicho conjunto.
(K5 ) Cada x ∈ Γ admite una única representación ternaria sin usar el dígito 1, es decir,
Γ =
∞
X
cn
x ∈ [0, 1] : x =
, cn ∈ {0, 2} para todo n ≥ 1 .
3n
n =1
220
Cap. 5 El Conjunto de Cantor y su Media Hermana
Prueba. Pongamos
Γ
P∞
∗
=
∞
X
cn
x ∈ [0, 1] : x =
, cn ∈ {0, 2} para todo n ≥ 1 .
3n
n =1
− n ∈ Γ ∗ , donde c ∈ {0, 2} para todo n ≥ 1. Fijemos un n ∈ N y
Sea x =
n
n =1 c n 3
P
considere la suma parcial sn = nk=1 3ckk . Se sigue entonces de (5.1.1) que sn ∈ Γ para todo
n ≥ 1 y, además,
∞
X
cn
lı́m sn =
= x.
n→∞
3n
n =1
Como Γ es un conjunto cerrado, resulta que x ∈ Γ. Esto prueba que Γ∗ ⊆ Γ.
Para demostrar la otra inclusión, sea x ∈ Γ y suponga que x 6∈ Γ∗ . Ahora bien, como
x 6∈ Γ∗ , al expresar dicho número en su representación ternaria resulta que algunos de sus
coeficiente debe ser igual a 1, de modo que no se pierde generalidad en suponer que x
tiene la forma
m
−1
∞
X
X
cn
1
cn
x =
+ m +
( 1)
3n
3
3n
n =1
n = m +1
donde c1 , . . . , cm−1 , cm+1 , cm+2 , . . . ∈ {0, 2} y m es el primer entero tal que cm = 1. Observe
que no todos los cm+ j con j ≥ 1 pueden ser iguales a 0, pues si todos ellos fuesen cero,
entonces por (1) y (13m ) tendríamos que
x =
m
−1
X
n =1
m
−1
∞
X
X
cn
1
cn
2
+
=
+
∈ Γ∗
n
m
n
3
3
3
3n
n =1
n = m +1
lo cual es absurdo. Similarmente, si se supone que cm+ j = 2 para todo j ≥ 1 se obtiene,
como antes, que x ∈ Γ∗ . Por consiguiente, al menos un cm+ j 6= 0 y al menos un cm+ j 6= 2.
De esto último se concluye que
0 <
∞
X
cn
<
3n
n = m +1
∞
X
n = m +1
2
1
= m,
n
3
3
y, por lo tanto, usando (5.1.2) y (5.1.3), vemos que
am
j =
m
−1
X
n =1
m
−1
∞
X
X
cn
1
cn
1
cn
+
<
x
=
+
+
n
m
n
m
3
3
3
3
3n
n =1
<
m
−1
X
n =1
=
m
−1
X
n =1
n = m +1
cn
1
1
+ m + m
n
3
3
3
cn
2
+ m = bm
j
n
3
3
es decir, x ∈ Jm ( j). Pero como Γm = [0, 1] \ ( Jm (1) ∪ · · · ∪ Jm (2m−1 ), resulta que x 6∈ Γm y,
en consecuencia, x 6∈ Γ. Esta contradicción muestra que x ∈ Γ∗ y termina la prueba.
Sec. 5.1 Representaciones Ternarias y Binarias
221
Observe que multiplicar por 3 a un número x ∈ Γ equivale a desplazar el punto en la
representación de ternaria de x un lugar hacia la derecha. Por ejemplo, tomando
1
= (0,02020202 . . . )3 ∈ Γ
4
resulta que
3×
1
= (0,20202020 . . . )3 =
4
3
.
4 3
Mientras que dividir por 3 equivale a desplazar el punto ternario un lugar hacia la izquierda. Así, por ejemplo,
1 1
1
× = (0,00202020 . . . )3 =
.
3 4
12 3
Una vez establecida la propiedad (K5 ) se comienzan a descubrir otros atributos importantes e interesantes de Γ. Por ejemplo, una de las propiedades más sorprendente, extraordinaria y, por demás extraña de Γ, es la siguiente:
(K6 ) Γ es no-numerable.
Prueba. Ya hemos visto, Teorema 1.2.17, que
card {0, 1}N = card(P (N )),
y, como card(P (N )) = c, resulta entonces que card {0, 1}N = c. Para finalizar la prueba,
defina
∞
X
2an
por
ϕ ( an ) ∞
=
ϕ : {0, 1}N → Γ
n =1
3n
n =1
Puesto que ϕ es claramente biyectiva, entonces Γ es no numerable.
Otra forma de demostrar lo anterior es a través del Método de la Diagonal de Cantor.
Suponga que Γ es numerable y sea { x1 , x2 , . . .} una enumeración de dicho conjunto. Escribamos cada uno de los xi en su representación ternaria sin usar el dígito 1, esto es:
x1 = (0, a11 a12 a13 · · · )3 ,
x2 = (0, a21 a22 a23 · · · )3 ,
x3 = (0, a31 a32 a33 · · · )3 ,
..
.
donde los amn ∈ {0, 2} para todo m, n ∈ N. Ahora defina
an =
(
0
si ann = 2
2
si ann = 0.
Resulta que el número x = (0, a1 a2 a3 . . .) pertenece a Γ, pero no está en la lista anterior.
De allí que Γ es, necesariamente, no-numerable.
222
Cap. 5 El Conjunto de Cantor y su Media Hermana
(K7 ) Γ es simétrico en el siguiente sentido:
Γ = 1 − Γ.
Prueba. Por (K5 ), cada x ∈ Γ se puede representar en la forma x = (0, c1 c2 c3 . . . )3 , donde
cn ∈ {0, 2} para todo n ≥ 1. Por esto,
1 − x = (0,222 . . . )3 − (0.c1 c2 c3 . . . )3
=
∞
∞
X
X
2
cn
−
n
3
3n
n =1
=
n =1
∞
X
2 − cn
n =1
3n
∞
X
an
∈ Γ
=
3n
n =1
donde an = 2 − cn ∈ {0, 2} para todo n ≥ 1.
Observe también que
1
Γ ⊆ Γ
3m
se cumple para cualquier m ≥ 1. En efecto, si x =
P∞
cn
n = 1 3n
∈ Γ, entonces se tiene que
∞
∞
X
1
1 X cn
cn
=
∈ Γ
x
=
m
m
n
n
3
3
3
3 +m
n =1
n =1
para cualquier m ∈ N.
Otros resultados que que se obtienen gracias a la representación de los elementos de Γ
dada por (K5 ), consiste en identificar una cantidad infinita de racionales que no son de
p
la forma 3n pero que aun pertenecen a Γ. Como Γ es no-numerable, en él se pueden
apreciar dos grandes categorías de puntos: los visibles y los ocultos. Los visibles, como ya
hemos visto, son los extremos de los intervalos retenidos en cada paso de su construcción,
es decir,
0, 1,
1 2 1 2 7 8 1 2 7 8 19 20 25 26 1 2
, , , , , ,
,
,
,
,
,
,
,
,
,
, ...
3 3 9 9 9 9 27 27 27 27 27 27 27 27 81 81
Los ocultos, como su nombre lo indica, no están a la vista y, por consiguiente, no son
fáciles de detectar. Entre ellos están, por supuesto, los números irracionales de [0, 1] que
pertenecen a Γ. Identificar tales números irracionales es, como cabe esperar, una tarea
harto difícil. Sin embargo, el número de Liouville
∞
X
2
= (0, 22000200000000000000000200 . . . )3 ,
3n!
n =1
P
2
1
su simétrico 1 − ∞
n =1 3n! y los que se obtienen multiplicando los dos anteriores por 3m
para cada m ∈ N, son de los “pocos” números irracionales conocidos que viven en Γ. Sin
Sec. 5.1 Representaciones Ternarias y Binarias
223
embargo, además de los números irracionales, existen ciertas colecciones de fracciones que
están ocultas en Γ, entre ellas las que tienen la forma 3n1+1 , para todo n ∈ N. En efecto,
(0, |0 .{z
. . 0} 2
. . 2} 0
. . 0} 2
. . 2} 0 . . . )3 =
| .{z
| .{z
| .{z
n
n
=
2
3n + 1
+
=
=
3n − 1
·
32n
=
2
3n + 1
3n
n
n
+
2
3n + 2
2
3n + 2
2
+ · · · + 2n
3
2
+
+
+ · · · + 4n
33n+1 33n+2
3
2
1
1
1
+ · · · + 2n
1 + 2n + 4n + 6n + · · ·
3
3
3
3
1
1−
1
32n
=
2
2
+ ···
3n − 1
3n − 1
=
32n − 1
(3n + 1)(3n − 1)
1
∈ Γ.
+1
Además, como Γ es simétrico, los siguientes números también forman parte de Γ:
1−
1
3n
=
3n + 1
3n + 1
para todo n ∈ N.
y, por supuesto, también todas las fracciones del tipo
1 3n
3m 3n + 1
para todo m, n ∈ N.
En particular, para n = 1 uno obtiene que
1
4
=
1
3+ 1
∈ Γ y su numerosa familia:
1
11
1
11
25
35
1
1 3
, ,
,
,
,
,
,
,
,
4 4 3 · 4 3 · 4 32 · 4 32 · 4 32 · 4 32 · 4 33 · 4
11
25
35
73
83
97
107
,
,
,
,
,
,
, ...
33 · 4 33 · 4 33 · 4 33 · 4 33 · 4 33 · 4 33 · 4
todos están en Γ. Pero no sólo los números de la forma 3n1+1 y sus simétricos están en Γ,
existen muchos otros racionales ocultos en Γ que no son fáciles de visualizar, como por
ejemplo, todas las fracciones del tipo 3n2−1 están en Γ ya que
(0, |0 . {z
. . 02} 0
. . 02} 0 · · · )3 =
| . {z
n
n
2
2
2
+ 2n + 3n + · · ·
n
3
3
3
"
#
2
3
2
1
1
1
= n 1 + n +
+
+ ···
3
3
3n
3n
=
2
·
3n
1
1
1− n
3
=
3n
2
∈ Γ,
−1
y por simetría, 1 − 3n2−1 ∈ Γ para todo n ∈ N. Por supuesto, los múltiplos
1
2
3m (1 − 3n −1 ) están en Γ para todo m, n ∈ N.
1
3m
·
2
3n − 1
y
224
Cap. 5 El Conjunto de Cantor y su Media Hermana
(K8 ) Γ es perfecto, es decir, es cerrado y no posee puntos aislados.
Ya hemos visto que Γ es cerrado. Para demostrar que él no posee puntos aislados es
suficiente comprobar que el conjunto
∞
[
ext(Γ) =
n =1
es denso en Γ. En efecto, sea x =
que 3− N < ε. Si ahora definimos
P∞
n =1 c n 3
sN
−n
ext(Γn ) ⊆ Γ
∈ Γ. Dado ε > 0, escojamos un N ∈ N tal
N
X
cn
=
,
3n
n =1
resulta, por (5.1.1), que s N ∈ ext(Γ) y así,
|x − sN | =
∞
X
cn
≤
3n
n = N +1
∞
X
n = N +1
2
1
= N < ε.
n
3
3
Esto termina la prueba.
Observe que de lo anterior también se obtiene, como caso particular, que el conjunto G =
[0, 1] \ Γ es denso en Γ.
(K9 ) Γ + Γ = [0, 2]
y
Γ − Γ = [−1, 1].
Prueba. ( a) Veamos que Γ + Γ = [0, 2]. Observe, en primer lugar, que
1
Γ =
2
(
)
∞
X
an
: an ∈ {0, 1} para todo n ≥ 1 .
3n
n =1
De esto se concluye que
1
1
Γ+ Γ =
2
2
(
=
(
∞
X
a n + bn
: an , bn ∈ {0, 1} para todo n ≥ 1
3n
n =1
∞
X
dn
n =1
3n
)
)
: dn ∈ {0, 1, 2} para todo n ≥ 1
= [0, 1]
y, por lo tanto, Γ + Γ = [0, 2].
(b) Veamos ahora que Γ − Γ = [−1, 1].
En efecto, es claro que Γ − Γ ⊆ [−1, 1]. Para demostrar la otra inclusión necesitamos definir,
para cada n ∈ N, el conjunto
Rn =
(
)
n
X
ak
x ∈ [0, 1] : x =
, ak ∈ {0, 1, 2} .
3k
k=1
Sec. 5.1 Representaciones Ternarias y Binarias
225
Nuestra primera tarea será demostrar que
Rn ⊆ Γ − Γ.
para todo n ≥ 1. Usaremos, para ello, inducción sobre n. Observe que si x ∈ Γ, entonces
x = x − 0 ∈ Γ − Γ, por lo que sólo es necesario analizar los elementos de Rn que no forman
parte de Γ. Para n = 1, se cumple
1 2
R1 = 0, ,
⊆ Γ
3 3
y, por lo tanto, R1 ⊆ Γ − Γ. Para n = 2, nuestro conjunto R2 contiene nueve elementos, a
saber,
1 2 1 2 1
1 1
2 2
1 2
2
R2 = 0, , , 2 , 2 , + 2 , + 2 , + 2 , + 2
3 3 3 3 3 3 3 3 3 3 3 3
Nótese que, gracias a la definición de ext(Γ), todas las fracciones de R2 pertenecen a Γ
salvo 13 + 312 y 13 + 322 las cuales se pueden expresar en la forma
1
1
+ 2 = (0, 11000 . . . )3 = (0, 2000 . . . )3 − (0, 0200 . . . )3 ∈ Γ − Γ
3 3
1
2
+
= (0, 12000 . . . )3 = (0, 2200 . . . )3 − (0, 0222 . . . )3 ∈ Γ − Γ
3 32
Por esto, R2 ⊆ Γ − Γ.
En general, suponga que para k = n − 1 se cumple que Rn−1 ⊆ Γ − Γ y sea x =
(0, a1 . . . an )3 cualquier elemento de Rn con an 6= 0. Por lo observado anteriormente,
supondremos que x 6∈ Γ. Como
x = (0, a1 . . . an−1 )3 +
an
3n
resulta de nuestra hipótesis que existen rn−1 y qn−1 en Γ tal que
(0, a1 . . . an−1 )3 = rn−1 − qn−1
Pongamos
rn−1 = (0, b1 . . . bn−1 . . .)3
y
qn−1 = (0, c1 . . . cn−1 . . .)3 ,
donde los dígitos b1 , c1 , b2 , c2 , . . . ∈ {0, 2}. Es importante destacar que, en la representación
anterior, rn−1 siempre se puede elegir en la forma
(0, b1 . . . bn−1 000 . . . )3 .
Por esto, (0, a1 . . . an−1 )3 se puede escribir como
(1) (0, a1 . . . an−1 )3 = (0, b1 . . . bn−1000 . . . )3 − (0, c1 . . . cn−1 0000 . . . )3 con cn−1 6= 0,
aunque bn−1 puede ser 0, o
(2) (0, a1 . . . an−1 )3 = (0, b1 . . . bn−1000 . . . )3 − (0, c1 . . . cn−1 0222 . . . )3 .
226
Cap. 5 El Conjunto de Cantor y su Media Hermana
Si an = 2, simplemente hacemos bn = 2 y entonces se tiene que
(0, a1 . . . an−1 2)3 = (0, b1 . . . bn−1 200 . . . )3 − (0, c1 . . . cn−10000 . . . )3
pertenece a Γ − Γ. Por otro lado, si an = 1, podemos escribir
(0, a1 . . . an−1 1)3 = (0, b1 . . . bn−12000 . . . )3 − (0, c1 . . . cn−1 0222 . . . )3
o
(0, a1 . . . an−1 1)3 = (0, b1 . . . bn−1000 . . . )3 − (0, c1 . . . cn−1 cn 000 . . . )3 .
Esto completa la prueba del paso inductivo.
Para terminar la demostración, sea x ∈ [0, 1] y suponga que su representación ternaria no
es finita, es decir, x 6∈ Rn para todo n ≥ 1. Pongamos, x = (0, a1 a2 . . .)3 y observe que
x = lı́m pn ,
n→∞
donde pn = (0, a1 a2 . . . an )3 ∈ Rn para todo n ≥ 1. De la discusión anterior sabemos que,
por cada n ∈ N, existen rn y qn en Γ tales que pn = rn − qn . Ahora bien, puesto que Γ es
compacto, se sigue del Teorema de Bolzano-Weierstrass que existe una subsucesión (rn j )∞
j=1
∞
de (rn )∞
n =1 convergiendo a un único punto r ∈ Γ. La correspondiente subsucesión ( qn j ) j=1
∞
de (qn )∞
n =1 también posee una subsucesión ( qn ji ) i=1 que converge a un punto q ∈ Γ. Puesto
que toda subsucesión de una sucesión convergente converge al mismo punto, se tiene que:
x = lı́m pn ji = lı́m rn ji − qn ji = r − q ∈ Γ − Γ
i→∞
i→∞
Finalmente, si x ∈ [−1, 0], entonces − x ∈ [0, 1] y por lo anterior, existen r, q ∈ Γ tal que
x = r − q. Por esto, − x = q − r ∈ Γ − Γ y, en consecuencia,
[−1, 1] ⊆ Γ − Γ.
Esto termina la prueba.
5.1.5. Conjuntos Tipo-Cantor de Medida Cero
El siguiente es un procedimiento más general que el anterior para producir conjuntos tipoCantor de medida cero. Fijemos un α ∈ (0, 1) y sea β = 1−2 α . Nótese que β ∈ (0, 1/2) ya
que
1
0 < α < 1 ⇒ −1 < − α < 0 ⇒ 0 < 1 − α < 1 ⇒ 0 < β < .
2
Considere ahora las funciones T0 , T1 : [0, 1] → [0, 1] definidas por
T0 ( x) = βx
y
T1 ( x) = βx + (1 − β).
Pongamos K0 = [0, 1] y para cada entero n ≥ 1, defina
Kn = T0 (Kn−1 ) ∪ T1 (Kn−1 ).
Si definimos
β
Γα
=
∞
\
n =1
Kn ,
Sec. 5.1 Representaciones Ternarias y Binarias
227
entonces se obtiene un conjunto con características similares al conjunto ternario de Cantor al que
llamaremos un conjunto tipo-Cantor de medida cero. Observe que cuando α = 1/3, entonces
β = 1/3 obteniéndose el conjunto ternario de Cantor, es decir, Γ = Γ1/3
1/3 .
¿Cómo son, realmente, los conjuntos Kn ? Si uno mira cuidadosamente la definición anterior,
se observa que
T0 ([0, 1]) = [0, β]
y
T1 ([0, 1]) = [1 − β, 1],
de modo que
K1 = [0, β] ∪ [1 − β, 1].
Otra manera de describir el conjunto K1 consiste en remover del centro de [0, 1] el intervalo abierto ( β, 1 − β) de longitud 1 − 2β = α, quedando dos intervalos cerrados cada uno de
longitud β. De nuevo, nótese que
T0 (K1 ) = 0, β2 ∪ β(1 − β), β ,
T1 (K1 ) = 1 − β, β2 + (1 − β) ∪ (1 − β) + β(1 − β), 1
por lo que el conjunto K2 se expresa en la forma:
K2 =
0, β2 ∪ β(1 − β), β ∪ 1 − β, β2 + (1 − β) ∪ (1 − β) + β(1 − β), 1
Observe que K2 se obtiene de K1 removiendo del centro de cada uno de los intervalos cerrados
de K1 un intervalo abierto de longitud αβ. Cada uno de los cuatro intervalos cerrados que definen a K2 tiene longitud β2 , por lo que la longitud de K2 es 22 β2 = (1 − α)2 . En general, Kn
es la unión disjunta de 2n intervalos cerrados cada uno de longitud βn y Kn+1 se obtiene eliminando del centro de cada intervalo de Kn un intervalo abierto de longitud αβn . Por supuesto, la
colección (Kn )∞
n =1 es una sucesión decreciente de subconjuntos compactos de [0, 1] que posee la
β
propiedad de intersección finita y, en consecuencia, por la compacidad de [0, 1], resulta que Γα
β
es no vacío, compacto, nunca-denso y perfecto. ¿Cuál es la longitud o medida de Γα ? De nuestro
análisis sabemos que la longitud de cada conjunto Kn es 2n βn y, en consecuencia, la longitud
β
total de Γα es menor o igual a 2n βn . Sin embargo, como β ∈ (0, 1/2), se tiene que 2β < 1 y,
por lo tanto, la longitud de Kn tiende a cero cuando n tiende a infinito, lo cual quiere decir que
β
la medida de Γα es cero (véase el Corolario 6.3.47, página 287). Otra modo de calcular la medida
β
de Γα es observar que la suma de las longitudes de todos los intervalos que se eliminaron en su
construcción es:
∞
X
n =1
ℓ( Jn ) = α + 2(αβ) + · · · + 2n (αβn ) + · · ·
= α(1 + 2β + · · · + (2β)n + · · · ) = α ·
1
= 1
1 − 2β
β
de modo que la medida de Γα es cero.
β
Teorema 5.1.6. Sea ext(Γα ) el conjunto de los puntos extremos de todos los intervalos abiertos removidos
β
en la construcción de Γα . Entonces
β
β
ext(Γα ) = Γα .
228
Cap. 5 El Conjunto de Cantor y su Media Hermana
β
β
β
β
β
Prueba. Sabemos que ext(Γα ) ⊆ Γα y como Γα es cerrado, entonces ext(Γα ) ⊆ Γα . Para deβ
β
mostrar la otra inclusión, sea x ∈ Γα y seleccionemos un ε > 0 arbitrario. Puesto que Γα es un
β
β
conjunto perfecto, x es un punto límite de Γα , lo cual significa que ( x − ε, x + ε) ∩ Γα 6= ∅ contieβ
ne infinitos puntos. Fijemos un y ∈ ( x − ε, x + ε) ∩ Γα y suponga que x < y. Observe que gracias
β
a que Γα no contiene intervalos (por ser nunca-denso), entonces entre el punto x y el punto y
β
existe uno de los intervalos que fue removido en algún paso de la construcción de Γα . Denotemos a tal intervalo por ( ak , bk ). Puesto que y ∈ ( x − δ, x + δ), resulta que x ∈ ( ak − ε, ak + ε) y
x ∈ (bk − ε, bk + ε). Esto nos indica que x es un punto límite de ak y bk . Como la elección del
β
β
β
intervalo se hizo de modo arbitrario, se sigue que x ∈ ext(Γα ). Esto muestra que Γα ⊆ ext(Γα ) y
termina la prueba.
Por supuesto, existen otros procedimientos distintos al anterior para generar conjuntos tipoCantor de medida cero. Por ejemplo, divida el intervalo [0, 1] en 5 partes iguales y remueva los
intervalos abiertos que ocupan el 2do y 4to lugar. Repita el paso anterior con los 3 intervalos
cerrados que permanecen y elimine el 2do y el 4to intervalos abiertos en cada uno de ellos.
Continúe. La intersección de todos los intervalos cerrados que permanecen en cada etapa del
proceso es otro conjunto tipo-Cantor que posee las mismas propiedades que el conjunto ternario
de Cantor; en particular, su medida también es nula.
β
Nota Adicional 5.1.1 Aunque parezca extraño, los conjuntos tipo-Cantor Γα que acabamos de
construir son más interesantes y útiles para los números β. La razón de por qué ello es
β
así radica en el hecho de que 1/β es un factor de escalamiento de Γα , en otras palabras,
β
β
β−1 (Γα ∩ [0, β]) = Γα . También es importante destacar que cuando α decrece hacia cero, β
β
crece hacia 1/2 y, en consecuencia, los conjuntos tipo-Cantor Γα se hacen “más grandes”.
Esta idea, que no es tan inmediata de verificar, se puede precisar usando la noción de “diβ
mensión fractal”. Es importante observar que el hecho de Γα se hace más grande a medida
que β se aproxime a 1/2 no puede ser probado usando el argumento de cardinalidad ya
que tales conjuntos poseen la misma cardinalidad, ni tampoco con un argumento de Teoría
de la Medida pues todos ellos poseen medida cero.
β
Observe que los valores de α y β elegidos en el proceso para generar el conjunto Γα se
pueden tomar de un modo más general, es decir, siempre se pueden elegir cualquier par
números α, β ∈ (0, 1) tal que α + β < 1.
β
Otro hecho curioso que relaciona el conjunto tipo-Cantor Γα con la Teoría de Números es
el siguiente problema geométrico formulado por Roger L. Kraft en [81]: Dado β ∈ (0, 1/2),
¿es posible encontrar un λ ∈ (0, 1) de modo que
β
β
Γ α ∩ λ · Γ α = {0} ?
(K)
√
Kraft demostró que β0 = (3 − 5)/2 es un valor crítico a la solución de dicho problema.
Esto significa que si β < β0 , el problema (K) posee una solución, mientras que, si β ≥ β0 ,
entonces dichos conjuntos son ahora demasiados grandes para proveer una solución. De
β
β
hecho, Kraft demuestra que, en este caso, la cardinalidad de Γα ∩ λ · Γα es infinita. Pero,
¿qué tiene de especial el valor β0 ? Bueno, es aquí donde aparece sun conexión con la Teoría
de Números. En primer lugar, nótese que
√
3− 5
= ( φ ′ )2
β0 =
2
Sec. 5.1 Representaciones Ternarias y Binarias
229
donde φ′ es el número de oro negativo. Más aun, si α0 es el valor asociado a β0 , entonces
√
√
β0
β0
(3 − 5)/2
1+ 5
√
=
=
=
= φ.
α0
1 − 2β0
2
1 − (3 − 5)
donde φ es el número de oro positivo. Pero, ¿qué es el número de oro? Recordemos
que el número de √
oro es la raíz positiva de la ecuación cuadrática x2 − x − 1 = 0, cuyo
valor es φ = (1 + 5)/2. Ésta ecuación se obtiene, geométricamente, del modo siguiente:
Un segmento de línea de longitud, digamos 1, es dividido en dos partes por un punto
x ∈ (0, 1)
0
|
x
|
1
|
Suponga que el segmento más largo tiene longitud x. Diremos que el segmento [0, 1] está
divido en la razón áurea o radio de oro si la relación
x
1
=
1−x
x
( 1)
se cumple, es decir, el subsegmento más largo está relacionado al más pequeño exactamente
como el segmento total está relacionado al segmento más largo. Existe, por supuesto, un
único número x ∈ (0, 1) que satisface la ecuación (1). Si hacemos la sustitución φ = 1/x
en la igualdad (1) ella nos conduce a la ecuación cuadrática
φ2 − φ − 1 = 0.
√
√
cuyas raíces son (1 + 5)/2 y (1 − 5)/2. La raíz positiva usualmente se denota por el
símbolo φ y la negativa por φ′ . Al número x = φ se le conoce como el número de oro. Este
número tiene una importancia fundamental en muchas áreas del conocimiento humano.
Por ejemplo en el arte, la arquitectura, la música, la biología, la matemática, etc.
5.1.6. Conjuntos Tipo-Cantor de Medida Positiva
El conjunto ternario de Cantor fue construido removiendo, en cada etapa de su construcción,
2n−1 intervalos abiertos, cada uno de ellos de longitud 3−n . En la sección anterior vimos como
se construían conjuntos tipo-Cantor de medida cero para cualquier α ∈ (0, 1). Lo que también
resulta sorprendente es que se pueden construir conjuntos tipo-Cantor con medida positiva. Por
supuesto, el procedimiento para lograrlo va a depender del tamaño de los intervalos abiertos
que hay que eliminar en cada paso. La siguiente colección de conjuntos, que denotaremos por
(Γα )α∈(0,1) , similares al proceso de construcción del conjunto ternario de Cantor, poseen propiedades idénticas con una única excepción: tales conjuntos poseen medida positiva.
(k◮ Γα ) Fijemos un α ∈ (0, 1). Tal y como se procedió en la construcción del conjunto ternario
de Cantor, removamos del centro de [0, 1] un intervalo abierto de longitud α/2, digamos,
1
α 1
α
J1 (1) =
− , +
2 22 2 22
230
Cap. 5 El Conjunto de Cantor y su Media Hermana
y denotemos por Γ1 (α) la unión de los dos intervalos cerrados que permanecen, esto es,
1
α
1
α
Γ1 (α) = F11 ∪ F12 = 0, − 2 ∪
+ 2, 1 .
2 2
2 2
Elimine del centro de F11 , así como de F12 , los intervalos abiertos
1
3
3α 1
α
α 3
3α
J2 (1) =
−
−
+
+
,
y
J
2
)
=
,
(
2
22
22 24 22
24 22 24
24
y observe que la longitud de cada uno de ellos es α/23 . Denote por Γ2 (α) la unión de los cuatro
intervalos cerrados que quedan, vale decir, Γ2 (α) = F21 ∪ F22 ∪ F23 ∪ F24 , donde
1
3α
1
α 1
α
−
,
−
F21 = 0, 2 − 4
F22 =
2
2
22 24 2 22
α 3
α
3α
1
3
+ ,
+
F24 =
+ 4, 1
F23 =
2 22 22 24
22
2
Observe que la longitud de cada uno de estos intervalos cerrados es 212 (1 − 12 α − 212 α). Repitamos,
una vez más, el proceso anterior a cada uno de los intervalos cerrados que conforman a Γ2 (α)
removiendo de su centro un intervalo abierto de longitud α/25 y denotemos por Γ3 (α) la unión
de los 23 intervalos cerrados que quedan. Continuando indefinidamente con este procedimiento
se obtiene una sucesión decreciente de conjuntos compactos (Γn (α))∞
n =1 , donde cada Γ n ( α ) es la
n
unión disjunta de 2 intervalos cerrados y acotados. Definamos finalmente
Γα =
∞
\
Γ n ( α ).
n =1
Por el Corolario 2.2.35 sabemos que Γα 6= ∅. A Γα lo llamaremos un conjunto tipo-Cantor o
conjunto SVC(α) de medida positiva. En la literatura sobre el tema, a tales conjuntos también se
les llaman conjuntos gordos de Cantor. La propiedades del conjunto Γα (y sus demostraciones)
son similares a la del conjunto ternario de Cantor con la excepción de que ellos poseen medida
positiva, esto es,
(1) Γα es compacto, nunca-denso, perfecto y totalmente disconexo.
(2) µ(Γα ) = 1 − α > 0. Para verificar esto, observe que como
[0, 1] \ Γα =
∞
[
Jnα ,
n =1
donde cada Jnα es la unión disjunta de los 2n−1 intervalos abiertos borrados en la etapa
n-ésima, cada uno de los cuales posee longitud α/22n−1 , se tiene entonces que:
∞
X
α
α
α
α
α
ℓ( Jnα ) =
+ 2 3 + 22 5 + 23 7 + · · · + 2n−1 2n−1 + · · ·
2
2
2
2
2
n =1
X
∞
1
= α·
= α.
2n
n =1
De esto se sigue que µ(Γα ) = 1 − α > 0. De nuevo, estas afirmaciones deben ser formalmente
justificadas a través de la noción de medida que introduciremos en el siguiente capítulo (véase
el Ejemplo 6.4.2, página 306).
Sec. 5.1 Representaciones Ternarias y Binarias
231
En particular, Γα es no-numerable.
Otros conjuntos tipo-Cantor con medida positiva se pueden construir argumentando del modo
siguiente:
(k◮ Γα0 ) Para cada n ≥ 3, el conjunto SVC(n) se construye removiendo, en el k-ésimo paso
de la iteración, un intervalo abierto de longitud 1/nk del centro de cada uno de los intervalos
cerrados obtenidos en el paso anterior. La intersección de todos los intervalos cerrados que
permanecen en cada paso es el conjunto SVC(n). Estos conjuntos son compactos, perfectos,
nunca-densos y de medida positiva cuando n > 3:
µ(SVC(n)) = µ [0, 1] − µ SVC(n)c
= 1−
= 1−
1
2
22
− 2 − 3 −···
n n
n
1
1
n−3
=
.
n 1 − 2/n
n−2
(k◮ Γ1α ) Fijemos, como antes, un α ∈ (0, 1). En la construcción de Γα removimos, en cada
etapa, intervalos abiertos de longitud α/22n+1 . Si en su lugar eliminamos intervalos que tengan longitud α/3n , entonces el conjunto Γ1α que se construye posee exactamente las mismas
propiedades que las obtenidas en el caso anterior. En particular, µ(Γ1α ) = 1 − α.
(k◮ Γ2α ) Fijemos α ∈ (3, +∞) y, como antes, comience eliminando del centro de [0, 1] un
intervalo abierto de longitud 1/α. Luego, elimine un intervalo abierto de longitud 1/α2 del
centro de cada uno de los dos intervalos cerrados que quedaron y así sucesivamente. El conjunto
tipo-Cantor Γ2α que se construye intersectando la sucesión decreciente de los conjuntos compactos
que se van formando en cada paso es compacto, nunca-denso, perfecto, totalmente disconexo y
de medida (α − 3)/(α − 2). En efecto,
∞
X
1
1
1
1
+ 2 2 + 22 3 + · · · + 2n−1 n + · · ·
α
α
α
α
∞
n
1X 2
1
2
1
=
= ·
=
.
2
α
2 α−2
α−2
ℓ( Jnα ) =
n =1
n =1
Luego,
µ(Γ2α )
= 1−
1
α −2
=
α −3
α −2 .
(k◮ Γ3α ) Seleccione un α ∈P(0, 1) y sea ( an )∞
n =1 una sucesión estrictamente creciente de núme∞
ros reales positivos tal que
a
=
α.
Sea
J11 un intervalo abierto de longitud a1 removido
n =1 n
del centro de [0, 1]. De los dos intervalos cerrados restantes, remueva del centro de cada uno
de ellos intervalos abiertos J21 , J22 de longitud total a2 , es decir, ℓ( J21 ) + ℓ( J22 ) = a2 . Si se contik −1
núa indefinidamente con este proceso, se obtiene una colección numerable { Jn2 : n ∈ N } de
intervalos abiertos disjuntos dos a dos tal que
∞
X
ℓ( Jn ) = ℓ( J11 ) + ℓ( J21 ) + ℓ( J22 ) + ℓ( J31 ) + ℓ( J32 ) + ℓ( J33 ) + ℓ( J34 ) + · · ·
| {z } |
{z
} |
{z
}
n =1
a1
a2
= a1 + a2 + a3 + · · · = α,
a3
232
Cap. 5 El Conjunto de Cantor y su Media Hermana
S
S
k −1
donde Jn = nk=1 Jn2
para cada n ∈ N. El conjunto Γ3α = [0, 1] \ ∞
n =1 Jn es un conjunto
tipo-Cantor cuya medida es 1 − α > 0.
(k◮ Γ4α ) Sea J cualquier subintervalo cerrado y acotado de R con µ( J ) > 0 y sea α ∈ [0, µ( J )).
Seleccione una sucesión ( an )∞
n =1 de números reales positivos tal que
∞
X
n =1
2n − 1 a n = µ ( J ) − α
y, como en el ejemplo anterior, en el primer paso, remueva del centro de J un intervalo abierto
de longitud a1 . De los dos intervalos cerrados que permanecen, remueva del centro de cada uno
de ellos un intervalo abierto de longitud a2 y continúe. Sea G la unión (disjunta) de todos los
intervalos abiertos que fueron removidos. Entonces
µ( G ) = a1 + 2a2 + 22 a3 + · · · + 2n−1 an + · · · = µ( J ) − α.
El conjunto Γ4α = J \ G es un conjunto tipo-Cantor de medida α.
Observe que si J = [0, 1] y an = 3−n para todo n ∈ N, entonces Γ4α con α = 0, es el conjunto
ternario de Cantor.
5.1.7. La Función de Cantor
El conjunto ternario de Cantor y sus hermanos, los conjuntos tipo-Cantor, pueden ser usados para construir funciones muy especiales y, por supuesto, tan fascinantes como los mismos
conjuntos de Cantor. Tales funciones constituyen un contraejemplo a un número de situaciones
diversas en la Teoría de la Medida e Integración
Existen variadas formas de definir la así llamada función de Cantor, función de CantorLebesgue o escalera del Diablo. En esta sección esbozaremos cuatro modos distintos de presentar
dicha función. Comencemos:
(1a ) Definición. Fijemos n ∈ N y sean
Γn = Fn1 ∪ · · · ∪ Fn2n
y
Jn = Jn (1) ∪ · · · ∪ Jn (2n − 1)
la unión de todos los intervalos cerrados que permanecen, (respectivamente, todos los intervalos
abiertos que fueron eliminados) en la n-ésima etapa en la construcción de Γ. Nótese que J1 ⊆
J2 ⊆ · · · ⊆ Jn ⊆ · · · y, además,
Jn+1 (2k) = Jn (k)
para k = 1, 2, . . . , 2n − 1.
Definición 5.1.7. Para cada n ∈ N, sea ϕn : [0, 1] → R la función continua definida del modo
siguiente:
( a ) ϕ n ( 0) = 0
y
ϕn (1) = 1.
(b) ϕn ( x) = k/2n para todo x ∈ Jn (k), donde k = 1, 2, . . . , 2n − 1.
(c) ϕn es lineal sobre cada uno de los intervalos cerrados Fnk que conforman a Γn .
Sec. 5.1 Representaciones Ternarias y Binarias
233
Observe que ϕn es constante sobre cada uno de los subintervalos abiertos Jn (k) que definen
a Jn , tomando el valor 1/2n sobre Jn (1), el valor 2/2n sobre Jn (2), hasta alcanzar el valor
(2n − 1)/2n sobre Jn (2n − 1).
Las funciones ϕn se pueden describir explícitamente del modo siguiente: comenzando con la
función identidad, esto es, ϕ0 ( x) = x para todo x ∈ [0, 1] , entonces

1

si 0 ≤ x ≤ 13

2 · ϕ n (3x )


1
ϕ n +1 ( x ) =
si 13 < x < 23
2



 1 + 1 · ϕ (3x − 2) si 2 ≤ x ≤ 1
2
2
n
3
para cada n ∈ N0 .
1 −
7
23
−
6
23
−
5
23
−
4
23
−
3
23
−
2
23
−
1
23
−
0
ϕ3
ϕ1
ϕ2
1 2 1
33 33 32
2 7 8 1
32 33 33 3
2 19 20 7
3 33 33 32
8 25 26
32 33 33
1
En el gráfico de arriba se muestran las funciones ϕ1 , ϕ2 y ϕ3 . Es interesante observar que, en
el intervalo [0, 1/3] la diferencia entre ϕ2 y ϕ1 no excede a 212 , ϕ1 ( x) = ϕ2 ( x) si x ∈ (1/3, 2/3)
y en el intervalo [2/3, 1] el comportamiento de ϕ2 y ϕ1 es el mismo que en el intervalo [0, 1/3],
excepto que sus gráficas son desplazadas hacia arriba por una misma constante, la cual se cancela
cuando uno toma la diferencia ϕ2 − ϕ1 . Similarmente, la diferencia entre ϕ3 y ϕ2 sobre el
intervalo [0, 1/32 ] no excede a 213 y, como antes, su comportamiento sobre cada uno de los
los intervalos [2/32 , 1/3], [2/3, 7/32 ] y [8/32 , 1] son los mismos que en [0, 1/32 ] y la igualdad
ϕ2 ( x) = ϕ3 ( x) se cumple para todo x ∈ J3 . Este razonamiento nos lleva a la conclusión de
que para entender la diferencia entre ϕn y ϕn+1 basta con analizarla en cualquier intervalo de
234
Cap. 5 El Conjunto de Cantor y su Media Hermana
[0, 1] \ Jn = Γn . En particular, podemos considerar, sin perder generalidad en el razonamiento, el
intervalo [0, 1/3n ] para saber cómo está acotada la diferencia ϕn − ϕn+1 . Nótese que sobre dicho
n
intervalo se tiene que ϕn ( x) = 32n x para todo x ∈ [0, 1/3n ], mientras que ϕn+1 viene dada por
 n +1
3



x
si x ∈ [0, 1/3n+1 ]

n +1

2



1
ϕ n +1 ( x ) =
si x ∈ [1/3n+1 , 2/3n+1 ]
n
+1

2




n +1


 1 + 3
x
si x ∈ [2/3n+1 , 3/3n+1 ]
2n + 1
2n + 1
Puesto que la igualdad
ϕ n +1 ( x ) = ϕ n ( x )
se cumple para todo x ∈ Jn y cada n ∈ N, se deduce fácilmente que
n
o
k ϕn+1 − ϕn k∞ = sup | ϕn+1 ( x) − ϕn ( x)| : 0 ≤ x ≤ 1
n
o
= sup | ϕn+1 ( x) − ϕn ( x)| : 0 ≤ x ≤ 1/3n
≤
1
2n + 1
.
Otro aspecto que hay que observar es que ϕn es inyectiva sobre Γn y ϕn (Γn ) = [0, 1] para
todo n ≥ 1.
Teorema 5.1.8. La sucesión de funciones ( ϕn )∞
n =1 converge uniformemente sobre [0, 1].
P
n
Prueba. Sea ε > 0. Teniendo en cuenta que la serie ∞
sigue del Criterio de
n =1 1/2 converge, seP
m −1
k
Cauchy para Series que existe un N ∈ N tal que si m > n ≥ N, entonces
k= n +1 1/2 < ε. De
esto último se concluye que si m > n ≥ N, entonces
k ϕ m − ϕ n k∞ ≤
m
−1
X
k= n +1
k ϕ k+1 − ϕ k k ∞ ≤
m
−1
X
k= n +1
1
< ε
2k
y así, gracias al Teorema 3.1.42, la sucesión ( ϕn )∞
n =1 converge uniformemente sobre [0, 1].
Definición 5.1.9. La función ϕΓ : [0, 1] → [0, 1] definida por
ϕΓ ( x) = lı́m ϕn ( x)
n→∞
para todo x ∈ [0, 1], es llamada la función de Cantor, función de Cantor-Lebesgue o escalera del
Diablo.
(2a ) Definición. La siguiente definición de ϕΓ se apoya sobre la integral de Riemann. Para cada
Sn
n ≥ 1, considere, como antes, el conjunto Γn = 2k=1 Fnk y defina f n : [0, 1] → R por
 n

n
 3
si x ∈ Γn
3
2
f n ( x) =
· χΓn ( x) =

2
 0
si x 6∈ Γn .
Sec. 5.1 Representaciones Ternarias y Binarias
235
La función f n es claramente discontinua en un conjunto finito de puntos y, por lo tanto, es
Riemann integrable gracias al Teorema de Vitali-Lebesgue (véase, (TVL4 ), página 424). Apoyándonos en esta información podemos definir la función ϕn : [0, 1] → R declarando que
Z x
ϕn ( x) =
f n (t) dt.
0
El Teorema Fundamental del Cálculo nos asegura que cada función ϕn es Lipschitz y, en particular, continua. Observe también que
n Z 1
n
Z 1
3
3
ϕ n ( 0) = 0
y
ϕ n ( 1) =
f n (t) dt =
χΓ (t) dt =
· ℓ(Γn ) = 1.
n
2
2
0
0
Tenemos entonces que ϕn es una función continua con ϕn (0) = 0 y ϕn (1) = 1 para cada n ≥ 1.
Nótese que ϕn es constante sobre [0, 1] \ Γn y, además, lineal con pendiente ( 23 )n sobre cada
Fnk ⊆ Γn . Esto nos indica que cada ϕn es monótona creciente. Sobre cada conjunto Fnk ⊆ Γn se
tiene que f n ( x) = ( 32 )n para todo x ∈ Fnk , mientras que f n+1 ( x) = ( 32 )n+1 = ( 32 )n f n ( x) para x
en el primer tercio o último tercio de Fnk , e igual a cero en el tercio del centro. Se sigue de esto
que
Z
Z
f n (t) dt =
Fnk
Fnt
f n+1 (t) dt = 2−n .
( 1)
Puesto que f n ( x) = f n+1 ( x) para todo x 6∈ Γn , resulta que si α es un punto extremo arbitrario
en cualquiera de los intervalos que conforman a Γn , entonces
Z α
Z α
f n (t) dt =
f n+1 (t) dt,
( 2)
0
0
de donde se obtiene
ϕ n +1 ( x ) = ϕ n ( x )
y, en consecuencia,
para todo x ∈ Γn
ϕ n ( x ) − ϕ n + 1 ( x ) < 2− n + 1
para todo x ∈ [0, 1] .
Lo anterior nos revela que la sucesión ( ϕn )∞
n =1 es uniformemente de Cauchy y, en consecuencia,
converge uniformemente a un función continua ϕΓ : la función de Cantor.
(3a ) Definición. Esta es otra forma de definir a ϕΓ usando la representación ternaria de los
puntos en [0, 1]. Sea x ∈ [0, 1] y exprese dicho número en su representación ternaria habitual,
digamos
∞
X
an ( x )
x =
,
3n
n =1
donde an ( x) ∈ {0, 1, 2} para todo n ≥ 1. Si x 6∈ Γ, entonces existe al menos un n ∈ N tal que
an ( x) = 1. Sea n x el entero positivo más pequeño para el cual an x ( x) = 1. Si x ∈ Γ, entonces
todos los an ( x) son distintos de 1 y, por lo tanto, convenimos en tomar n x = +∞. Este análisis
permite definir la función de Cantor ϕΓ : [0, 1] → R por
n x −1
1
1 X
an ( x )
ϕΓ ( x) = n +
.
x
2
2
2n
k=1
236
Cap. 5 El Conjunto de Cantor y su Media Hermana
Observe que si x ∈ Γ, la igualdad anterior toma la forma
ϕΓ ( x) =
∞
1 X an ( x )
,
2
2n
k=1
donde an ( x) ∈ {0, 2} para todo n ≥ 1.
(4a ) Definición. Otra forma
de definir la función de Cantor se obtiene de la siguiente
P equivalente
2an
manera: para cada x = ∞
∈
Γ,
donde
an ∈ {0, 1}, defina
n = 1 3n
X
∞
∞
X
2an
an
=
ϕΓ ( x) = ϕΓ
n
3
2n
n =1
n =1
y extienda ϕΓ a todo [0, 1] poniendo
ϕΓ ( x) = sup ϕΓ (y) : y ∈ Γ, y ≤ x
( ∞
)
∞
X an
X
2an
= sup
:
≤ x, an ∈ {0, 1} ,
2n
3n
n =1
n =1
para todo x ∈ [0, 1].
El siguiente resultado muestra algunas de las características más importantes de la función de
Cantor.
Corolario 5.1.10. La función de Cantor ϕΓ es continua, creciente y sobreyectiva. Además, ϕ′ ( x) = 0
Γ
para todo x ∈ [0, 1] \ Γ.
Prueba. Sea ( ϕn )∞
n =1 la sucesión de funciones continuas definidas anteriormente. Por el Teorema 5.1.8 sabemos que ϕn → ϕΓ uniformemente y, entonces, el Teorema 3.1.40, página 177, nos
garantiza que ϕΓ es continua sobre [0, 1] y, por supuesto, creciente y sobreyectiva ya que cada
ϕn posee esas propiedades. Para demostrar que ϕ′Γ ( x) = 0 para todo x ∈ [0, 1] \ Γ, observe que
ϕΓ es constante en cada uno de los intervalos abiertos borrados en la construcción de Γ y, por lo
tanto, ϕ′Γ ( x) = 0 para todo x ∈ [0, 1] \ Γ.
5.2. Problemas
(1) Un número x ∈ [0, 1] es llamado normal si éste posee una representación binaria (0, x1 x2 . . .)2
tal que
sn ( x )
1
lı́m
= ,
n→∞
n
2
donde sn ( x) = card({1 ≤ i ≤ n : xi = 0}). Si E denota el conjuntos de todos los números
normales, demuestre que
∞ [
∞ \
∞
\
E =
Bn,k ,
k=1 n =1 m = n
donde
Bn,k =
(
x ∈ [0, 1] :
)
sn ( x ) 1
1
−
<
.
n
2
k
Sec. 5.2 Problemas
(2) Sea ( an , bn )
∞
237
los intervalos componentes del conjunto abierto [0, 1] \ Γ. Sean
1
=
( a i + bi ) : i ∈ N
y
Pd = bi : i ∈ N
2
n =1
Pm
Pruebe que Pm es un Gδ , pero que Pd no lo es.
(3) Pruebe que existe una función monótona f : Γ → R que no es diferenciable en ningún punto
de Γ.
(4) Pruebe que, para cada n ∈ N, el conjunto
n
X
ck
Fn = x ∈ [0, 1] : x =
, con ck ∈ {0, 2} para todo k = 1, . . . , n
3k
k=1
consiste de todos los extremos izquierdos de los subintervalos que conforman a Γn en la
construcción del conjunto ternario de Cantor. Concluya que Γn se puede representar en la
forma:
[ 1
Γn =
x, x + n .
3
x ∈ Fn
(5) Conjunto n-ario de Cantor. Sea n = 2m + 1, m = 1, 2, . . . y como antes, sea Γ0 = [0, 1]. Divida el intervalo [0, 1] en n subintervalos de igual longitud y elimine los intervalos abiertos
1 2
3 4
n−2 n−1
,
,
,
, ... ,
,
.
n n
n n
n
n
Sea
Γ1 =
1
2 3
n−1
0,
∪ ,
∪···∪
,1
n
n n
n
los intervalos que permanecen. Observe que Γ1 contiene m + 1 intervalos. A cada uno de
los intervalos que forman a Γ1 divídalos en n subintervalos de igual longitud y remueva
de ellos los intervalos abiertos que ocupan el 2do, el 4to,. . . , 2m-ésimo lugar y continúe. De
este modo se obtiene una sucesión de conjuntos cerrados (Γk )∞
k=1 tal que Γ k contiene, en el
k-ésimo paso, (m + 1)k intervalos cada uno de longitud (1/n)k , k = 0, 1, 2, . . . Pruebe que
Γ(n) =
∞
\
Γk
k=0
posee las mismas propiedades que Γ.
β
(6) Sea α ∈ (0, 1) y defina β = (1 − α)/2. Sea Γα el conjunto tipo-Cantor construido en la
Sección 5.1.5. Pruebe que:
β
β
β
β
( a) Si β < 1/3, entonces Γα − Γα tiene medida cero.
(b) Si β ≥ 1/3, entonces Γα − Γα = [−1, 1].
Advertencia: La prueba no es trivial, véase, por ejemplo, [80].
238
Cap. 5 El Conjunto de Cantor y su Media Hermana
(7) Pruebe que el grafo de la función de Cantor, como subconjunto del plano, tiene longitud
igual a 2.
(8) Pruebe que la función de Cantor ϕΓ es subaditiva, es decir, para todo x, y ∈ [0, 1],
ϕ Γ ( x + y) ≤ ϕ Γ ( x ) + ϕ Γ ( y).
CAPÍTULO
6
La Medida de Lebesgue en R
6.1. Introducción
En geometría elemental se nos enseña cómo determinar el perímetro y área de un polígono,
de un círculo y otras figuras planas más o menos “sencillas”. Un poco después, en los cursos
de cálculo diferencial e integral se nos muestra cómo se determinan las áreas de figuras más
complicadas como aquellas que se encuentran limitadas por una curva continua, digamos y =
f ( x), un par de ordenadas x = a, x = b y el eje X. Esto se hace mediante la integral de
Riemann. Sin embargo, dicha integral, lamentablemente, posee ciertas fisuras y limitaciones que
no permiten que se pueda integrar una amplia gama de funciones acotadas importantes y, por
consiguiente, impide que se pueda determinar el área limitada por funciones de ese tipo. De estos
y otros serios problemas con dicha integral surgió la integral de Lebesgue, una nueva integral más
amplia y poderosa que la integral de Riemann cuyo desarrollo se sustenta, en primer lugar, sobre
la noción de “medida” de un conjunto que desarrollaremos en este capítulo.
La noción matemática de medida que se utiliza hoy en día en los textos sobre Teoría de la
Medida e Integración fue dada a conocer por Émile Borel en su libro “Leçons sur la Théorie de
Fonctions” publicado en el año 1898. Con esa noción, Borel pretende representar conceptos tales
como: longitud, área, volumen, masa, carga eléctrica, etc. Los objetos a ser medidos son pensados
como conjuntos y una medida es una función de conjuntos que es aditiva, es decir, asigna a la
unión de cualquier colección finita de conjuntos disjuntos la suma de las medidas de cada uno de
ellos. El ingrediente principal que Borel añade a dicha definición y que tendrá un grand impacto,
es la noción de “numerablemente aditiva”. Borel también introduce los conjuntos que él llama
medibles pero no estudia sus propiedades. Es Henri Lebesgue quien, posteriormente, analiza
de manera rigurosa dichas propiedades logrando obtener una colección especial de “conjuntos
medibles” a la que se denominará más tarde como una σ-álgebra. Lo que Lebesgue nos revela
es que esta nueva noción introducida por Borel es el marco ideal para desarrollar su obra más
preciada: la integral que hoy lleva su nombre. La motivación de Borel para introducir el concepto
de medida proviene de su estudio del tamaño del conjunto de puntos sobre el cual ciertas series
infinitas convergen, sin embargo, Borel no pudo ver la vinculación de esta idea de medida con la
240
Cap. 6 La Medida de Lebesgue en R
Teoría de Integración.
6.2. La Medida Exterior de Lebesgue
El objetivo fundamental en esta y las siguientes secciones es la de presentar la construcción
clásica de la medida de Lebesgue en R, partiendo de la noción de medida exterior de Lebesgue. Es
bueno advertir, sin embargo, que casi todos los resultados y procedimientos que desarrollaremos
sobre la construcción de la medida de Lebesgue sobre R, se puede extender, casi sin ningún
cambio, en el espacio Euclidiano R n , n ≥ 2. Los pasos que seguiremos en la construcción de la
medida de Lebesgue se desarrollarán de acuerdo al siguiente esquema:
( a) Se comienza con la clase de los intervalos de R que, como sabemos, se “miden” a través de
su longitud.
(b) Inmediatamente después se extiende la noción de longitud a todos los subconjuntos de R
por medio de una definición que permite asignar a cada subconjunto A de R un único y bien
definido número real extendido no negativo que se denotará por µ∗ ( A). Esta función de conjuntos
es lo que llamaremos la medida exterior de Lebesgue. Lo bueno de esta manera de “medir” los
subconjuntos de R es que ella preserva la longitud de los intervalos de R, es decir, si I es un
intervalo de R, entonces µ∗ ( I ) es exactamente la longitud de I. Además, µ∗ es invariante por
traslación, lo cual significa que la “medida” de cualquier conjunto y la de sus trasladados son
exactamente las mismas. Sin embargo, no todas las propiedades que uno espera se cumplan, son
satisfechas por µ∗ . Por ejemplo, µ∗ no es lo que uno llama una “medida finitamente aditiva”, ni
mucho menos numerablemente aditiva, lo cual quiere decir que la media exterior de la unión de
una colección finita, o infinita numerable, de subconjuntos de R disjuntos dos a dos es igual a la
suma total de las medidas exteriores de cada uno de esos conjuntos.
(c) La noción de medida de Lebesgue finalmente se obtiene cuando se restringe la medida exterior
de Lebesgue a una clase muy particular, pero suficientemente amplia, de subconjuntos de R.
Dicha clase es lo que comúnmente se llama la σ-álgebra de Lebesgue.
En conclusión, la medida de Lebesgue nace como un intento de generalizar la noción de
longitud de un intervalo arbitrario a cualquier conjunto de números reales.
Recordemos que si I es cualquier intervalo acotado con extremos a y b donde a < b, entonces,
por definición, su longitud viene expresada mediante el número
ℓ( I ) = b − a.
Si a = b, el intervalo I se reduce a un punto y, por supuesto, su longitud es cero, es decir,
ℓ({a}) = 0. A tales intervalos se les llama degenerados. Por otro lado, todo intervalo que no
es degenerado se le denomina no-degenerado. Finalmente, si I es un intervalo no acotado, su
longitud se designa por ℓ( I ) = + ∞. En lo que sigue asumiremos que cuando hablamos, en
términos generales, de un intervalo éste puede ser degenerado o no-degenerado. Recordemos
que habíamos convenido en definir la “longitud” de una unión finita de intervalos acotados y
disjuntos dos a dos como la suma de las longitudes de cada uno de esos intervalos. La siguiente
definición es un poco más general.
Definición 6.2.1. Un subconjunto E de R se llama elemental si E es una unión finita de intervalos
no-superpuestos.
Sec. 6.2 La Medida Exterior de Lebesgue
241
Observe que cada conjunto elemental E se puede representar de muchas formas. Por ejemplo,
E = [0, 1] ∪ [1, 2) ∪ (2, 3] ∪ [3, 4] ∪ {5}
= [0, 2) ∪ (2, 3] ∪ [3, 4] ∪ {5}
= [0, 1] ∪ [1, 2) ∪ (2, 4] ∪ {5}
Sea E la colección de todos los subconjuntos elementales de R y consideremos la función de conjuntos
ζ : E → [0, + ∞]
definida por
ζ ( E) = ℓ( I1 ) + · · · + ℓ( In ).
para todo E ∈ E representado en la forma E = I1 ∪ · · · ∪ In . No es difícil comprobar que si
E = J1 ∪ · · · ∪ Jm es otra representación de E por medio de intervalos no-superpuestos, entonces
ℓ( I1 ) + · · · + ℓ( In ) = ℓ( J1 ) + · · · + ℓ( Jm ). Más aun, es fácil establecer que si E1 y E2 son elementos
disjuntos de E, entonces
ζ ( E1 ∪ E2 ) = ζ ( E1 ) + ζ ( E2 ).
Un hecho interesante que hay que destacar es que la familia E es un anilloSde conjuntos, es
decir,
si E1 , . . . , En es cualquier colección finita de elementos de E, entonces ni=1 Ei , así como
Tn
i=1 Ei , ambos permanecen dentro de E. Similarmente, si E, F ∈ E, entonces E \ F ∈ E. Lo
anterior permite deducir la existencia de una medida que asigna a cada conjunto elemental un
número real positivo extendido bien definido. Se puede probar que dicha medida posee ciertas
propiedades interesantes, a pesar de ser muy limitadas. Lo que deseamos indagar es ver si es
posible extender dicha noción de medida a conjuntos más “complicados” que los elementales,
es decir, queremos investigar si es posible construir una función de conjuntos µ que asigne a
cada elemento E, en alguna colección M más amplia que E, un número real positivo extendido
µ( E) y que las propiedades que posea dicha función de conjuntos capture perfectamente nuestra
noción intuitiva de longitud (y de área y volumen cuando nos ubicamos en los espacios R2 y R3
respectivamente). En otras palabras, lo ideal sería obtener una tal µ que verifique las siguientes
cuatro propiedades, conocidas como:
El Problema de la Medida de Lebesgue:
(α1 ) µ( E) esté definida para todo E ⊆ R, es decir, 0 ≤ µ( E) ≤ + ∞ para todo E ⊆ R;
(α2 ) µ( I ) = ℓ( I ) para cualquier intervalo I ⊆ R; es decir, que la “medida” de un intervalo sea
exactamente la longitud de dicho intervalo;
(α3 ) µ sea invariante por traslación, esto es, que la igualdad
µ( x + E) = µ( E)
se cumpla para todo E ∈ M y todo x ∈ R, y, finalmente,
(α4 ) µ sea numerablemente aditiva, o σ-aditiva, lo cual quiere decir que si En
disjunta en P (R ), entonces
!
∞
∞
[
X
µ
En =
µ ( En ) .
n =1
n =1
∞
n =1
es una sucesión
242
Cap. 6 La Medida de Lebesgue en R
El Problema de la Medida fue propuesto por H. Lebesgue en 1904 provocando, desde su
formulación, un gran debate: ¿tiene dicho problema una solución positiva? La respuesta es, en
general, negativa y la razón de peso de tal aseveración es, como hemos convenido, la aceptación
del Axioma de Elección. En efecto, en el transcurso de este capítulo veremos, como lo demostró G.
Vitali en 1905, que es imposible, si se acepta el Axioma de Elección, que la medida de Lebesgue,
la cual es la medida en la que estamos interesados, retenga las cuatro propiedades (α1 ) − (α4 )
antes mencionadas. De hecho, lo que dedujo Vitali es que la propiedad (α1 ) es insostenible y,
en consecuencia, debemos conformarnos con definir a µ sobre una cierta clase M $ 2R pero
reteniendo las otras tres propiedades. En consecuencia, la aceptación del Axioma de Elección
demuestra que El Problema de la Medida posee una solución negativa.
El artifice de la construcción de la Teoría de Integración que expondremos en los siguientes
capítulos se debe fundamentalmente a Henry Léon Lebesgue quien nació en Beauvais, Francia,
el 28 de Junio del año 1875. En 1894 entra a la École Normale Superieur una de las instituciones
de enseñanza de mayor prestigio ubicada en Francia (Paris), graduándose en el año 1897. A
partir de ese momento comienza a trabajar sobre su tesis doctoral la cual propone un enfoque
completamente revolucionario para resolver los problemas derivados de la integral de Riemann.
Durante el período que va de 1899 a 1901 publica los resultados de sus investigaciones. La tesis
fue aceptada formalmente en la Sorbona en 1902, y en el lapso de 1902 a 1903 dicta el prestigioso
Cours Peccot en el Collège de France el cual va ser publicado bajo el nombre de Leçons sur
l’integration et la recherche des fonctions primitives (Conferencias sobre la integración y la búsqueda
de funciones primitivas). Muere Lebesgue en París el 26 de Julio de 1941.
En todo lo que sigue, denotaremos por JR la colección de todas las sucesiones de intervalos
abiertos de R. Para cada subconjunto
A de R considere la subcolección de
∞
S JR , JR ( A), formada
por todas las sucesiones In n=1 en JR que satisfacen la condición A ⊆ ∞
n =1 In , esto es,
JR ( A) =
(
In
∞
n =1
∈ JR : A ⊆
∞
[
n =1
In
)
∞
P∞
Por cada In n=1 ∈ JR ( A), consideremos la serie P
n =1 ℓ( In ). Puesto que las longitudes son
∞
números reales positivosPo + ∞, resulta que la serie
n =1 ℓ( In ) o es convergente, o diverge a
∞
+ ∞. En cualquier caso, n=1 ℓ( In ) es un número real extendido no negativo bien definido pues
siempre se obtiene el mismo valor independientemente del orden en que se coloquen los términos
ℓ( In ). Esto nos permite formular la siguiente definición.
Definición 6.2.2. Para cada subconjunto A de R se define la medida exterior de Lebesgue de A como
µ∗ ( A) = ı́nf
(
∞
X
n =1
)
ℓ( In ) : ( In )∞
n =1 ∈ JR ( A ) .
La definición de medida exterior de Lebesgue que abreviaremos, a partir de este momento,
simplemente como medida exterior, permite, de modo inmediato, concluir que:
(11 ) 0 ≤ µ∗ ( A) ≤ + ∞ para todo A ⊆ R. Esto significa que el dominio de la función de conjuntos
µ∗ es P (R ) y su rango es [0, + ∞], es decir,
µ∗ : P (R ) → [0, + ∞].
Sec. 6.2 La Medida Exterior de Lebesgue
(22 ) µ∗ ( A) ≤
P∞
n =1 ℓ( In )
243
para cualquier sucesión ( In )∞
n =1 ∈ JR ( A ).
(33 ) Para cada ε > 0, siempre se puede elegir, usando las propiedades del ínfimo, una sucesión ( In )∞
n =1 en
JR ( A) de modo tal que
∞
X
∗
µ ( A) ≤
ℓ( In ) ≤ µ∗ ( A) + ε.
n =1
Observe que podemos tomar
µ∗ ( A)
= + ∞ en dichas desigualdades.
(44 ) µ∗ ( A) ≤ µ∗ ( B) cualesquiera sean los subconjuntos A y B de R con A ⊆ B. Esto sigue del
hecho de que
JR ( B) ⊆ JR ( A).
∞
S
S
En efecto, si In n=1 ∈ JR ( B), entonces B ⊆ ∞
In y como A ⊆ B, resulta que A ⊆ ∞
n
n =1 In ,
=
1
∞
P∞
∗
es decir, In n=1 ∈ J( A). De (22 ) se sigue que, µ ( A) ≤ n=1 ℓ( In ) y como ésta desigualdad
∞
es válida para cualquier sucesión In n=1 ∈ JR ( B), tenemos finalmente que
µ∗ ( A) ≤ ı́nf
(
∞
X
n =1
ℓ( In ) : ( In )∞
n =1 ∈ JR ( B )
)
= µ ∗ ( B ).
A esta desigualdad se le conoce con el nombre de propiedad monótona (o de monotonía)
de µ∗ .
Ya sabemos que µ∗ cumple con la condición (α1 ), de modo que nuestra tarea inmediata es
ver que µ∗ satisface las condiciones (α2 ) y (α3 ) pero no así con la condición (α4 ). El siguiente
resultado establece que la definición de medida exterior es consistente con la noción de longitud
de un intervalo y, por consiguiente, es una extensión de la función de conjuntos ζ antes definida.
Teorema 6.2.3. Para cada intervalo I ⊆ R, se cumple que µ∗ ( I ) = ℓ( I ).
Prueba. Suponga, en primer lugar, que I es un intervalo cerrado y acotado, digamos I = [ a, b]
con a, b ∈ R y a < b. Puesto que, para cada ε > 0, el intervalo abierto ( a − ε, b + ε) contiene a I,
tenemos, por la definición de µ∗ , que µ∗ ( I ) ≤ ℓ(( a − ε, b + ε)) = b − a + 2ε, de donde se sigue
que
µ∗ ( I ) ≤ b − a.
Queda por demostrar que µ∗ ( I ) ≥ b − a. Para ver esto último, sea ε > 0 y usemos (33 ) para
hallar una sucesión ( In )∞
n =1 en I ( I ) tal que
∞
X
n =1
ℓ( In ) ≤ µ∗ ( I ) + ε.
(6.2.1)
Ahora
bien, teniendo en cuenta que el intervalo I = [ a, b] es un conjunto compacto y que [ a, b] ⊆
S∞
I
n =1 n , se sigue entonces del Teorema de Heine-Borel, página 133, que existe un conjunto finito
de índices, digamos n1 , . . . , nk , tal que
[a, b] ⊆
k
[
i=1
Ini .
244
Cap. 6 La Medida de Lebesgue en R
Una vez establecida la inclusión anterior, podemos suponer, sin afectar el razonamiento que sigue,
que Ini = ( ai , bi ) para i = 1, . . . , k, que ninguno de los Ini está incluido en ninguno de los intervalos
restantes y que a1 < a2 < · · · < ak . Esta última cadena de desigualdades en combinación con
S
[a, b] ⊆ ki=1 Ini , obliga a concluir que las desigualdades a1 < a < b < bk , así como ai < bi−1
se cumplen. De esto se sigue que
∞
X
n =1
ℓ( In ) ≥
k
X
i=1
ℓ( Ini ) = (bk − ak ) + (bk−1 − ak−1 ) + · · · + (b1 − a1 )
= bk − ( ak − bk−1 ) − ( ak−1 − bk−2 ) − · · · − ( a2 − b1 ) − a1
> bk − a1 > b − a.
De la desigualdad (6.2.1), vemos que
∗
µ (I) ≥
∞
X
n =1
ℓ( In ) − ε > b − a − ε,
de donde se concluye, por la arbitrariedad del ε > 0, que µ∗ ( I ) ≥ b − a.
Demostrada la igualdad µ∗ ( I ) = ℓ( I ) para cualquier intervalo compacto I = [ a, b], tomemos
ahora un intervalo arbitrario I de longitud finita pero no compacto. En este caso, I es necesariamente uno de los siguientes intervalos: I = ( a, b), [ a, b) o ( a, b]. Fijemos un número ε > 0
elegido arbitrariamente y considere el intervalo J = [ a + ε/4, b − ε/4]. Observe que J es un
intervalo cerrado y acotado tal que J ⊆ I y ℓ( J ) > ℓ( I ) − ε. De esto y el hecho de que I ⊆ I se
sigue que
ℓ( I ) − ε < ℓ( J )
= µ∗ ( J )
≤ µ∗ ( I )
∗
≤ µ (I)
= ℓ( I )
= ℓ( I ),
por el primer caso
por (44 )
de nuevo por (44 )
por el primer caso
por definición
es decir, para cada ε > 0, se cumple que
ℓ( I ) − ε < µ∗ ( I ) ≤ ℓ( I ),
de donde se deduce que µ∗ ( I ) = ℓ( I ).
Para finalizar la demostración del teorema, suponga que I es un intervalo de longitud infinita.
Dado cualquier entero positivo n, seleccionemos un intervalo cerrado y acotado J ⊆ I con ℓ( J ) =
n. Por (44 ) y la demostración de la primera parte se tiene que µ∗ ( I ) ≥ µ∗ ( J ) = ℓ( J ) = n, es
decir, µ∗ ( I ) ≥ n para cualquier n ∈ N. De aquí se sigue que µ∗ ( I ) = + ∞ = ℓ( I ) y termina la
prueba.
En particular, si I es un intervalo degenerado, digamos I = { x}, entonces
(55 ) µ∗ ({ x}) = ℓ({ x}) = 0.
Sec. 6.2 La Medida Exterior de Lebesgue
245
Más aun, como el conjunto vacío es un subconjunto de cualquier conjunto, resulta que ∅ ⊆ { x}
y, por consiguiente, de la monotonía de µ∗ se sigue que
(66 ) µ∗ (∅) = 0.
(77 ) µ∗ ( G ) > 0 para cualquier conjunto abierto G no vacío. En efecto, como G es un abierto no
vacío, él contiene un intervalo abierto, digamos J ⊆ G. Se sigue de (44 ) que µ∗ ( G ) ≥ µ∗ ( J ) =
ℓ( J ) > 0.
Veamos ahora que µ∗ cumple con (α3 ). Nótese que ser invariante por traslación en R significa que
la “medida” de un conjunto es independiente de su localización, es decir, podemos desplazarlo a
cualquier otro lugar sin afectar su “medida”.
Teorema 6.2.4. µ∗ es invariante por traslación, es decir, para cualquier subconjunto A de R y cualquier x ∈ R, se cumple que
µ∗ ( x + A) = µ∗ ( A)
Prueba. Sea A un subconjunto de R y sea x ∈ R. Si A = ∅, entonces x + A = { x} y, así, por
(55 ) y (66 ) tenemos que µ∗ ( x + A) = µ∗ ({ x}) = 0 = µ∗ ( A). Supongamos ahora que A 6= ∅ y
sea x ∈ R. Consideremos primero el caso en que µ∗ ( A) < + ∞. Dado ε > 0, seleccione, usando
(33 ), una sucesión ( In )∞
n =1 de intervalos abiertos tal que
A ⊆
∞
[
In
∞
X
y
n =1
n =1
ℓ( In ) ≤ µ∗ ( A) + ε.
(6.2.2)
Puesto que claramente
x + A ⊆ x +
∞
[
n =1
In ⊆
∞
[
( x + In ),
n =1
y teniendo en cuenta que ℓ( x + In ) = ℓ( In ) para todo n ∈ N, resulta entonces de (22 ) y (6.2.2)
que
∗
µ ( x + A) ≤
∞
X
ℓ( x + In ) =
n =1
≤ µ∗ ( A) + ε
∞
X
ℓ( In )
n =1
Siendo ε > 0 arbitrario, concluimos que µ∗ ( x + A) ≤ µ∗ ( A). Para demostrar la otra desigualdad,
observe que como A = − x + ( x + A), entonces se tiene, gracias a la primera parte, que
µ∗ ( A) = µ∗ (− x + ( x + A)) ≤ µ∗ ( x + A).
Por esto µ∗ ( x + A) = µ∗ ( A). Falta considerar el caso en que µ∗ ( A) = + ∞, el cual se deja como
un fácil ejercicio a cargo del lector.
Hasta ahora hemos demostrado que µ∗ satisface (α1 ), (α2 ) y (α3 ). La condición (α4 ) es una
de esas condiciones que no se puede omitir en ninguna teoría que intente “medir” conjuntos de
números reales partiendo, por supuesto, de la noción de longitud. Para ver que µ∗ no cumple
con (α4 ) es necesario provocar una partición de P (R ) en dos clases, digamos M y N, de modo
246
Cap. 6 La Medida de Lebesgue en R
que en la clase M cualquier colección numerable y disjunta su unión permanezca en ella y la
medida exterior sea numerablemente aditiva para tal unión, mientras que en la clase N se puede
obtener al menos una colección finita o numerable que es disjunta dos a dos, pero que µ∗ no
es numerablemente aditiva sobre su unión. Esto lo haremos en la sección sobre conjuntos nomedibles. Mientras tanto, demostraremos el siguiente resultado el cual nos muestra que µ∗ es
casi numerablemente aditiva.
Teorema 6.2.5. µ∗ es numerablemente subaditiva, es decir, si ( An )∞
n =1 es cualquier colección numerable de subconjuntos de R, se cumple que
[
∞
∞
X
∗
An ≤
µ ∗ ( A n ).
(6.2.3)
µ
n =1
n =1
Prueba. Observe, en primer lugar, queSsi µ∗ ( An0 ) = + ∞ para algún n0 ∈ N, entonces la
∞
monotonía de µ∗ nos revela que µ∗
≥ µ∗ ( An0 ) = +∞, lo cual nos indica que
n =1 A n
S
P
∞
∞
∗
∗
µ
n =1 A n =
n =1 µ ( A n ) = + ∞ y, por consiguiente, (6.2.3) se cumple. Suponga ahora
∗
que µ ( An ) < + ∞ para todo n ∈ N. Nótese que:
P
∗
(1) Si ∞
n =1 µ ( A n ) = + ∞, entonces claramente (6.2.3) se cumple ya que por (11 )
[
∞
∞
X
∗
µ
An ≤ +∞ =
µ ∗ ( A n ).
n =1
n =1
P∞
∗
(2) Suponga entonces que
n =1 µ ( A n ) < + ∞. Fijemos un ε > 0 elegido arbitrariamente y
hagamos uso de (33 ) para seleccionar, por cada n ∈ N, una sucesión ( In,k )∞
k=1 de intervalos
abiertos tal que
An ⊆
∞
[
∞
X
y
In,k
k=1
k=1
ℓ( In,k ) ≤ µ∗ ( An ) +
Puesto que
∞
[
An ⊆
An
n =1
se sigue entonces de (22 ) que
µ
∗
[
∞
n =1
≤
≤
=
∞ [
∞
[
In,k
n =1 k=1
∞ X
∞
X
ℓ( In,k )
n =1 k=1
∞ X
n =1
∞
X
ε
µ ( An ) + n
2
∗
µ∗ ( An ) + ε,
n =1
de donde se concluye, por la arbitrariedad de nuestro ε, que
[
∞
∞
X
∗
µ
An ≤
µ∗ ( An )
n =1
n =1
ε
.
2n
Sec. 6.2 La Medida Exterior de Lebesgue
247
y termina la prueba.
Observe que, para cualquier colección finita de subconjuntos de R, digamos, { A1 , . . . , An } se
cumple que
[
n
n
X
∗
µ
Ak ≤
µ ∗ ( A k ).
k=1
k=1
En efecto, basta con definir Ak = ∅ para todo k ≥ n + 1 y aplicar el Teorema 6.2.5. En este caso
se dice que µ∗ es finitamente subaditiva.
Corolario 6.2.6. Si A ⊆ R es numerable, entonces µ∗ ( A) = 0.
Prueba. Suponga que A = {a1 , a2 , . . .}. Entonces A =
para todo n ∈ N, el resultado sigue del Teorema 6.2.5.
S∞
n =1 { a n }
y puesto que µ∗ ({an }) = 0
Por ejemplo, el conjunto de los números racionales Q ⊆ R, a pesar de ser denso en R, posee
medida exterior cero ya que dicho conjunto es numerable. Podemos formularnos la siguiente
pregunta: Si un conjunto A ⊆ R es tal que µ∗ ( A) = 0, ¿será verdad que A es numerable? Como
veremos un poco más adelante, el conjunto ternario de Cantor constituye un contraejemplo a
dicha interrogante, pues µ∗ (Γ) = 0 pero Γ no es numerable. En lo que sigue, el símbolo Nµ (R )
denotará la colección de todos conjuntos nulos, es decir,
Nµ (R ) =
N ⊆ R : µ∗ ( N ) = 0 .
Veremos ahora que bajo la Hipótesis del Continuo cualquier conjunto de medida exterior
positiva es no-numerable.
Corolario 6.2.7. Bajo la Hipótesis del Continuo, cualquier conjunto infinito A ⊆ R con µ∗ ( A) > 0
posee la cardinalidad del continuo.
Prueba. Suponga que A es un conjunto infinito con µ∗ ( A) > 0. Por la Hipótesis del Continuo,
la cardinalidad de A es ℵ0 , o bien c. Suponer que la cardinalidad de A es ℵ0 conduce a que
A es numerable y, por consiguiente, gracias al Corolario 6.2.6, µ∗ ( A) = 0 lo que produce una
contradicción. Por lo tanto, si µ∗ ( A) > 0, entonces card( A) = c.
¿Qué ocurre si no se asume la Hipótesis del Continuo en el Corolario anterior? Es importante
advertir que la condición µ∗ ( A) > 0 no implica que A contenga, en su interior, un intervalo
abierto. ¡Existen conjuntos A con µ∗ ( A) > 0 que son nunca-densos! Sin embargo, la Hipótesis
del Continuo no es necesaria en la conclusión del Corolario 6.2.7 como se puede demostrar en el
Corolario 6.4.9, página 309.
Una de las nociones de mayor trascendencia y que jugará un papel fundamental en la Teoría
de la Medida e Integración es la de conjunto nulo.
Definición 6.2.8. Un conjunto N ⊆ R se llama un conjunto nulo si µ∗ ( N ) = 0.
Una de las características excepcionales de los conjuntos nulos es que ellos no tienen ningún
efecto cuando se añade o se excluye de un conjunto arbitrario; es decir:
248
Cap. 6 La Medida de Lebesgue en R
Teorema 6.2.9. Si N ⊆ R es un conjunto nulo, entonces
µ∗ ( A ∪ N ) = µ∗ ( A) = µ∗ ( A \ N )
para cualquier conjunto A ⊆ R.
Prueba. Sea N ⊆ R un conjunto nulo. Se sigue de (44 ) y la subaditividad finita de µ∗ que para
cualquier conjunto A ⊆ R,
µ∗ ( A) ≤ µ∗ ( A ∪ N ) ≤ µ∗ ( A) + µ∗ ( N ) = µ∗ ( A),
( 1)
y, por lo tanto, µ∗ ( A ∪ N ) = µ∗ ( A). Por otro lado, puesto que A ∩ N es un conjunto nulo,
resulta que si reemplazamos N por A ∩ N y A por A \ N en la ecuación (1) se obtiene que
ν∗ ( A \ N ) = µ∗ (( A \ N ) ∪ ( A ∩ N )); es decir, ν∗ ( A \ N ) = µ∗ ( A).
Es importante, en este punto, valorar la noción de numerabilidad sub-aditiva demostrada
para µ∗ ; es decir, no se puede sustituir dicha noción por sub-aditividad no-numerable pues, en este
caso, cualquier subconjunto no-numerable de R tendría medida exterior nula al ser unión nonumerable de sus puntos. En efecto, si A = { xα : α ∈ I } es no-numerable y si la sub-aditividad
no-numerable fuese cierta, entonces
!
[
X
0 ≤ µ∗ ( A) = µ∗
{ xα } ≤
µ∗ ({ xα }) = 0,
α∈ I
α∈ I
lo cual haría de µ∗ una noción sin sentido.
Se sigue de la definición de medida exterior de un conjunto que los conjuntos nulos se pueden
expresar de la siguiente forma.
Teorema 6.2.10. Para un conjunto N ⊆ R, las siguientes condiciones son equivalentes:
(1) µ∗ ( N ) = 0.
(2) Dado ε > 0, existe una sucesión In
N ⊆
∞
[
In
∞
n =1
de intervalos abiertos tal que
y
n =1
∞
X
ℓ( In ) < ε.
n =1
Prueba. En efecto, (1) ⇒ (2) es consecuencia inmediata de (33 ), mientras que (2) ⇒ (1) sigue
de la definición.
El corolario que sigue fue demostrado por primera vez por George Cantor usando el ahora
famoso e imprescindible Método de la Diagonal. He aquí otro modo de probarlo usando la noción
de medida exterior.
Corolario 6.2.11. El intervalo [0, 1] es no-numerable.
Prueba. Si aceptamos la Hipótesis del Continuo, el resultado es consecuencia inmediata del Corolario 6.2.7 ya que µ∗ ([0, 1]) > 0. Si no deseamos usar dicha hipótesis, entonces podemos
razonar de este otro modo: suponga que [0, 1] es numerable. Por el Corolario 6.2.6 sabemos que
Sec. 6.2 La Medida Exterior de Lebesgue
249
µ∗ ([0, 1]) = 0, mientras que por el Teorema 6.2.3, µ∗ ([0, 1]) = ℓ([0, 1]) = 1, lo que resulta ser una
franca e incuestionable contradicción. Por esto [0, 1] es no-numerable y finaliza la prueba.
Existen varios modos de “aproximar” un conjunto arbitrario por conjuntos más simples. El
próximo teorema establece que cualquier subconjunto de R se puede “aproximar” por un conjunto
abierto que lo contiene y cuya medida exterior difiere muy poco de la del conjunto dado.
Teorema 6.2.12. Sea A ⊆ R. Dado cualquier ε > 0, existe un conjunto abierto G ⊆ R tal que
A ⊆ G
En particular,
µ∗ ( G ) ≤ µ∗ ( A) + ε.
y
µ∗ ( A) = ı́nf µ∗ ( G ) : A ⊆ G, G es abierto .
(6.2.4)
(6.2.5)
Prueba. Fijemos un ε > 0 elegido arbitrariamente. Si µ∗ ( A) = + ∞, entonces basta tomar G = R
para verificar que (6.2.4) se cumple. Supongamos
ahora que µ∗ ( A) < + ∞. Para el ε > 0 dado,
∞
usemos (33 ) para escoger una sucesión In n=1 de intervalos abiertos tal que
A ⊆
∞
[
∞
X
y
In
n =1
n =1
S∞
ℓ( In ) ≤ µ∗ ( A) + ε.
Si ahora definimos G = n=1 In , resulta que G es un conjunto abierto, A ⊆ G y, se sigue de los
Teorema 6.2.3 y Teorema 6.2.5 que
[
∞
∞
∞
X
X
∗
∗
µ (G) = µ
In ≤
µ∗ ( In ) =
ℓ( In )
n =1
n =1
n =1
∗
≤ µ ( A) + ε.
Esto prueba (6.2.4).
Puesto que µ∗ ( A) ≤ µ∗ ( G ), resulta de (6.2.4) y la elección arbitraria del ε,
que µ∗ ( A) = ı́nf µ∗ ( G ) : A ⊆ G, G es abierto .
Recordemos que un subconjunto G de R se dice que
es un Gδ , si existe una sucesión ( Gn )∞
n =1
T∞
de subconjuntos abiertos no vacíos de R tal que G = n=1 Gn . La colección de todos los conjuntos
Gδ incluidos en R será denotada por Gδ (R ).
Corolario 6.2.13. Sea A un subconjunto no vacío de R. Existe un conjunto G ∈ Gδ (R ) tal que
A ⊆ G
y
µ ∗ ( A ) = µ ∗ ( G ).
Prueba. Para cada n ∈ N existe, por el Teorema 6.2.12, un conjunto abierto Gn ⊆ R tal que
A ⊆ Gn
y
µ ∗ ( Gn ) ≤ µ ∗ ( A ) +
1
.
n
T
∗
Definiendo G = ∞
n =1 Gn , resulta que G es un Gδ , A ⊆ G y entonces, por la monotonía de µ ,
∗
∗
tenemos que µ ( A) ≤ µ ( G ). Para obtener la otra desigualdad, notemos que G ⊆ Gn para todo
n ≥ 1 y de nuevo, por la monotonicidad de µ∗ , resulta que
µ ∗ ( G ) ≤ µ ∗ ( Gn ) ≤ µ ∗ ( A ) +
1
,
n
para todo n ∈ N. De esto último se sigue que µ∗ ( G ) ≤ µ∗ ( A) y así, µ∗ ( A) = µ∗ ( G ).
Combinando los dos resultados anteriores se tiene que:
250
Cap. 6 La Medida de Lebesgue en R
Corolario 6.2.14. Para cualquier conjunto A ⊆ R,
µ∗ ( A) = ı́nf µ∗ ( G ) : A ⊆ G, G ∈ Gδ (R ) .
6.2.1. Condiciones bajo la cual µ∗ es σ-aditiva
Hasta ahora hemos demostrado que nuestra medida exterior µ∗ satisface las propiedades
(α1 ), (α2 ) y (α3 ), excepto la numerabilidad aditiva. Desafortunadamente µ∗ no es numerablemente aditiva hecho que demostraremos un poco más adelante al construir una sucesión de
subconjuntos disjuntos dos a dos de R, digamos (Vn )∞
n =1 , tal que
µ
∗
[
∞
Vn
n =1
6=
∞
X
µ∗ (Vn ).
n =1
Abordar la construcción de dicha sucesión va a demorar un largo pero agradable lapso de tiempo,
por lo que, en compensación, mostraremos en lo que sigue que, bajo ciertas condiciones, uno
puede garantizar, tanto en el caso finito así como en el caso infinito, la aditividad de µ∗ .
Recordemos que si A y B son subconjuntos de R, la distancia entre ellos viene dada por
dist( A, B) = ı́nf | a − b| : a ∈ A, b ∈ B .
Diremos que A y B están estrictamente separados si dist( A, B) > 0. Por ejemplo, del Teorema 2.2.32, página 134, sabemos que cualquier par de conjuntos compactos y disjuntos están
estrictamente separados. Observe que si dist( A, B) > 0, entonces necesariamente A y B son
disjuntos. Además, si I es un intervalo abierto intersectando a ambos conjuntos, resulta claro
que ℓ( I ) > dist( A, B). En este caso siempre es posible subdividir a I en piezas más pequeñas,
digamos { I1 , . . . , Ik }, de modo que la longitud de cada una de ellos sea menor que dist( A, B).
La finalidad de hacer eso es poder garantizar que los intervalos Ii que intersecten, digamos al
conjunto A, no intersecten a B y viceversa.
Teorema 6.2.15 (Carathéodory). Si { A1 , . . . , An } es una familia finita de subconjuntos de R tal que
dist( Ai , A j ) > 0 para todo par de índices i, j con i 6= j, entonces
µ∗
[
n
i=1
Ai
= µ ∗ ( A1 ) + · · · + µ ∗ ( A n ).
Prueba. Un fácil argumento inductivo permite reducir la prueba sólo a dos conjuntos. Suponga
entonces que A y B son dos conjuntos tal que dist( A, B) > 0. Por la subaditivad finita de µ∗ ,
tenemos que
µ ∗ ( A ∪ B ) ≤ µ ∗ ( A ) + µ ∗ ( B ).
Para demostrar la otra desigualdad,
∞ fijemos un ε > 0 elegido de modo arbitrario. Usemos (33 )
para seleccionar una sucesión In n=1 de intervalos abiertos tal que
A∪B ⊆
∞
[
n =1
In
y
∞
X
n =1
ℓ( In ) ≤ µ∗ ( A ∪ B) + ε.
Sec. 6.2 La Medida Exterior de Lebesgue
251
Dividiendo cada intervalo In en subintervalos más pequeños si fuese necesario, podemos suponer
y, así lo haremos, que la longitud de cada In es menor que dist( A, B), es decir,
ℓ( In ) < dist( A, B) n ≥ 1.
La finalidad de hacer esto, como ya lo mencionamos anteriormente, es poder garantizar que cada
intervalo In intersecte o bien al conjunto A, o bien al conjunto B, pero no a ambos. Consideremos ahora los conjuntos de índices
F1 = n ∈ N : In ∩ A 6= ∅
y
F2 = n ∈ N : In ∩ B 6= ∅ .
De acuerdo a nuestra suposición, tenemos que F1 ∩ F2 = ∅, aunque pueden haber intervalos que
no intersecten a ninguno de los dos conjuntos. Se sigue de esto que la sucesión ( In )n∈ F1 cubre a
A, mientras que ( In )n∈ F2 cubre a B, es decir,
[
[
In
y
B ⊆
In .
A ⊆
n ∈ F1
n ∈ F2
Finalmente,
∗
∗
µ ( A) + µ ( B) ≤
X
X
ℓ( In ) +
n ∈ F1
n ∈ F2
ℓ( In ) ≤
∞
X
n =1
ℓ( In ) ≤ µ∗ ( A ∪ B) + ε.
Puesto que ε > 0 es arbitrario, se concluye que µ∗ ( A) + µ∗ ( B) ≤ µ∗ ( A ∪ B). Fin de la prueba. Corolario 6.2.16. Si (Ki )ni=1 es una sucesión finita de subconjuntos compactos disjuntos dos a dos,
entonces
[
n
n
X
∗
µ
Ki =
µ ∗ ( K i ).
i=1
i=1
Prueba. Observe, en primer lugar, que dist(Ki , K j ) > 0 para todo i 6= j. En efecto, la definición
de dist(Ki , K j ) nos garantiza que, para cada k ∈ N, existen xk ∈ Ki y yk ∈ K j tales que
xk − yk < dist(Ki , K j ) +
1
k
Usando ahora el hecho de que los conjuntos Ki son compactos, podemos seleccionar subsucesio∞
∞
∞
nes ( xkl )∞
l =1 y ( yk l ) l =1 de ( xk ) k=1 y ( yk ) k=1 respectivamente, tales que
lı́m xkl = x ∈ Ki
y
l →∞
lı́m ykl = y ∈ K j .
l →∞
Puesto que Ki ∩ K j = ∅, se sigue que x 6= y y, en consecuencia,
0 < | x − y| = lı́m xkl − ykl
l →∞
< dist(Ki , K j ) + lı́m
El resultado sigue ahora del Teorema 6.2.15.
l →∞
1
= dist(Ki , K j ).
kl
El siguiente resultado dice que para ciertos subconjuntos de R uno puede obtener igualdad
en el Teorema 6.2.5.
252
Cap. 6 La Medida de Lebesgue en R
Teorema 6.2.17. Si ( In )n∈ J es una colección a lo más numerable de intervalos compactos no-superpuestos en R, entonces
[ X
∗
µ
In =
µ∗ ( In ).
n∈ J
n∈ J
Prueba. Fijemos ε > 0 y suponga, en primer lugar, que J es finito, digamos, J = {1, 2, . . . , n}. Por
la sub-aditividad de µ∗ , tenemos que
[
n
n
n
X
X
∗
µ
Ii ≤
µ∗ ( Ii ) =
ℓ( Ii ).
( 1)
i=1
i=1
i=1
Observe que si Ii es de la forma Ii = [ ai , bi ] con ai < bi , entonces siempre podemos seleccionar
un intervalo compacto, digamos Ki , de modo que Ki ⊆ Ii y ℓ(Ki ) > ℓ( Ii ) − ε/n. En efecto,
basta tomar Ki = [ ai + ε/4n, bi − ε/4n], para asegurarnos que
ε
ε
ℓ(Ki ) = bi − ai −
> ℓ( Ii ) − .
2n
n
Observe
S que laScolección de intervalos compactos {K1 , . . . , Kn } son disjuntos dos a dos y, puesto
que ni=1 Ii ⊇ ni=1 Ki , aplicando una vez más la sub-aditividad de µ∗ y el Corolario 6.2.16, vemos
que
[
[
n
n
n
n
n
X
X
X
∗
∗
∗
µ
Ii ≥ µ
Ki =
µ (Ki ) =
ℓ(Ki ) >
ℓ( Ii ) − ε.
i=1
i=1
i=1
i=1
i=1
Como ε es arbitrario, concluimos que
[
n
n
X
µ
Ii ≥
ℓ( Ii ).
∗
i=1
i=1
Esta última desigualdad combinada con (1) nos muestra que
[
n
n
X
∗
µ
ℓ( Ii ).
Ii =
i=1
i=1
Esto termina la prueba del caso finito. Para finalizar la demostración, suponga ahora que J = N.
Nótese que, por la sub-aditividad de µ∗ y la primera parte, tenemos que la desigualdad
[
[
∞
n
n
X
∗
∗
µ
Ii ≥ µ
Ii =
ℓ( Ii )
i=1
i=1
se cumple para todo n ≥ 1. Por esto,
∞
X
i=1
ℓ( Ii ) = lı́m
n→∞
n
X
i=1
La desigualdad opuesta sigue del Teorema 6.2.5.
i=1
[
∞ ℓ( Ii ) ≤ µ
Ii .
∗
i=1
Un poco más adelante, una vez definido lo que es unconjunto medible, daremos otra condi∞
ción balo la cual una sucesión disjunta de conjuntos An n=1 satisface
[
∞
∞
X
µ∗
An =
µ ∗ ( A n ).
n =1
n =1
Sec. 6.2 La Medida Exterior de Lebesgue
253
6.2.2. Conjuntos de Contenido Cero
Existe una noción menos general que la de conjunto de medida exterior cero llamada conjunto
de contenido cero en el sentido de Jordan que es de mucha utilidad para obtener una caracterización de las funciones que son Riemann integrables. Una motivación para su estudio es la noción
de conjunto nulo la cual, como sabemos, se puede establecer en los siguientes términos: para
cualquier subconjunto A de R las siguientes condiciones son equivalentes:
(1) µ∗ ( A) = 0.
(2) dado ε > 0, existe una sucesión In
A ⊆
∞
[
∞
n =1
In
de intervalos abiertos tal que
∞
X
y
n =1
ℓ( In ) < ε.
n =1
Si la colección de intervalos abiertos { In : n ∈ N } que cubre al conjunto A en (2) en dicha equivalencia se puede elegir siempre finita, entonces el conjunto A recibe un nombre muy especial.
Definición 6.2.18. Un conjunto A ⊆ R se dice que tiene contenido cero o es de medida cero en el
sentido de Jordan si, para cada ε > 0, existe una colección finita { I1 , . . . , Ik } de intervalos abiertos tal
que
k
k
[
X
ℓ( Ik ) < ε.
A ⊆
In
y
n =1
n =1
Si A tiene contenido cero, escribiremos cµ∗ ( A) = 0. Es claro que si cµ∗ ( A) = 0, entonces
µ∗ ( A) = 0. El recíproco se cumple si A es compacto.
Lema 6.2.19. Sea A un subconjunto de R. Si A es compacto y µ∗ ( A) = 0, entonces cµ∗ ( A) = 0.
∗
∗
Prueba. Suponga que A
∞ es un compacto tal que µ ( A) = 0. Sea ε > 0. Puesto que µ ( A) = 0,
existe una sucesión In n=1 de intervalos abiertos tal que
A ⊆
∞
[
∞
X
y
In
n =1
ℓ( In ) < ε.
n =1
Pero como A es compacto, el cubrimiento V = { In : n ∈ N } se reduce a un cubrimiento finito,
esto es, existe una colección finita { I1 , . . . , Ik } en V tal que
A⊆
k
[
k
X
y
In
n =1
n =1
ℓ( In ) ≤
∞
X
ℓ( In ) < ε.
n =1
Esto prueba que cµ∗ ( A) = 0.
El siguiente resultado establece que en la definición de conjuntos de contenido cero uno puede
elegir intervalos cerrados en lugar de intervalos abiertos.
Lema 6.2.20. Un conjunto A es de contenido cero si, y sólo si, para cada ε > 0, existe una colección
finita { J1 , . . . , Jk } de intervalos cerrados tal que
A ⊆
k
[
n =1
Jn
y
k
X
n =1
ℓ( Jk ) < ε, .
254
Cap. 6 La Medida de Lebesgue en R
Prueba. (⇒) Suponga que A es de contenido cero y sea ε > 0. Entonces existe una colección
finita { I1 , . . . , Ik } de intervalos abiertos tal que
A ⊆
k
[
k
X
y
In
n =1
ℓ( Ik ) < ε,
n =1
Haciendo Ji = Ii para cada índice i y teniendo en cuenta que A ⊆
se termina la prueba de esta implicación.
Sk
n =1 Jn
y que ℓ( Ii ) = ℓ( Ji )
(⇐) Sea ε > 0 y suponga que existe una colección finita { J1 , . . . , Jk } de intervalos cerrados tal
que
k
k
[
X
A ⊆
ℓ( Jk ) < ε/2.
Jn
y
n =1
n =1
Pongamos Ji = [ui , vi ], i = 1, 2, . . . , k y considere los intervalos abiertos
Ii = ui − ε/4k, vi + ε/4k , i = 1, 2, . . . , k.
Entonces A ⊆
Sk
n =1 In
y
k
X
ℓ( Ii ) =
i=1
k X
i=1
ε
( vi − u i ) +
2k
<
ε
ε
+k·
= ε.
2
2k
La aprueba es completa.
El lema anterior nos indica que A es de contenido cero si, y sólo si, A, la clausura de A, es de
contenido cero. Esto último, por supuesto, no se cumple para conjuntos de medida exterior cero.
En efecto, el conjunto Q es de medida exterior cero, pero Q = R no lo es. Resulta claro que
cualquier conjunto finito es de contenido cero, aunque existen conjuntos infinitos numerables
que pueden o no tener contenido cero. Por ejemplo, del resultado anterior se sigue que Q es un
conjunto numerable que no tiene contenido cero. Sin embargo, el conjunto A = {1/n : n ≥ 1} es
1
tal que cµ∗ ( A) = 0. Para ver esto último, sea ε > 0 y escoja un n ∈ N tal que n1 < 4ε < n−
1 . Si
ahora definimos
−ε ε
1
ε
1
ε
J1 =
,
y
Jk =
− ,
+
4 4
k − 1 4n k − 1 4n
para k = 2, 3, . . . , n, entonces A ⊆
n
X
k=1
Sn
k=1 Jk
ℓ( Jk ) =
y
ε
ε
ε
ε
+ ( n − 1)
< + = ε.
2
2n
2 2
Por esto, A es de contenido cero. Por otro lado, el conjunto ternario de Cantor Γ es un conjunto
no-numerable que es de contenido cero. En efecto, recordemos que Γ ⊆ Γn para todo n ≥ 1,
donde Γn consiste de la unión de los 2n intervalos cerrados y acotados que no fueron eliminados
en el n-ésimo paso en la construcción de Γ y cuya longitud es (2/3)n . Si fijamos un ε > 0
arbitrario y elegimos un n ∈ N de modo que (2/3)n < ε, vemos que cµ∗ (Γ) = 0.
Sec. 6.3 La Medida de Lebesgue
255
Teorema 6.2.21. Si a < b, entonces el intervalo [ a, b] ⊆ R no tiene contenido cero. De hecho, si
{ I1 , . . . , In } es un cubrimiento finito de [a, b] por intervalos cerrados, entonces
n
X
i=1
ℓ( Ii ) ≥ b − a.
Prueba. La demostración es por inducción sobre el número de intervalos que cubren a [ a, b]. El
caso n = 1 es inmediato. Suponga que el teorema es cierto para recubrimientos con n intervalos
y sea { I1 , . . . , In+1 } un cubrimiento de [ a, b] por intervalos cerrados. Se puede suponer (cambiando los subíndices si es necesario) que a ∈ I1 . Pongamos
I1 = [α, β]. Entonces α ≤ a ≤ β. Si
Pn
α ≥ b, entonces ℓ( I1 ) ≥ b − a y, por consiguiente,
ℓ(
I
)
≥ b − a. Si β < b, entonces [ β, b]
i
i=1
es recubierto por { I2 , . . . , In+1 }. Por lo tanto, ℓ( I2 ) + · · · + ℓ( In+1 ) ≥ b − β y, en consecuencia,
n
X
i=1
ℓ( Ii ) ≥ ( β − a) + (b − β) = b − a.
La prueba es completa.
Corolario 6.2.22. Sea An
ciones son equivalentes:
∞
n =1
una sucesión de subconjuntos compactos de R. Las siguientes condi-
(1) An tiene contenido cero para todo n ≥ 1.
S
( 2) ∞
n =1 A n tiene medida cero.
∗
Prueba. (1) ⇒ (2). Suponga que cµ∗ ( An ) = 0 para
S∞ todo n ≥ 1. Entonces µ ( A
Sn ) = 0 para
∗
todo n ∈ N y se sigue del Teorema 6.2.5 que µ ( n=1 An ) = 0. Esto prueba que ∞
n =1 A n tiene
medida cero.
(2) ⇒ (1). Suponga S
que (2) se cumple. Entonces, por ser µ∗ monótona, se tiene que para cada
k ≥ 1, µ∗ ( Ak ) ≤ µ∗ ( ∞
n =1 A n ) = 0, de donde se sigue que cµ ∗ ( A k ) = 0 para todo k ≥ 1 gracias
al Lema 6.2.19.
6.3. La Medida de Lebesgue
El objetivo de esta sección es construir una clase muy especial de subconjuntos de R, llamada la σ-álgebra de Lebesgue, sobre la cual la medida exterior de Lebesgue es numerablemente
aditiva y derivar algunos resultados fundamentales con dicha “medida”.
6.3.1. La σ-álgebra de Lebesgue
La imposibilidad de la medida exterior µ∗ de ser numerablemente aditiva, hecho que probaremos al final de este capítulo, deja hasta ahora el trabajo incompleto en el sentido de obtener
una “medida” que generalize la noción de longitud, mida cada uno de los subconjuntos de R, sea
invariante por traslación y numerablemente aditiva. Un modo inteligente de salir de este impasse
es considerar, en lugar de la clase P (R ), una sub-clase mucho más pequeña, como por ejemplo:
la sub-clase de todos aquellos subconjuntos de R para los cuales µ∗ sea numerablemente aditiva. Denotemos, por el momento, a dicha sub-clase por M. Aunque la idea es, en principio, muy buena,
256
Cap. 6 La Medida de Lebesgue en R
persisten, sin embargo, algunos problemas que no son de solución inmediata. Por ejemplo, ¿cómo identificar a los elementos de esa sub-clase?, es decir, ¿cómo se determina si un determinado
conjunto está o no en la clase M? ¿Qué tipos de operaciones de conjuntos son permitidas dentro
de M? ¿Qué tan grande es M?, esto es, ¿cuál es su cardinalidad? ¿Cuál es su utilidad?, etc. Intentaremos, en lo que sigue, abordar una definición adecuada de ciertos conjuntos muy especiales
que permitan que µ∗ sea numerablemente aditiva para tales conjuntos y luego darle respuestas a
las interrogantes antes formuladas.
¿Pero, por dónde debemos comenzar? Recordemos que el Teorema 6.2.12 nos garantiza que,
dado cualquier subconjunto A de R y cualquier ε > 0, podemos determinar la existencia de un
subconjunto abierto G ⊇ A tal que
µ∗ ( G ) < µ∗ ( A) + ε.
(⋆)
Lo que tenemos en mente es investigar qué tipos de conjuntos se pueden aproximar por conjuntos
abiertos, es decir, ¿es posible elegir a G de modo que µ∗ ( G \ A) < ε? Suponga, por un momento,
que µ∗ ( A) < + ∞ y observemos que de la desigualdad (⋆) se tiene que
µ∗ ( G ) − µ∗ ( A) < ε.
Sin embrago, a pesar de que G = A ∪ G \ A es una unión disjunta, la sub-aditividad finita de
µ∗ lo único que puede asegurar es que
µ∗ ( G ) ≤ µ∗ ( A) + µ∗ ( G \ A),
y, por consiguiente,
µ ∗ ( G ) − µ ∗ ( A ) ≤ µ ∗ ( G \ A ).
No existe, en consecuencia, argumento alguno que conduzca a la igualdad
µ∗ ( G \ A) = µ∗ ( G ) − µ∗ ( A)
y, en consecuencia, poder asegurar, usando (⋆), que
µ∗ ( G \ A) < ε.
(⋆⋆)
¿Por qué esto es importante? Pues bien, lo que veremos en lo inmediato es que la colección M
de todos aquellos conjuntos A para los cuales (⋆⋆) se cumple para algún abierto G ⊇ A es una
muy buena elección en el sentido de que dicha colección es una σ-álgebra, tiene cardinalidad 2c
y µ∗ es numerablemente aditiva sobre M. Esto pequeño análisis permite justificar la siguiente
definición.
Definición 6.3.1. Un conjunto E ⊆ R se dice que es medible según Lebesgue, o simplemente medible
si, para cada ε > 0, existe un conjunto abierto G ⊇ E tal que
µ∗ ( G \ E) ≤ ε.
Con frecuencia escribiremos “conjunto medible” en lugar de “conjunto medible según Lebesgue”. Denotaremos por Mµ (R ) a la familia de todos los subconjuntos de R que son medibles según
Lebesgue, esto es,
Mµ (R ) = E ⊆ R : E es medible según Lebesgue .
Sec. 6.3 La Medida de Lebesgue
257
Observe que
Z 6∈ Mµ (R ) significa que existe un ε > 0 con la siguiente propiedad: para cada conjunto abierto
G ⊇ Z se cumple que µ∗ ( G \ Z ) > ε.
∞
Suponga, además, que µ∗ ( Z ) < +∞ y seleccione una sucesión In n=1 de intervalos
abiertos tal que
Z ⊆
∞
[
n =1
In
y
∞
X
ℓ( In ) < µ∗ ( Z ) + ε.
n =1
S
Pongamos G = ∞
n =1 In . Resulta que G es un conjunto abierto conteniendo a Z y, por lo
anterior, µ∗ ( G ) < µ∗ ( Z ) + ε, es decir, µ∗ ( G ) − µ∗ ( Z ) < ε. Por esto,
µ ∗ ( G \ Z ) > ε > µ ∗ ( G ) − µ ∗ ( Z ).
Esta observación permite señalar que sólamente los conjuntos medibles pueden garantizar la validez
de la desigualdad µ∗ ( G \ E) ≤ ε.
¿Cuáles conjuntos son medibles? Para verificar que la colección Mµ (R ) es una buena elección
debemos comprobar que ella es no vacía y contiene a casi todos conjuntos que son de utilidad en
el Análisis. Lo primero que debemos destacar es que Mµ (R ) es, de hecho, una colección muy
grande. En efecto, si OR denota la colección de todos los subconjuntos abiertos de R, entonces
( M1 ) OR ⊆ Mµ (R ).
En efecto, si A es un subconjunto abierto de R y si ε > 0, entonces tomando G = A, resulta
que G ⊇ A y, por consiguiente, µ∗ ( G \ G ) = 0 < ε. En particular,
R, ∅ ∈ Mµ (R )
con lo cual queda establecido que Mµ (R ) satisface (σ1 ).
( M2 ) card Mµ (R ) = 2c .
El conjunto ternario de Cantor Γ, como se demuestra en el Corolario 6.3.41, página 283, es
un conjunto nulo y, en consecuencia, P (Γ) ⊆ Mµ (R ) (véase el Teorema 6.3.2). Puesto que
card(Γ) = c, resulta que
card Mµ (R ) ≥ card(P (Γ)) = 2c .
Por otro lado,
Mµ (R ) ⊆ P (R ) y la cardinalidad de P (R ) es 2c , se tiene que
como
card Mµ (R ) ≤ 2c y, así
card Mµ (R ) = 2c .
Si bien es cierto que hay tantos conjuntos medibles como subconjuntos de R, existen, sin
embargo, elementos de P (R ) que no pertenecen a Mµ (R ).
( M3 ) M µ ( R ) $ P ( R ) .
Sólo resta encontrar un subconjunto de R que no sea medible. Esto hecho, sin embargo,
tendrá que esperar hasta que lleguemos a la Sección 6.5.1, página 310. Allí se demuestra
que el conjunto
¬ Mµ ( R ) = P ( R ) \ Mµ ( R )
es no vacío. Cualquier elemento de ¬ Mµ (R ) será llamado un conjunto no-medible.
258
Cap. 6 La Medida de Lebesgue en R
El siguiente resultado, el cual es fundamental en la Teoría de la Medida, establece que todo
conjunto nulo es medible.
Teorema 6.3.2. Si E ⊆ R y µ∗ ( E) = 0, entonces E es medible según Lebesgue.
Prueba. Suponga que µ∗ ( E) = 0 y sea ε > 0. Por el Teorema 6.2.12 existe un conjunto abierto
G ⊇ E tal que
µ∗ ( G ) ≤ µ∗ ( E) + ε = ε.
Puesto que G \ E ⊆ G, resulta, por la monotonía de µ∗ , que
µ∗ ( G \ E) ≤ µ∗ ( G ) ≤ ε.
Esto prueba que E ∈ Mµ (R ).
Del Teorema 6.3.2 y el Corolario 6.2.6 se concluye que:
( a) Cualquier subconjunto a lo más numerable es medible. En particular, los conjuntos N, Z y
Q son medibles.
(b) Γ, el conjunto ternario de Cantor, aunque es no-numerable, también es medible pues µ∗ (Γ) = 0.
(Véase el Corolario 6.3.41, página 283).
(c) En general, cualquier subconjunto de un conjunto nulo es medible, esto es,
µ∗ ( A) = 0 y
E⊆A
⇒
E ∈ Mµ ( R ) ,
lo cual es equivalente a expresarlo de este otro modo:
µ∗ ( A) = 0
⇒
P ( A ) ⊆ Mµ ( R ) .
Esta propiedad de la medida exterior de Lebesgue recibe el nombre de completitud y se
dice entonces que µ∗ es una medida completa cuando ella se restringe a la clase Mµ (R ). Es
importante advertir que: no es cierto que cualquier subconjunto de un conjunto medible sea medible.
Nuestra siguiente misión es escudriñar cuáles otras propiedades (importantes) posee la familia
Mµ (R ). Los siguientes resultados van a mostrar que Mµ (R ) es, en realidad, una σ-álgebra, es
decir, una clase de subconjuntos de R que es cerrada bajo complementos y uniones numerables,
además de verificar otras propiedades muy especiales. En general, cualquier σ-álgebra sirve para
definir la colección de los conjuntos que queremos “medir”.
Definición 6.3.3. Una familia no vacía M de subconjuntos de un conjunto no vacío X se dice que es una
σ-álgebra de X si:
(σ1 ) X ∈ M,
(σ2 ) X \ E ∈ M siempre que E ∈ M, y
S
(σ1 ) ∞
n =1 En ∈ M para cualquier colección numerable { En : n = 1, 2, . . . } ⊆ M.
Sec. 6.3 La Medida de Lebesgue
259
Si las condiciones (σ1 ) y (σ2 ) en la definición anterior se mantienen pero (σ3 ) se sustituye
por la siguiente:
S
(σ4 ) ni=1 Ei ∈ M para cualquier colección finita {Ei : i = 1, 2, . . . , n} ⊆ M,
entonces diremos que M es una álgebra de conjuntos.
Observe que cualquier σ-álgebra es una álgebra pero no recíprocamente. Veamos ahora que
la colección Mµ (R ) es cerrada bajo uniones numerables, es decir, satisface (σ3 ).
Teorema 6.3.4. Si ( En )∞
n =1 es una sucesión en Mµ (R ), entonces
S∞
n = 1 En
∈ Mµ ( R ) .
Prueba. Fijemos ε > 0. Para cada n ∈ N podemos seleccionar, usando el hecho de que En es
medible, un conjunto abierto Gn ⊇ En de modo tal que
ε
.
2n
S
S∞
Tomando G = ∞
n =1 Gn , resulta que G es abierto, G ⊇
n = 1 En , y
µ ∗ ( Gn \ En ) ≤
G\
∞
[
En =
n =1
[
∞
n =1
[
∞
∞
[
Gn \
En ⊆
( Gn \ En ) .
n =1
n =1
Por esto y la sub-aditividad numerable de µ∗ tenemos que
µ
∗
G\
Esto termina la prueba de que
∞
[
En
n =1
S∞
n =1
≤
∞
X
n =1
µ ∗ ( Gn \ En ) ≤
∞
X
ε
= ε.
2n
n =1
En es medible.
Para verificar que Mµ (R ) es una σ-álgebra sólo nos resta demostrar (σ2 ). Esto requiere un
poquito de trabajo. Comencemos.
Lema 6.3.5. Cualquier conjunto compacto K ⊆ R es medible según Lebesgue.
Prueba. En primer lugar, nótese que como K es compacto, podemos encontrar un intervalo cerrado y acotado I de modo que K ⊆ I y así, µ∗ (K ) ≤ ℓ( I ) < + ∞.
Fijemos ε > 0. Por el Teorema 6.2.12 existe un conjunto abierto, necesariamente acotado,
G ⊇ K tal que
µ∗ ( G ) ≤ µ∗ (K ) + ε.
Para demostrar que µ∗ ( G \ K ) ≤ ε vamos a proceder del modo siguiente. Siendo G \ K un
conjunto abierto, se sigue del Lema 2.2.10, página 124, que dicho conjunto se puede escribir en la
forma
∞
[
G\K =
In ,
n =1
donde ( In )∞
n =1Ses una sucesión de intervalos
tenemos que kn=1 Ik ⊆ G \ K ⊆ G y, por lo
compactos no-superpuestos. Para cualquier k ∈ N,
S
tanto, K ∪ kn=1 In ⊆ G. Más aun, los conjuntos K
260
Cap. 6 La Medida de Lebesgue en R
S
y kn=1 Ik son compactos y disjuntos. El Corolario 6.2.16 combinado con el Teorema 6.2.17 nos
garantizan que
∗
µ (K ) +
k
X
∗
ℓ( In ) = µ (K ) + µ
n =1
∗
[
k
In
n =1
= µ
∗
K∪
k
[
In
n =1
≤ µ ∗ ( G ).
Puesto que µ∗ (K ) < + ∞, la anterior desigualdad implica que
k
X
n =1
ℓ( In ) ≤ µ∗ ( G ) − µ∗ (K ) ≤ ε,
y como k ≥ P
1 es arbitrario, concluimos de la desigualdad anterior que la serie
∞
verge y que
n =1 ℓ( In ) ≤ ε. De nuevo, por el Teorema 6.2.17, se sigue que
∗
µ (G \ K ) =
∞
X
n =1
P∞
n =1 ℓ( In )
con-
ℓ( In ) ≤ ε.
Esto nos dice que K es medible y finaliza la prueba.
Corolario 6.3.6. Todo subconjunto cerrado de R es medible según Lebesgue.
S
Prueba. Suponga que F ⊆ R es cerrado. Como R = ∞
n =1 [− n, n ], entonces a F lo podemos
reescribir en la forma
∞
[
F ∩ [−n, n] .
F = F∩R =
n =1
Ya que cada F ∩ [−n, n] es un subconjunto compacto, el Lema 6.3.5 nos revela que él es medible
y, así, por el Teorema 6.3.4, se concluye que F es medible.
Estamos ahora en posesión de los argumentos para demostrar que el complemento de cualquier conjunto medible es medible.
Teorema 6.3.7. Si E ∈ Mµ (R ), entonces Ec = R \ E ∈ Mµ (R ).
Prueba. Suponga que E ∈ Mµ (R ) y para cada n ∈ N, escojamos un conjunto abierto Gn ⊇ E tal
que µ∗ ( Gn \ E) < 1/n. Defina Fn = Gnc . Entonces Fn es cerrado y, en consecuencia, medible
gracias al Corolario 6.3.6. Sea
∞
∞
[
[
F =
Fn =
Gnc .
n =1
n =1
El Teorema 6.3.2 garantiza que F es medible y, además, F ⊆ Ec . Sea Z = Ec \ F. Fijando
cualquier k ∈ N tenemos que
Z = Ec \
∞
[
n =1
Gnc ⊆ Ec \ Gkc = Gk \ E,
de donde se tiene que,
µ ∗ ( Z ) ≤ µ ∗ ( Gk \ E )
<
1
,
k
Sec. 6.3 La Medida de Lebesgue
261
para todo k ∈ N. De aquí se sigue que µ∗ ( Z ) = 0, y entonces, por el Teorema 6.3.2, Z es
medible. Por esto, Ec = F ∪ Z también es medible y termina la prueba.
Con el resultado anterior hemos finalizado la prueba de que:
Corolario 6.3.8. Mµ (R ) es una σ-álgebra.
A Mµ (R ) la llamaremos la σ-álgebra de Lebesgue. Cuando no exista ninguna ocasión de
producir una confusión, a los elementos de Mµ (R ) los llamaremos simplemente conjuntos medibles. Varias consecuencias se derivan inmediatamente a partir de la información de que Mµ (R )
es una σ-álgebra. Por ejemplo,
( β1 )
∞
\
n =1
En ∈ Mµ (R ) para cualquier sucesión En
∞
n =1
incluida en Mµ (R ).
En efecto, como En ∈ Mµ (R ) para todo n ∈ N, entonces Enc ∈ Mµ (R ) y, por lo tanto,
S
∞
c
n =1 En ∈ Mµ (R ). De las Leyes de Morgan se sigue que
∞
\
En =
n =1
[
∞
Enc
n =1
c
∈ Mµ ( R ) .
En particular,
m
[
n =1
m
\
y
En ∈ M µ ( R )
n =1
cualesquiera sean E1 , . . . , Em en Mµ (R ).
En ∈ M µ ( R )
( β2 ) Si Gδ (R ) y Fσ (R ) denotan a las familias de todos los conjuntos Gδ y Fσ de R, respectivamente, entonces
y
G δ ( R ) ⊆ Mµ ( R )
F σ ( R ) ⊆ Mµ ( R ) .
En general, cada una de las familias
Gδσ (R ) = Gδ σ (R ), Fσδ (R ) = Fσ δ (R ),
Gδσδ (R ),
Fσδσ (R ), . . .
están en Mµ (R ), donde cada elemento de Gδσ (R ) es una unión de elementos de Gδ (R ), similarmente, todo elemento de Fσδ (R ) es una intersección de elementos de Fσ (R ), etcétera.
∞
∞
( β3 ) Sea En n=1 una sucesión en Mµ (R ). Entonces existe una sucesión disjunta Fn n=1 en
Mµ (R ) tal que Fn ⊆ En para todo n ≥ 1 y
∞
[
En =
n =1
∞
[
Fn .
n =1
En efecto, pongamos F1 = E1 y para n ≥ 2, defina
Fn = En \
Es claro que la sucesión Fn
∞
n =1
n[
−1
Ej .
j=1
satisface las propiedades requeridas.
262
Cap. 6 La Medida de Lebesgue en R
∞
S
( β4 ) En n=1 es una sucesión de conjuntos nulos, entonces ∞
n =1 En es un conjunto nulo. Además,
!
∞
∞
[
X
µ
En =
µ ( En )
n =1
n =1
sin exigir que ellos sean disjuntos. Una consecuencia inmediata de ( β4 ) es que R no se
puede descomponer como una unión infinita numerable de conjuntos numerables.
En lo que sigue, si X ∈ Mµ (R ), escribiremos
Mµ ( X ) = Mµ ( R ) ∩ X = B ∩ X : B ∈ Mµ ( R )
=
E ∈ Mµ ( R ) : E ⊆ X .
Es fácil ver que Mµ ( X ) es una σ-álgebra de subconjuntos de X a la que llamaremos la σ-álgebra
de Lebesgue inducida por X o la σ-álgebra de Lebesgue de X.
Ya hemos visto que todo subconjunto de R se puede aproximar por conjuntos abiertos. Una
consecuencia importante del Teorema 6.3.7 es el siguiente resultado, el cual establece que cada
conjunto medible se puede aproximar por un algún conjunto cerrado.
Corolario 6.3.9. Sea E ∈ Mµ (R ). Para cada ε > 0, existe un subconjunto cerrado F ⊆ E tal que
µ∗ ( E \ F ) < ε.
Prueba. Por el Teorema 6.3.7, Ec ∈ Mµ (R ) y, por lo tanto, de la definición de conjunto medible,
existe un conjunto abierto G ⊇ Ec tal que µ∗ ( G \ Ec ) < ε. Tomando F = G c , resulta que F es
cerrado, F ⊆ E y, además, como E \ F ⊆ G \ Ec , se tiene entonces que µ∗ ( E \ F ) < ε.
El siguiente resultado combinado con el corolario anterior permitirá, en el caso de conjuntos
medibles de medida finita, aproximar tales conjuntos por conjuntos compactos.
Lema 6.3.10. Sea A ⊆ R con µ∗ ( A) < +∞. Entonces, para cada ε > 0, existe un conjunto acotado
A0 ⊆ A tal que µ∗ ( A \ A0 ) < ε. Además, si A es medible, entonces A0 también se puede elegir
medible.
Prueba. Sea ε > 0. Por el Teorema 6.2.12 existe un conjunto abierto G conteniendo a A tal que
µ∗ ( G ) ≤ µ∗ ( A) + 1 < + ∞. Un llamado al Teorema 2.2.4 nos permite escribir a G en la forma G =
S
∞
In , donde los In son intervalos abiertos y disjuntos dos a dos. El Teorema 6.2.17 nos dice
n =1P
∞
∗ G ) < + ∞ y, por lo tanto, podemos elegir un N ∈ N lo suficientemente
que
n =1 ℓ( In ) = µ (P
∞
grande de modo que
n = N +1 ℓ( In ) < ε. Sea ahora
A0 = A ∩
[
N
In .
n =1
Tenemos que A0 ⊂ A y como todos los intervalos In son de longitud finita, resulta
S∞ que A0 es
acotado. Nótese
S que si A es medible, también lo es A0 . Finalmente, como A ⊆ n=1 In , se sigue
que A \ A0 ⊆ ∞
n = N +1 In y, por lo tanto,
∗
µ ( A \ A0 ) ≤ µ
Esto termina la prueba.
∗
[
∞
n = N +1
In
≤
∞
X
ℓ( In ) < ε.
n = N +1
Sec. 6.3 La Medida de Lebesgue
263
6.3.2. La σ-álgebra de Borel
Existe otra σ-álgebra, conocida como la σ-álgebra de Borel, que juega un papel de primer
orden en la Teoría de la Medida sobre conjuntos con una estructura topológica. Observe que si
X es un conjunto arbitrario, entonces P ( X ) y {∅, X } son σ-álgebras. Cualquier otra σ-álgebra
A de X verifica que
{∅, X } ⊆ A ⊆ P ( X ).
Un procedimiento de carácter general que permite construir σ-álgebras partiendo de una clase
arbitraria de subconjuntos de un conjunto dado es el siguiente.
Teorema 6.3.11 (σ-álgebra generada). Sea X un conjunto no vacío y sea C una colección arbitraria
no vacía de subconjuntos de X. Entonces existe una única σ-álgebra σ C sobre X que verifica lo
siguiente:
( a) C ⊆ σ C , y
(b) Si B es otra σ-álgebra sobre X conteniendo a C, entonces σ C ⊆ B.
Prueba. Considere, en primer lugar, la colección
F = B : B es una σ-álgebra sobre X con C ⊆ B}.
Observe que F 6= ∅ ya que P ( X ) ∈ F. Defina
\
σ C =
B.
B ∈F
Es un ejercicio sencillo establecer que σ C es una σ-álgebra conteniendo a C. Más aun, por
construcción, ella satisface la propiedad (b) y, por supuesto, es única.
A la σ-álgebra σ C del teorema anterior se le llama la σ-álgebra generada por C y es la
σ-álgebra más pequeña conteniendo a C. Observe que:
( a) Si D ⊆ C, entonces σ D ⊆ σ C .
(b) Si A es una σ-álgebra, entonces σ A = A. En particular,
σ σ C = σ C .
La definición de σ-álgebra generada es, desde el punto de visto práctico, casi inoperante:
ella no ofrece ningún indicio de cómo se reconoce que un conjunto determinado pertenece o no
a dicha σ-álgebra. En las próximas líneas intentaremos esbozar un procedimiento que permite
conocer cómo son sus elementos. El programa para alcanzar tal objetivo comienza fijando un
conjunto no vacío X y después se considera C, una colección no vacía de subconjuntos de X.
Nuestro segundo paso es definir C0 = C ∪ {∅, X } (en el supuesto de que ∅ y X no están en la
colección) y luego considerar la colección
C1 = A ⊆ X : A ∈ C o A c ∈ C .
( 1)
Por supuesto, ésta colección puede no ser cerrada bajo uniones numerables, de modo que es
apropiado considerar la familia
[
∞
∞
B2 =
A j : A j j = 1 ∈ C1 .
j=1
264
Cap. 6 La Medida de Lebesgue en R
Así, podemos repetir el primer argumento y definir
C2 = A ⊆ X : A ∈ B2 o Ac ∈ B2 .
Observemos de nuevo de que no hay garantía de que la colección C2 sea cerrada bajo uniones numerables y, como antes, cabe considerar la familia B3 formada por todas las uniones numerables
de conjuntos pertenecientes a C2 . Si se continúa inductivamente con este proceso se obtienen,
por cada n > 1, el par de familias
[
∞
∞
Bn =
A j : A j j=1 ∈ Cn −1
y
C n = A ⊆ X : A ∈ Bn o A c ∈ Bn .
j=1
Nótese que C1 ⊆ C2 ⊆ · · · y que ninguna deSesas colecciones de conjuntos es igual a σ C , de
modo que es conveniente considerar la unión ∞
n =1 Cn . Sin embargo, esta unión no es, en general,
igual a σ C . ¿Cuántas veces hay que realizar este proceso para alcanzar a la σ-álgebra σ C ?
Para que éste ocurra necesitamos hacerlo ω1 -veces, lo que implica utilizar inducción transfinita.
Fijemos entonces un ordinal α con α < ω1 . Si α es un ordinal límite, defina
[
Cα =
Cβ .
β<α
Si α no es un ordinal límite, entonces él posee un predecesor inmediato, digamos α = β+ , y
entonces se define
[
∞
∞
Bα =
A j : A j j=1 ∈ C β .
( 2)
j=1
Finalmente, sea
Cα =
A ⊆ X : A ∈ Bα o A c ∈ Bα .
( 3)
Observe que: para cada α < ω1 , Bα ⊆ Cα . Además, se cumple que
Lema 6.3.12. Si β < α < ω1 , entonces
C β ⊆ Cα .
Prueba. Considere el conjunto
Λ =
α < ω1 :
[
β<α
C β ⊆ Cα .
Claramente α = 1 ∈ Λ. Sea α ∈ ω1 y veamos que la condición Seg(α) ⊆ Λ implica que α ∈ Λ.
En efecto, si α es un ordinal límite, entonces se sigue de la definición de Cα que α ∈ Λ. Asuma
ahora que α posee un predecesor inmediato, digamos β. Por la definición de Cα , tenemos que
C β ⊆ Cα . Sea γ ∈ Seg(α) = Seg( β+ ) = Seg( β) ∪ { β}. Si γ = β, entonces como fue observado
anteriormente, Cγ ⊆ Cα . Suponga que γ ∈ Seg( β). Puesto que β ∈ Seg(α) ⊆ Λ, se tiene que
[
Cγ ⊆
Cζ ⊆ C β ⊆ Cα .
ζ<β
S
Con esto se ha demostrado que Cγ ⊆ Cα para todo γ ∈ Seg(α), lo cual implica que γ<α Cγ ⊆ Cα
y, por lo tanto, α ∈ Λ. Un llamado al Principio de Inducción Transfinita nos revela entonces que
Λ = ω1 y termina la prueba.
Sec. 6.3 La Medida de Lebesgue
265
Teorema 6.3.13 (σ-álgebra generada). Sea X un conjunto no vacío y sea C una colección no vacía de
subconjuntos de X. Entonces
[
σ C =
Cα ,
α < ω1
donde la colección (Cα )α<ω1 se define como en (2) y (3).
S
Prueba. Pongamos Cω1 = α < ω1 Cα y veamos que σ C = Cω1 . En primer lugar vamos a
demostrar que Cω1 es una σ-álgebra conteniendo a C. Para ello, defina
Λ = α < ω1 : Cα es cerrada bajo complementos .
Si logramos que demostrar que Λ = ω1 , entonces concluiremos que Cω1 es cerrada bajo complementos. Sea α < ω1 y suponga que Λα = Seg(α) ⊆ Λ. Observe que si α = 1 o si α tiene un
predecesor inmediato, entonces se sigue de
S la definición de Cα que α ∈ Λ. Suponga entonces
que α es un ordinal límite y sea E ∈ Cα = β<α C β . Entonces E ∈ C β para algún β ∈ Λα . Puesto
que Λα ⊆ Λ, se concluye C β es cerrada bajo complementos. Por esto, Ec ∈ C β ⊆ Cα , lo cual
nos dice que Cα es cerrada bajo complementos y, en consecuencia, α ∈ Λ. En conclusión, hemos
demostrado que para cualquier ordinal α < ω1 , la condición Λα ⊆ Λ implica que α ∈ Λ. El
Principio de Inducción Transfinita nos revela entonces que Λ = ω1 .
Para terminar de verificar que
∞ Cω1 es una σ-álgebra sólo nos queda probar que es cerrada bajo
uniones numerables. Sea Ej j=1 ⊆ Cω1 . Entonces existe una colección numerable {α j : j ∈ N }
tal que Ej ∈ Cα j . Por el Teorema 1.3.32, página 63, sabemos que β = sup{α j : j ∈ N } existe. Sea
α0 = β+ . Puesto que α j ≤ β para todo j ∈ N, resulta del Lema 6.3.12 que Cα j ⊆ C β de donde se
∞
S
S
obtiene que Ej j=1 ⊆ C β . Finalmente, por definición, ∞
α < ω1 C α = C ω1 .
j = 1 E j ⊆ Bα0 ⊆ C α0 ⊆
Claramente, C ⊆ Cω1 , de modo que Cω1 es una σ-álgebra conteniendo a C y en consecuencia,
σ C ⊆ C ω1 .
Para demostrar la otra inclusión, sea
Λ =
α < ω1 : Cα ⊆ σ C
.
Por la definición de Cα se tiene que: si Λα = Seg(α) ⊆ Λ, entonces α ∈ Λ. Se sigue del Principio
de Inducción Transfinita que Λ = ω1 y de esto se sigue que Cα ⊆ σ C para todo α < ω1 y, por
lo tanto,
[
C ω1 =
Cα ⊆ σ C .
α < ω1
La prueba es completa.
Observe que al ser Cω1 una σ-álgebra, no se generan nuevos conjuntos en Cω1 tomando
complementos, así como tampoco formando uniones numerables de sus elementos, de modo tal
que el proceso realmente finaliza en ℵ1 -pasos.
Otra manera de caracterizar a σ(C) es mirar las colecciones numerables que habitan en C y
considerar las σ-álgebras que ellas generan. Se obtiene entonces el siguiente resultado.
Teorema 6.3.14. Sea X un conjunto no vacío y sea C una colección no vacía de subconjuntos de X.
Entonces
[
σ (C) =
σ (F ).
F ⊆C
F numerable
266
Cap. 6 La Medida de Lebesgue en R
Prueba. Pongamos
A =
[
σ (F )
F ⊆C
F numerable
y veamos que A = σ(C). En primer lugar, observe que para cualquier colección numerable
F ⊆ C, se tiene que σ(F ) ⊆ σ(C), de donde se sigue
[
A =
σ (F ) ⊆ σ (C).
F ⊆C
F numerable
Para verificar la otra inclusión es suficiente demostrar que A es una σ-álgebra conteniendo a C.
Sea E ∈ A. Entonces E ∈ σ(F ) para alguna colección numerable F ⊆ C. Puesto que σ(F ) es
c
una σ-álgebra, resulta que
∞ E ∈ σ(F ) ⊆ A. Esto muestra que A es cerrada bajo complementos.
Suponga ahora que En n=1 es una sucesión en A. Entonces, para
S∞cada n ∈ N, existe un
conjunto numerable Fn ⊆ C tal que En ∈ σ(Fn ). Si hacemos F = n=1 Fn , se tiene que F es
numerable y
∞
∞
[
[
En ∈
σ(Fn ) ⊆ A.
n =1
n =1
Con esto se concluye que A es cerrada bajo uniones numerables y, en consecuencia, es una σálgebra. Falta comprobar que A contiene a C. Para ver esto, sea E ∈ C. Puesto que F = {E} es
una colección numerable (posee un único elemento), resulta que E ∈ σ(F ) ⊆ A, es decir, C ⊆ A.
Por esto, σ(C) ⊆ A y termina la prueba.
Definición 6.3.15. Sea ( X, τ ) un espacio topológico y denote por OX la familia de todos los subconjuntos
abiertos de X. La σ-álgebra generada por OX es llamada la σ-álgebra de Borel y denotada por Bo( X ).
Los elementos de la σ-álgebra Bo( X ) serán llamados conjuntos de Borel o, simplemente,
borelianos de X. Recordemos que si Y ⊆ X, entonces un conjunto V ⊆ Y es abierto en Y si,
y sólo si, V = G ∩ Y para algún conjunto abierto G ⊆ X. Fijemos un conjunto Y ∈ Bo( X ) y
considere la familia OY = {G ∩ Y : G ∈ OX }, entonces
Bo(Y ) = σ(OY ) = Bo( X ) ∩ Y = E ∩ Y : E ∈ Bo( X ) .
A los elementos de Bo(Y ) los llamaremos los conjuntos de Borel de Y.
Por definición, Bo(R ) = σ(OR ), pero no se necesitan a todos los conjuntos abiertos para
generar a Bo(R ). De hecho, existen algunas colecciones “más simples” que OR que generan a
Bo(R ).
Ejemplo 6.3.1. Considere las siguientes colecciones:
A1 = { I ⊆ R : I es un intervalo abierto}
A2 = { J ⊆ R : J es un intervalo cerrado}
A3 = { I ⊆ R : I es un intervalo de la forma ( a, b], a, b ∈ R, a ≤ b}
A4 = { F ⊆ R : F es un conjunto cerrado}
A5 = {K ⊆ R : K es un conjunto compacto}
A6 = { I ⊆ R : I es un intervalo de la forma (−∞, a], a ∈ R }
A7 = { I ⊆ R : I es un intervalo de la forma ( a, +∞), a ∈ R }
Sec. 6.3 La Medida de Lebesgue
267
Entonces se cumple que:
Bo(R ) = σ(A j ),
para j = 1, 2, . . . , 7.
( 1)
Prueba. Puesto que A1 ⊆ OR , resulta que
σ(A1 ) ⊆ Bo(R ).
Por otro lado, como todo conjunto abierto es una unión numerable y disjunta de conjuntos abiertos, se tiene que OR ⊆ σ(A1 ) y, por consiguiente,
Bo(R ) ⊆ σ(A1 ).
Esto prueba que Bo(R ) = σ(A1 ). Para ver, por ejemplo, que Bo(R ) = σ(A2 ), observe que para
cualquier intervalo cerrado [ a, b],
∞ \
[a, b] =
n =1
1
1
a− , b+
n
n
∈ σ(OR )
y así, A2 ⊆ Bo(R ). De esto se sigue que σ(A2 ) ⊆ Bo(R ). Recíprocamente, como todo intervalo
abierto ( a, b) se puede escribir en la forma
( a, b) =
∞ [
n =1
1
1
a+ , b−
,
n
n
resulta que A1 ⊆ σ(A2 ). Por esto y la primera parte se concluye que Bo(R ) = σ(A1 ) = σ(A2 ).
Similarmente, como
( a, b) =
∞ [
n =1
1
a, b −
n
y
( a, b] =
∞ \
n =1
1
a, b +
n
se deduce que Bo(R ) = σ(A3 ). El resto de las afirmaciones en (1) se dejan a cargo del lector. Recordemos que si ( X, d) es un espacio métrico separable, entonces existe una colección
numerable V = {V1 , V2 , . . .} de subconjuntos abiertos de X con la siguiente propiedad: para
∞
cualquier
S∞ abierto no vacío G ⊆ X, existe una subcolección de V, digamos (Vnk )k=1 , tal que
G = k=1 Vnk . A la colección V se le llama una base numerable para X.
Definición 6.3.16. Sea ( X, A) un espacio medible. Si A = σ C para alguna subcolección numerable
C de A, entonces diremos que A, es numerablemente generada.
Lema 6.3.17. Si ( X, d) es un espacio métrico separable, entonces Bo( X ) es numerablemente generada.
Prueba. Sea V una base numerable para X. Puesto que V ⊆ OX ⊆ Bo( X ), resulta que σ(V) ⊆
Bo( X ). Por otro lado, como cualquier G ∈ OX puede ser escrito como una unión numerable
de elementos de V, se tiene que O ⊆ σ(V) y ya que σ(V) es una σ-álgebra conteniendo a OX ,
resulta que Bo( X ) ⊆ σ(V). Esto termina la prueba.
268
Cap. 6 La Medida de Lebesgue en R
6.3.3. La Cardinalidad de la σ-álgebra de Borel
Como OR ⊆ Mµ (R ) y Mµ (R ) es una σ-álgebra, resulta de la definición de Bo(R ) que
Bo(R ) ⊆ Mµ (R )
de donde se tiene que card(Bo(R )) ≤ card(Mµ (R )) = 2c .
Veremos a continuación que la σ-álgebra de Borel, Bo(R ), en comparación con la σ-álgebra
de los conjuntos medibles según Lebesgue es, en el sentido de cardinalidad, muchísimo más
pequeña. De hecho, del próximo resultado se deducirá que la gran mayoría de los conjuntos
medibles según Lebesgue nunca son borelianos lo que evidencia lo extraño que puede ser un
conjunto medible Lebesgue que no sea boreliano.
Teorema 6.3.18. card Bo(R ) = c.
S
Prueba. Sea (Cα )α<ω1 la colección definida anteriormente tal que Bo(R ) = α<ω1 Cα , donde
C0 = OR . Usaremos inducción transfinita para demostrar que card(Cα ) = c para todo α < ω1 .
En efecto, por (6) del Teorema 1.3.47, página 74, sabemos que c = card(OR ) = card(C0 ). Sea
hemos demostrado que card(C β ) = c para todo β < α. Si α es un ordinal
α < ω1 y suponga queS
límite, entonces Cα = β<α C β y como el conjunto Seg(α) = { β : β < α} es infinito numerable,
se tiene que
[ card(Cα ) = car
C β = ℵ0 · c = c.
β<α
Suponga ahora que α posee un predecesor inmediato β. Entonces, por definición,
Bα =
[
∞
Aj :
j=1
Aj
∞
j=1
∈ Cβ
y, en consecuencia, card(Bα ) = card(C β )ℵ0 = cℵ0 = c. Puesto que
Cα = A ⊆ X : A ∈ Bα o Ac ∈ Bα = Bα ∪ Bcα ,
resulta que card(Cα ) = card(Bα ) + card(Bα ) = c + c = c. Esto termina la prueba de que
card(Cα ) = c para todo α < ω1 . Finalmente,
[ card Bo(R ) = card
Cα = c · c = c.
α < ω1
La prueba es completa.
Corolario 6.3.19 (Lebesgue). Bo(R ) $ Mµ (R ).
Prueba. Puesto que
card Bo(R )
el resultado sigue.
= c < 2c = card(Mµ (R ))
Del resultado anterior se deduce que existen conjuntos medibles que no son borelianos. ¿Dónde habitan tales conjuntos? La respuesta es sencilla: en los conjuntos nulos.
Sec. 6.3 La Medida de Lebesgue
269
Corolario 6.3.20. Existen conjuntos nulos que no son borelianos, esto es, Nµ (R ) " Bo(R ). Más
aun, si X es cualquier subconjunto no-numerable de R, entonces existe un conjunto A ⊆ X tal que
A 6∈ Bo(R ).
Prueba. Puesto que Γ ∈ Nµ (R ), entonces,
P ( Γ ) ⊆ N µ ( R ) ⊆ Mµ ( R ) .
Por otro lado, como card(P (Γ)) = card(Mµ (R )) = 2c , resulta, por una nueva aplicación del
Teorema de Cantor, que:
2c = card(Nµ (R )) > c.
Esto nos revela que Nµ (R ) " Bo(R ). La prueba de la segunda parte es simple. En efecto, por el
Teorema 6.3.18 y el Teorema de Cantor se tiene que:
c = card(Bo(R )) = card(R ) = card( X ) < card(P ( X )) = 2c ,
es decir, existe al menos un conjunto A ⊆ X tal que A 6∈ Bo(R ). La prueba es completa.
Observe que el argumento de cardinalidad usado para demostrar, en el corolario anterior, la
existencia de un conjunto no boreliano en cualquier conjunto no-numerable no es aplicable para
obtener un conjunto no-medible según Lebesgue. De hecho, dicha prueba no afirma que A sea
medible según Lebesgue. Más adelante veremos, véase el Ejercicio 6.7.1 (d), página 354, que existe
otro modo de probar la existencia de conjuntos medibles y, en particular, de conjuntos nulos que
no son borelianos sin usar la noción de cardinalidad.
El siguiente resultado constituye otro modo de pensar a la σ-álgebra de Borel. Como siempre,
las colecciones OR y FR son, respectivamente, los conjuntos abiertos y cerrados de R.
Lema 6.3.21. Sea S(R ) la colección más pequeña de subconjuntos de R que cumple:
( a) OR , FR ⊆ S(R ),
(b) S(R ) es cerrada bajo la formación de intersecciones numerables, y
(c) S(R ) es cerrada bajo la formación de uniones numerables disjuntas.
Entonces Bo(R ) = S(R ).
Prueba. Sea S0 = { A : A ∈ S(R ) y Ac ∈ S(R )}. Es claro que S0 ⊆ S(R ) ⊆ Bo(R ). Si
logramos demostrar que S0 es una σ-álgebra conteniendo a los subconjuntos abiertos de R,
tendríamos que S0 = S(R ) = Bo(R ) y terminaría la prueba.
Por definición,
∞ S0 contiene a los conjuntos abiertos y es cerrada bajo complementos. Suponga
ahora que An n=1 es una sucesión de conjuntos en S0 . Si definimos F1 = A1 y para n ≥ 2,
Fn = An \
n[
−1
j=1
A j = An ∩
\
n
j=1
Acj
S∞
S∞
S∞
resulta que cada Fn S
∈ S(R ) y como
n =1 A n =
n =1 Fn se tiene que
n =1 A n ∈ S(R ) y, por
T
∞
∞
c =
c ∈ S(R ) ya que cada A c ∈ S(R ). De esto se sigue
supuesto,
también
(
A
)
A
n
n =1 n
n =1 n
S
que ∞
A
∈
S
.
Con
esto
quedad
demostrado
que
S
es
una
σ-álgebra conteniendo a los
n
0
0
n =1
subconjuntos abiertos de R y finaliza la prueba.
270
Cap. 6 La Medida de Lebesgue en R
A pesar de ser Bo(R ) un conjunto muy pequeño, en relación a su cardinalidad, con respecto
a Mµ (R ), curiosamente Mµ (R ) es sólo un “poquito más grande” que Bo(R ) en el siguiente
sentido: como veremos en el Teorema 6.3.55, página 293, se tendrá que
Mµ (R ) = Bo(R ) ∪ Nµ (R ).
Este hecho nos muestra que todo conjunto medible se diferencia de un conjunto boreliano sólo
por un conjunto de medida cero. Otra manera de decir esto es que Bo(R ) es la completación
de Mµ (R ). Por ésta y muchas otras razones, los conjuntos borelianos son extremadamente
importantes.
Nota Adicional 6.3.1 El resultado anterior, Corolario 6.3.19, nos muestra que existen conjuntos
medibles según Lebesgue que no son medibles según Borel sin mostrar ni un sólo ejemplo concreto
del tal fenómeno y, además, que la totalidad de los conjuntos de Borel es infinitamente más
pequeño que la de todos los conjuntos medibles según Lebesgue, en otras palabras, la “gran
mayoría” de los conjuntos medibles según Lebesgue nunca son borelianos.
Aunque a Lebesgue le parecía dudoso que alguien pudiera jamás nombrar un conjunto
medible según Lebesgue que no fuese de Borel, el matemático ruso Nicolas Lusin (18831950) fue el primero en construir explícitamente un conjunto medible Lebesgue que no
era de Borel. El ejemplo es el siguiente: Considere el conjunto S compuesto de todas
las fracciones continuas [ a0 ; a1 , a2 , . . .] que cumplen con la siguiente propiedad: existe una
subsucesión (n j )∞
j=1 tal que an j es un divisor de an j +1 para todo j ∈ N. Lusin demostró
que S es medible según Lebesgue (de hecho, un conjunto analítico) pero no es boreliano.
En la próxima sección veremos una versión más general de este hecho. Por otro lado, en el
espacio de Banach con la norma del supremo, C ([ a, b]), formado por todas las funciones
f : [ a, b] → R que son continuas, el conjunto D ⊆ C ([ a, b]) de las funciones que son
diferenciables en todo punto de [ a, b] constituye un conjunto que no es de Borel. Un poco
más adelante, en la sección sobre Ejemplos y Contraejemplos usando la Función de Cantor,
veremos otro modo de mostrar conjuntos medibles según Lebesgue que no son borelianos.
La siguiente observación puede ser de interés al lector: El Axioma de Elección (en su versión
numerable) es el responsable de que exista un continuum de conjuntos borelianos. Sin
embargo, rechazando dicho axioma se puede construir un modelo ZF + ¬AC en el cual
pueden ocurrir cosas como estas: (véase, [101], p. 103):
( a) card(Bo(R )) > c.
(b) Cualquier conjunto de números reales sería un conjunto de Borel y la medida de Lebesgue dejaría de ser numerablemente aditiva.
(c) La jerarquía de los conjuntos de Borel se colapsaría en los primeros cuatro niveles.
En estas circunstancias, y desde el punto de vista del analista, la colección card(Bo(R ))
sería poco útil.
La jerarquía boreliana
Siguiendo la convención establecida en la Teoría Descriptiva de Conjuntos, definamos las
colecciones, comenzando con α = 1,
Σ01 = G ⊆ R : G es abierto = OR
Π01 = R \ G : G ∈ Σ01 = FR
Sec. 6.3 La Medida de Lebesgue
271
y, para cada 1 < α < ω1 , defina
Σ0α
=
[
β<α
Π0
β
!
Π0α
,
[
=
β<α
σ
Σ0
β
!
∆0α = Σ0α ∩ Π0α .
y
δ
∞
Así, un conjunto A ∈ Σ0α para α > 1, si existe una sucesión de conjuntos An n=1 tal que
S
0
An ∈ Π0 para algún β n < α y A = ∞
n =1 A n . Similarmente, un conjunto A ∈ Π α para
βn
∞
α > 1, si existe una sucesión de conjuntos An n=1 tal que An ∈ Σ0 para algún β n < α
βn
T
y A= ∞
A
.
Se
verifica
entonces
que
n =1 n
Bo(R ) =
[
Σ0α =
α < ω1
[
Π0α =
α < ω1
[
∆0α
α < ω1
es decir, los conjuntos de Borel se construyen en una jerarquía de longitud ω1 conocida
como la jerarquía de Borel. Observe que
Σ02 = Fσ ,
Π02 = Gδ ,
Σ03 = Gδσ ,
Π03 = Fσδ , . . .
⊆
⊆
Σ04
Π03
⊆
Π04
⊆
···
⊆
···
⊆
Π02
⊆
⊆
⊆
Σ03
⊆
⊆
Π01
⊆
⊆
⊆
Σ02
⊆
⊆
⊆
Σ01
⊆
En este sentido, cada conjunto de Borel posee una plantilla de construcción, conocido como
código de Borel, que detalla exactamente cómo ellos han sido construidos a partir de los
conjuntos abiertos.
⊆
···
⊆
Σ0α
···
···
Π0α
···
El hecho de que la formación de todas esas colecciones debe ser llevada a cabo hasta el
primer ordinal no-numerable para obtener a Bo(R ) se puede evidenciar
con el siguiente
∞
argumento: suponga, por ejemplo, que elegimos una sucesión An n=1 de modo que
A1 ∈ Σ02 \ Σ01 ,
A2 ∈ Σ03 \ Σ02 ,
A3 ∈ Σ04 \ Σ03 , . . .
S
0 ∞
El conjunto ∞
n =1 A n , ¿a cuál de las familias ( Σ k ) k=1 pertenece? La respuesta es que no
hay garantía de que esté en alguna de ellas. La única certeza que tenemos es que pertenece
a alguna de las familias obtenidas en el paso ω + 1. Si se continúa con este proceso de
selección de sucesiones se puede apreciar lo que afirmamos anteriormente.
6.3.4. Conjuntos Analíticos
En esta sección veremos otro modo de demostrar la existencia de un conjunto medible que
no es de Borel. Esto requiere introducir una familia muy especial de conjuntos medibles según
Lebesgue, denominados conjuntos analíticos, que contiene a los conjuntos de Borel propiamente.
272
Cap. 6 La Medida de Lebesgue en R
Este método permite la existencia de conjuntos medibles que no son borelianos sin apelar al
argumento de cardinalidad.
La motivación para introducir la noción de los conjuntos analíticos es el siguiente resultado
el cual es una pieza clave para determinar si un conjunto dado es o no un conjunto de Borel
partiendo de una función dada.
Lema 6.3.22 (Imagen e imagen inversa de borelianos). Sea f : R → R una función.
(1) Si f es estrictamente creciente, entonces f −1 ( B) ∈ Bo(R ), para cualquier B ∈ Bo(R ).
(2) Si f es continua e inyectiva, entonces f ( B) ∈ Bo(R ), para cualquier B ∈ Bo(R ).
Prueba. (1) Considere la siguiente colección de subconjuntos de R,
B = B ⊆ R : f −1 ( B) ∈ Bo(R ) .
Es un ejercicio sencillo establecer que B es una σ-álgebra. En efecto, es claro que ∅ ∈ B. Si
B ∈ B, entonces R \ B también está en B ya que
f −1 R \ B = f −1 (R ) \ f −1 ( B) = R \ f −1 ( B) ∈ Bo(R ).
∞
Sea Bn n=1 una sucesión de conjuntos en B. Entonces
f
−1
[
∞
n =1
S∞
Bn
=
∞
[
n =1
f −1 ( Bn ) ∈ Bo(R ).
Esto prueba que n=1 Bn ∈ B y así, B es una σ-álgebra.
Como f es estrictamente creciente, ella es, en particular, sobreyectiva y, así,
f es biyectiva.
Para cada a ∈ R seleccione un x tal que a = f ( x) y observe que f −1 ( a, +∞) = ( x, +∞) ∈ B.
Esto prueba que ( a, +∞) ∈ B y, similarmente, (−∞, b) ∈ B para cada b ∈ R. De aquí se sigue
que ( a, b) ∈ B para cualesquiera a < b ya que
f −1 ( a, b) = f −1 ( a, +∞) ∩ f −1 (−∞, b) ∈ Bo(R ).
De lo anterior se concluye que O ⊆ B y, por lo tanto, Bo(R ) ⊆ B.
(2) Como f es inyectiva, ella es estrictamente monótona y, en consecuencia, biyectiva. Considere
C = B ⊆ R : f ( B) ∈ Bo(R ) .
De la biyectividad de f se sigue que C es una σ-álgebra. Veamos que C contiene a O. En efecto,
puesto que f es continua y biyectiva, ella envía intervalos abiertos en intervalos abiertos. Sea
G ∈ O y exprese dicho conjunto como una unión disjunta
S
S∞ de intervalos abiertos, digamos, G =
∞
n =1 Jn . De la biyectividad de f se sigue que f ( G ) =
n =1 f ( Jn ) ∈ Bo(R ) y, por consiguiente,
O ⊆ C. De aquí se deduce que Bo(R ) ⊆ C.
Del resultado anterior se concluye que si f es un homeomorfismo, entonces dicha función
preserva conjuntos de Borel, así como imágenes inversa, esto es:
Corolario 6.3.23. Si f : R → R es un homeomorfismo, entonces f preserva conjuntos borelianos
así como sus imágenes inversas, es decir, para todo B ⊆ R
f −1 ( B) ∈ Bo(R )
⇔
B ∈ Bo(R )
⇔
f ( B) ∈ Bo(R ).
Sec. 6.3 La Medida de Lebesgue
273
Es importante señalar que la validez de la segunda equivalencia del corolario anterior no se
extiende a los conjuntos medibles. Esto significa, véase el ejemplo dado en el Ejercicio 6.7.1 (c),
página 354, que existe un homeomorfismo f : R → R y existe al menos un conjunto medible
E ∈ Mµ (R ) tal que f ( E) 6∈ Mµ (R ).
Definición 6.3.24. Una función f : R → R se dice que es medible según Borel si f −1 ( B) ∈ Bo(R )
para cualquier B ∈ Bo(R ).
Se sigue del Ejercicio 6.3.1 (7) que una función f : R → R es medible según Borel si
f −1 (( a, +∞)) ∈ Bo(R ) para cualquier a ∈ R. Observe que, gracias al Lema 6.3.22, toda función
estrictamente creciente f : R → R es medible según Borel. Por supuesto, si f : R → R es
continua, entonces f es medible según Borel. En particular, todo homeomorfismo f : R → R es
medible según Borel.
Fijemos ahora una función medible Borel f : R → R y sea B ∈ Bo(R ). ¿Es f ( B) ∈ Bo(R )?
Por supuesto, si f es continua e inyectiva, el Lema 6.3.22 provee una respuesta positiva; sin
embargo, en el caso general, no hay garantía de que f ( B) ∈ Bo(R ). En esta parte estamos
interesados en investigar la clase de todos los conjuntos A ⊆ R que son imágenes de un algún
conjunto de Borel bajo alguna aplicación medible Borel f : R → R.
Sean X, Y conjuntos arbitrarios. Recordemos que la proyección sobre X, proy1 : X × Y → X,
viene dada por proy1 ( x, y) = x para todo ( x, y) ∈ X × Y.
Definición 6.3.25. Un conjunto A ⊆ R se dice que es un conjunto analítico si satisface una de las
siguientes condiciones equivalentes:
( a) Existe una función medible Borel f : R → R y un conjunto B ∈ Bo(R ) tal que f ( B) = A.
(b) Existe una función continua f : R → R y un conjunto B ∈ Bo(R ) tal que f ( B) = A.
(c) Existe un subconjunto cerrado B ⊆ R × N cuya proyección sobre R es A, esto es, proy1 ( B) = A.
(d) Existe una función continua f : N → R tal que f (N) = A.
En general, si se reemplaza el conjunto R por cualquier espacio Polaco X, entonces la noción
de conjunto analítico en X permanece inalterable. Sin embargo, en estas notas, sólo nos interesa
su estudio restringido al espacio Polaco R. La condición (d) de la definición anterior es, tal
vez, la más practica y, por supuesto, la más utilizada. El siguiente resultado establece que R es
analítico.
Lema 6.3.26. Existe una función continua f : N → R tal que f (N) = R.
Prueba. Sea D = {qn : n ∈ N } una enumeración de todos los números racionales. Puesto que
cada x ∈ R es el límite de alguna subsucesión del conjunto D, uno puede intentar definir la
aplicación g : N → R por
g (nk )∞
k=1 = lı́m qn k .
k→∞
El problema con esta definición es que el límite del lado derecho puede que no exista. Más aun,
en el supuesto que dicho límite exista, no hay garantía de que la aplicación g sea continua. Para
remediar esta situación, debemos proceder con más cuidado. Para cada α = (nk )∞
k=1 ∈ N defina
α
x1 = qn1 y para todo k ≥ 1, sea
(
q n k +1
si xkα − qnk +1 < 2−k ,
α
xk+1 =
xkα
en otro caso.
274
Cap. 6 La Medida de Lebesgue en R
La sucesión así obtenida ( xkα )∞
k=1 es claramente de Cauchy en R y, en consecuencia, converge a
un único x α ∈ R. Definamos ahora f : N → R por
f (α) = x α
∞
para cada α = (nk )∞
k=1 ∈ N. Veamos que f es continua. En efecto, sean α = ( n k ) k=1 y β =
∞
(mk )k=1 dos elementos distintos de N y suponga que N = ı́nf{k ∈ N : nk 6= mk }. Entonces
d(α, β) = 2− N y, por consiguiente, los N primeros términos de las sucesiones correspondientes,
β ∞
( xkα )∞
k=1 y ( xk ) k=1 coinciden. De esta información se tiene que todos los demás términos de
β
ambas sucesiones están a una distancia menor que 1/2N de x Nα y x N respectivamente y, por lo
tanto, la continuidad de f sigue de esto. Finalmente, puesto que D es denso en R, se tiene que
f es sobreyectiva y termina la prueba.
Observe que la función f : N → R construida en el lema anterior es también inyectiva,
aunque f no es un homeomorfismo. Una razón para que eso no ocurra es que N es totalmente
disconexo, es decir, N contiene una base cuyos elementos son abiertos y cerrados al mismo
tiempo y, por supuesto, R no posee una tal base.
Lema 6.3.27. Los siguientes conjuntos son homeomorfos a N:
( a) N × N.
( b ) NN .
Prueba. ( a) La aplicación ϕ : N → N × N definida por
ϕ((n1 , n2 , n3 , . . . )) = (n1 , (n2 , n3 , . . .))
( 2)
es claramente un homeomorfismo. Para demostrar la parte (b), considere la función φ : N → NN
dada por
φ ( n1 , n2 , . . . ) = ( n1 , n2 , . . . ) , ( n2 , n3 , . . . ) , ( n3 , n4 , . . . ) , . . . .
No es difícil establecer que φ es un homeomorfismo.
Como es costumbre, denotaremos por Σ11 a la familia de todos los subconjuntos analíticos de R.
Una consecuencia inmediata de nuestra definición es que los conjuntos analíticos se preservan
bajo funciones continuas.
Teorema 6.3.28. Si f : R → R es una función continua y A ∈ Σ11 , entonces f ( A) ∈ Σ11 .
Prueba. Como A es analítico, existe una función continua g : N → R tal que g(N) = A. La
función h : N → R dada por h( x) = f ( g( x)) es continua y verifica que h(N) = f ( A), es decir,
f ( A) ∈ Σ11 .
Se sigue de la definición de conjunto analítico que cualquier intervalo abierto (cerrado) es un
conjunto analítico. Nos proponemos demostrar que Σ11 es una clase muy amplia para tenerla en
consideración. De hecho, vamos a demostrar que
Lema 6.3.29. Si
son analíticos.
An
∞
n =1
Bo(R ) ⊆ Σ11 ⊆ Mµ (R ).
es una sucesión de conjuntos analíticos, entonces
S∞
n =1
An y
T∞
n =1
An
Sec. 6.3 La Medida de Lebesgue
275
Prueba. Sea n ∈ N. Como An es analítico, escojamos una función continua f n : N → R tal que
f n (N) = An . Defina g : N × N → R por
g((n, (n1 , n2 , . . . ))) = f n (n1 , n2 , . . .)
Es claro que g es continua y, por lo tanto, f = g ◦ ϕ también lo es, donde ϕ es la función dada
por (2). De aquí se sigue que
f (N ) = g ϕ (N )
Esto prueba que
junto
∆ =
S∞
n =1
n
= g(N × N ) =
∞
[
n =1
g {n } × N) =
An ∈ Σ11 . Para demostrar que
T∞
n =1
∞
[
f n (N ) =
n =1
∞
[
An .
n =1
An ∈ Σ11 , primero considere el con-
x = ( x1 , x2 , . . .) ∈ NN : f m ( xm ) = f n ( xn ) para todo m, n ∈ N
o
g : ∆ → R mediante la igualdad
y observe que ∆ es cerrado en NN . Finalmente, definiendo
T
g( x) = f1 ( x1 ) resulta que g es continua y g(∆) = ∞
A
n =1 n . Extienda g, haciendo uso del
Teorema de Extensión de Tietze (Teorema 7.2.19, página 391), a una función continua f definida
sobre NN y luego aplique el Lema 6.3.27 (b) para finalizar la prueba.
Estamos ahora en posesión de los argumentos para demostrar que:
Teorema 6.3.30. Bo(R ) ⊆ Σ11 ⊆ Mµ (R ).
Prueba. Puesto que todo conjunto abierto no vacío es unión numerable de intervalos abiertos y
todo intervalo abierto es analítico, se sigue del resultado anterior que O ⊆ Σ11 . Además, como
Σ11 satisface las condiciones ( a), (b) y (c) del Lema 6.3.21 se tiene que Bo(R ) ⊆ Σ11 .
Para demostrar que todo conjunto analítico es medible, suponga que A es un conjunto analítico y escoja una función continua f : N → R tal que f (N) = A. Sin perder generalidad,
asumiremos que µ∗ ( A) < +∞. Defina, para cada k ∈ N, el conjunto
n
o
L( k ) = ( m n ) ∞
∈
N
:
m
≤
k
.
1
n =1
Observe que L(1) ⊆ L(2) ⊆ · · · y N =
S∞
A = f (N ) = f
k =1 L( k ),
de donde resulta que
[
∞
L( k )
k=1
Puesto que la sucesión
f (L(k))
∞
=
∞
[
f (L(k)).
k=1
es creciente, se sigue del Corolario 6.3.46, página 286, que
µ∗ ( A) = lı́m µ∗ f (L(k)) .
k=1
k→∞
Fijemos un ε > 0 arbitrario y seleccione un entero n1 > 1 lo suficientemente grande de modo
que
µ∗ f (L(n1 )) > µ∗ ( A) − ε.
S
Como L(n1 ) = ∞
k=1 L( n1 , k), un argumento similar al anterior produce un entero positivo n2
tal que
µ∗ f (L(n1 , n2 )) > µ∗ ( A) − ε.
276
Cap. 6 La Medida de Lebesgue en R
Continuando de este modo se obtiene una sucesión (ni )∞
i=1 ∈ N tal que
µ∗ f (L(n1 , n2 , . . . , nk )) > µ∗ ( A) − ε
para todo k ∈ N. Nótese que
L( n 1 , n 2 , . . . , n k ) =
n
(mn )∞
n =1 ∈ N : m i ≤ n i para i = 1, . . . , k
para cada k ∈ N. Si ahora definimos
L =
∞
\
L( n 1 , n 2 , . . . , n k ) =
k=1
( 3)
o
(mn )∞
n =1 ∈ N : m i ≤ n i para i = 1, 2, . . . ,
resulta que L es compacto y así, por continuidad, K = f ( L) es un subconjunto compacto de A.
Nuestra segunda estrategia es verificar que µ(K ) > µ∗ ( A) − ε. En efecto, no es difícil establecer
que
∞
\
f L( n 1 , n 2 , . . . , n k )
K =
k=1
y entonces, como f L(n1 , n2 , . . . , nk ) ⊆ f L(n1 , n2 , . . . , nk ) , se tiene que
µ f (L(n1 , n2 , . . . , nk )) ≥ µ∗ f (L(n1 , n2 , . . . , nk )) > µ∗ ( A) − ε.
∞
Más aun, puesto que la sucesión f (L(n1 , n2 , . . . , nk )) n=1 es decreciente, el Teorema 6.3.47,
página 287, nos garantiza que
µ(K ) = lı́m µ f (L(n1 , n2 , . . . , nk )) > µ∗ ( A) − ε.
k→∞
Como K es medible, se sigue del Criterio de Carathéodory, Teorema 6.3.58, página 295, que para
todo conjunto X ⊆ R
µ∗ ( X ) ≥ µ∗ (K ) + µ∗ ( X \ K ) ≥ µ∗ ( A) − ε + µ∗ ( X \ A)
Puesto que ε > 0 es arbitrario, se tiene que µ∗ ( X ) ≥ µ∗ ( A) + µ∗ ( X \ A) para cualquier conjunto
X ⊆ R. Esto prueba, por una nueva aplicación de Criterio de Carathéodory, que A es medible y
termina la prueba.
Es importante observar que, en general, el complemento de un conjunto analítico no es necesariamente un conjunto analítico. De hecho, el complemento de un conjunto analítico A es un
conjunto analítico si, y sólo si, A es un boreliano.
Acabamos de ver que Bo(R ) ⊆ Σ11 y entonces es lógico indagar si Σ11 ⊆ Bo(R ). Por
supuesto, si la respuesta es afirmativa, el estudio y análisis de los conjuntos analíticos no tendrá
ningún valor, salvo el de encontrar propiedades adicionales de los conjuntos de Borel. De modo
que nuestra siguiente tarea es la de demostrar la existencia de conjuntos analíticos que no son
borelianos. Su construcción se basa sobre una noción de conjunto llamado “conjunto universal”,
el cual cual consiste en hallar un conjunto que sirva como modelo para determinar a todos los
conjuntos de una cierta clase dada.
Sean X, Y conjuntos no vacíos y sea S ⊆ X × Y. Si ( x0 , y0 ) ∈ X × Y, la x0 -sección y la
y0 -sección de S se definen, respectivamente, como
S x 0 = y ∈ Y : ( x0 , y ) ∈ S
y
Sy0 = x ∈ X : ( x, y0 ) ∈ S .
Sec. 6.3 La Medida de Lebesgue
277
Definición 6.3.31. Sea X un conjunto no vacío y sea C una familia de subconjuntos de X. Un subconjunto S de X × N es universal para la clase C si
C = Sy : y ∈ N .
Lo que queremos es demostrar la existencia de un conjunto cerrado en R × N que es universal para la clase Σ11 de los conjuntos analíticos. Esto requiere un resultado previo. Antes,
recordemos que OR representa a la familia de todos los subconjuntos abiertos de R, mientras
que F constituye la familia de todos los subconjuntos cerrados de R.
Lema 6.3.32. Existe un conjunto abierto U (respectivamente, un conjunto cerrado F) en R × N que
es universal para OR (respectivamente, para F).
Prueba. Sea B = (Vn )∞
n =1 una base numerable para R. Por ejemplo, podemos tomar como
(Vn )∞
la
colección
numerable
de todos los intervalos abiertos cuyos extremos son números
n =1
racionales. En primer lugar, para cada k, n ∈ N, considere el conjunto U (k, n) ⊆ R × N definido
por
o
n
U (k, n) = Vn × (m j )∞
N
:
m
=
n
∈
k
j=1
= Vn × N1 × · · · × N k−1 × {n} × N k+1 × · · ·
donde N j = N para todo j ∈ N. Puesto que cada conjunto N1 × · · · × Nk−1 × {n} × Nk+1 × · · ·
es abierto en N, resulta que U (k, n) es abierto en R × N para todo k, n ∈ N. Definamos ahora
U ⊆ R × N como
[
U =
U (k, n)
( k,n)∈N ×N
=
n
o
x, (nk )∞
∈
R
×
N
:
x
∈
V
para
algún
k
∈
N
.
nk
k=1
U
y
Entonces U es abierto en R × N. Observe que si y = (nk )∞
k=1 ∈ N, entonces de la definición de
U se tiene que la y-sección de U viene dada por:
=
n
x∈R :
Falta verificar que
OR =
x, (nk )∞
k=1
∈U
o
y
U : y∈N .
=
∞
[
Vnk .
k=1
Para ver esto último, sea G Sun conjunto abierto arbitrario en R. Puesto (Vn )∞
n =1 es una base
∞
para X, se tiene que G = ∞
V
para
alguna
subsucesión
(
V
)
de
B.
nuestro
n k k=1
k=1 n k
Luego,
y
∞
y
abierto será de la forma U , donde y = (nk )k=1 ∈ N. Esto prueba que OR ⊆ U : y ∈ N .
La otra inclusión es consecuencia inmediata del hecho de que cada Vnk es abierto y, por lo tanto,
U y ∈ OR para cada y = (nk )∞
k=1 ∈ N. Esto termina la prueba de que U es universal para OR .
Sea U ⊆ R × N el conjunto universal obtenido anteriormente. Entonces F = (R × N) \ U es
cerrado en R × N y como
∞
\
y
y
F = R\U =
Vnck
k=1
278
Cap. 6 La Medida de Lebesgue en R
para todo y = (nk )∞
k=1 ∈ N, resulta que F es universal para la colección F de todos los subconjuntos cerrados de R y termina la prueba.
Observe que ninguna propiedad adicional de R fue usada en la demostración del resultado
anterior, salvo el hecho de que R posee una base numerable, de modo que la conclusión de
dicho teorema es válido si se reemplaza a R por cualquier espacio topológico que sea 2o numerable. En particular, puesto que R × N es 2o numerable, podemos encontrar un conjunto cerrado
F ⊆ (R × N) × N que es universal para la clase de todos los subconjuntos cerrados de R × N.
Esta observación es clave para obtener el siguiente resultado el cual es fundamental para exhibir
conjuntos analíticos que no son borelianos.
Teorema 6.3.33. Existe un conjunto cerrado A en R × N que es universal para la familia Σ11 .
Prueba. Sea F la colección formada por todos los subconjuntos cerrados de R × N. Por el
Lema 6.3.32 existe un conjunto cerrado F ⊆ (R × N) × N que es universal para la clase F. Por
supuesto, esto significa que
o
n
F = Fy ⊆ R ×N : y ∈ N .
( 4)
Ahora, considere la función continua f : (R × N) × N → R × N dada por
∞
∞
f x, (mk )∞
k=1 , ( n k ) k=1 = x, ( n k ) k=1
y sea A = f ( F ). Resulta que el conjunto A es el candidato que buscamos. En efecto:
(i) A es cerrado. Sigue directamente de la definición de f .
(ii) Σ11 = Ay : y ∈ N .
Para ver esto último, sea C ∈ Σ11 . Por la condición (b) de la Definición 6.3.25, existe un conjunto
cerrado H ⊆ R × N tal que proy1 ( H ) = C, donde proy1 : R × N → R es la proyección sobre R
dada por proy1 ( x, y) = x para todo x ∈ R y todo y ∈ N. Se sigue de (4) que H = F y0 para
algún y0 ∈ N, de donde se obtiene que C = proy1 ( F y0 ).
Afirmamos que: Ay = proy1 F y para cualquier y ∈ N.
y
Fijemos y = (nk )∞
( x, (nk )∞
k=1 ∈ N. Si x ∈ A = { x ∈ R : ( x, y) ∈ A }, entonces
k=1 ) ∈ A, lo cual
∞
∞
∞
∞
significa que existe un (mk )k=1 ∈ N tal que x, (mk )k=1 , (nk )k=1 ∈ F y f x, (mk )∞
k=1 , ( n k ) k=1 =
∞
∞
∞
y
( x, (nk )∞
k=1 ). Por otro lado, como x, ( m k ) k=1 , ( n k ) k=1 ∈ F, resulta que ( x, ( m k ) k=1 ) ∈ F y, por
y
lo tanto, x ∈ proy1 ( F ). Esto prueba que
Ay ⊆ proy1 F y .
∞
Recíprocamente, si x ∈ proy1 ( F y ), entonces existe (mk )∞
k=1 ∈ N tal que x, ( m k ) k=1 , y ∈ F y, en
y
consecuencia, ( x, (mk )∞
k=1 ) ∈ A. Esto nos muestra que x ∈ A y, así,
proy1 F y ⊆ Ay .
Por esto, Ay = proy1 F y y termina la prueba de nuestra afirmación. Usando esto y el hecho de
que C = proy1 ( F y0 ) se tiene que
Σ11 ⊆ Ay : y ∈ N .
Sec. 6.3 La Medida de Lebesgue
279
Para verificar la otra inclusión, sea Ay ∈ Ay : y ∈ N . Como F y es un subconjunto cerrado de
R × N, se sigue de la condición (c) de la Definición 6.3.25 que
proy1 ( F y ) es analítico, es decir,
Ay = proy1 ( F y ) ∈ Σ11 . Con esto queda establecido que Σ11 = Ay : y ∈ N y termina la prueba
de nuestro teorema.
Puesto que N es un espacio métrico, completo y separable, podemos aplicar el Teorema 6.3.33
a éste espacio en lugar de R para obtener un conjunto en N × N que es universal para la familia
de los subconjuntos analíticos de N. Esta observación permite simplificar la demostración del
siguiente resultado.
Teorema 6.3.34. Existe un conjunto analítico que no es medible según Borel.
Prueba. La demostración consistirá en construir un conjunto analítico A en R cuyo complemento no es analítico. La existencia de un tal conjunto A conduce, por supuesto, a concluir que A
no puede ser un conjunto de Borel ya que el complemento de todo conjunto de Borel es de Borel.
Por la observación del parágrafo anterior, seleccione un subconjunto cerrado F de N × N que
es universal para la colección de todos los subconjuntos analíticos de N y sea D la diagonal en
N × N, esto es,
D = (y, y) : y ∈ N .
Definamos ahora
A =
y ∈ N : (y, y) ∈ F ∩ D .
Puesto que F ∩ D es cerrado en N × N y proy1 ( F ∩ D ) = A resulta, por la Definición 6.3.25,
que A es analítico. Veamos que su complemento Ac no es analítico. Suponga, para generar una
contradicción, que Ac es analítico. Puesto que F es universal para la familia de los conjuntos
analíticos de N, existe un y0 ∈ N tal que la y0 -sección F y0 = Ac y es esta igualdad la que
produce la contradicción. En efecto, nos preguntamos, ¿el elemento y0 , pertenece o no al conjunto
Ac ?. Aquí está la respuesta:
( a) Si y0 ∈ Ac , entonces, por definición, (y0 , y0 ) 6∈ F y, por consiguiente, y0 6∈ F y0 = Ac , es
decir, y0 6∈ Ac , lo cual es absurdo.
(b) Si y0 6∈ Ac , entonces (y0 , y0 ) ∈ F y, en consecuencia, y0 ∈ F y0 = Ac , lo cual conduce, de
nuevo, a una contradicción.
De esto se concluye que Ac no puede ser analítico y, en particular, A no puede ser un
conjunto de Borel.
El hecho de que card(N) = 2ℵ0 = card(Bo(R )), nos indica que ningún argumento usando la
cardinalidad de ambos conjuntos puede ser utilizado para hacer visible la diferencia entre Bo(R )
y Σ11 . Aunque la demostración de que Bo(R )) $ Σ11 es un tanto complicada, observe que en ella
no se usó el Axioma de Elección. Es claro que un conjunto analítico que no sea boreliano debe
ser bastante complicado y, por supuesto, muy extraño.
6.3.5. La Medida de Lebesgue
Una de las nociones más importantes en el desarrollo de la Integral de Lebesgue es la de
Medida de Lebesgue. Antes, introduciremos una definición general.
280
Cap. 6 La Medida de Lebesgue en R
Definición 6.3.35. Sean X un conjunto y M una σ-álgebra de subconjuntos de X. Una medida sobre
M es una función de conjuntos m : M → [0, +∞] que verifica las siguientes propiedades:
( a) m(∅) = 0, y
(b) m es numerablemente aditiva, es decir, si An
m
[
∞
An
n =1
∞
n =1
=
es una sucesión disjunta en M, entonces
∞
X
m ( A n ).
n =1
El hecho de que Mµ (R ) es una σ-álgebra en combinación con el Teorema 6.3.37, permiten
justificar la siguiente definición.
Definición 6.3.36 (Medida de Lebesgue). La restricción de µ∗ a Mµ (R ), denotada por µ, se llama la
medida de Lebesgue en R, esto es,
µ = µ∗
Mµ (R )
: Mµ (R ) → [0, + ∞]
donde µ( E) = µ∗ ( E) para todo E ∈ Mµ (R ).
Similarmente, la restricción de µ a la σ-álgebra de Borel Bo(R ) se llama la medida de Borel sobre
R y será denotada, en lo sucesivo, por µ0 .
Por definición, la medida de Lebesgue µ hereda todas las propiedades de la medida exterior µ∗ .
En particular,
( a) µ es completa, es decir, si E ⊆ R con µ( E) = 0, entonces E y todos sus subconjuntos son medibles
según Lebesgue. A diferencia de la medida de Lebesgue, la medida de Borel no es completa (véase
el Ejercicio 6.7.1 (e), página 354).
(b) µ( E) ≤ µ( F ) si E ⊆ F con E, F ∈ Mµ (R ).
(c) µ({ x}) = 0 para todo x ∈ R.
∞
Teorema 6.3.37 (µ es numerablemente aditiva). Si En n=1 es una sucesión disjunta de conjuntos
en Mµ (R ), entonces
[
∞
∞
X
µ
En =
µ ( En ) .
n =1
n =1
S
Prueba. Puesto que Mµ (R ) es una σ-álgebra, tenemos que ∞
n =1 En ∈ Mµ (R ). Suponga, en
primer lugar, que cada En es acotado. Por la subaditividad de µ, tenemos que
µ
[
∞
n =1
En
≤
∞
X
µ ( En ) ,
(6.3.1)
n =1
de modo que nuestro objetivo es demostrar la otra desigualdad. Fijemos ε > 0. Puesto que
En ∈ Mµ (R ), se sigue del Corolario 6.3.9 que existe un conjunto cerrado Fn ⊆ En tal que
µ( En \ Fn ) <
ε
.
2n
Sec. 6.3 La Medida de Lebesgue
281
Como cada conjunto Fn es cerrado y está incluido en el conjunto acotado En , resulta que los Fn
son compactos y disjuntos dos a dos. Aquí es donde entra en escena el Corolario 6.2.16 que, junto
a la monotonicidad de µ, nos dice que, para cualquier k ∈ N,
k
X
µ( Fn ) = µ
n =1
[
k
Fn
n =1
≤ µ
[
k
En
n =1
≤ µ
[
∞
n =1
En .
Puesto que esta última desigualdad es válida para todo k ∈ N, resulta que la sucesión de sumas
∞
Pk
parciales
n =1 µ ( Fn ) k=1 , por ser creciente y acotada, converge gracias al Teorema 2.1.23, esto
es,
[
∞
k
∞
X
X
(6.3.2)
µ( Fn ) = lı́m
µ( Fn ) ≤ µ
En .
k→∞
n =1
S∞
n =1
n =1
P
Observe que si µ n=1 En = + ∞, entonces de la desigualdad (6.3.1) se sigue que ∞
n = 1 µ ( En ) =
S∞
+ ∞ y no hayPnada más que demostrar. Suponga entonces que µ n=1 En < + ∞. Por (6.3.2)
∞
tenemos que
n =1 µ ( Fn ) < + ∞ y, así,
∞
X
µ ( En ) =
n =1
∞
X
n =1
≤
µ Fn ∪ ( En \ Fn )
∞ X
n =1
≤ µ
ε
µ Fn + n
2
[
∞
En
n =1
Siendo ε arbitrario, se concluye que
≤
=
n =1
∞
X
n =1
µ( Fn ) + µ En \ Fn )
µ Fn + ε
+ ε.
P∞
n = 1 µ ( En ) ≤ µ
∞
X
∞ X
µ ( En ) = µ
n =1
S∞
[
∞
n = 1 En
y, por lo tanto,
En .
n =1
( 1)
Esto completa la prueba para el caso en que cada En es acotado. Para el caso general defina, para
cada par de enteros n, k ≥ 1, el conjunto
En,k = x ∈ En : k − 1 ≤ | x| < k .
Entonces {En,k : n, k ∈ N } es una colección numerable de conjuntos medibles, acotados y disjuntos dos a dos. Además, para cada n ∈ N,
En =
∞
[
En,k .
k=1
Aplicando dos veces la igualdad (1), válida para conjuntos acotados, se obtiene que
µ
[
∞
n =1
En
= µ
[
∞ [
∞
n =1 k=1
En,k
=
∞ X
∞
X
n =1 k=1
µ( En,k ) =
∞
X
n =1
µ ( En ) .
282
Cap. 6 La Medida de Lebesgue en R
La prueba es completa.
La expresión µ es σ-aditiva también es frecuentemente utilizada como sinónimo de µ es
numerablemente aditiva. Observe que si {E1 , . . . , En } es cualquier colección finita de conjuntos
medibles disjuntos dos a dos, entonces si en el resultado anterior hacemos En+1 = En+2 = · · · =
∅, resulta que
[
n
n
X
µ
Ek =
µ ( Ek ) .
k=1
k=1
En este caso se dice que µ es finitamente aditiva .
importante destacar que la medida de Lebesgue es σ-finita, es decir, existe una sucesión
Es
∞
En n=1 de conjuntos medibles tal que
R =
∞
[
En
y
µ( En ) < +∞,
n = 1, 2 . . .
n =1
S
Por ejemplo, podemos escribir a R como R = ∞
n =1 [− n, n ] y observar que µ ([− n, n ]) < + ∞
para todo n ∈ N. Nótese que
∞ siempre se puede y, en ocasiones es conveniente hacerlo de esa
forma, elegir la sucesión En n=1 de conjuntos medibles en la definición anterior, o bien disjunta
(véase ( β3 ) en la página 261), o bien creciente.
El Teorema 6.3.37 permite calcular la medida de cualquier conjunto abierto por medio del siguiente argumento.
∞subconjunto abierto no vacío G de R se puede representar
S Sabemos que todo
en la forma G = ∞
I
,
donde
I
n n =1 es una sucesión de intervalos abiertos disjuntos dos a
n =1 n
dos. Se sigue entonces del Teorema 6.3.37 que
µ( G ) =
∞
X
n =1
µ( In ) =
∞
X
ℓ( In ).
n =1
Corolario 6.3.38. Sea A ⊆ R con µ∗ ( A) < +∞. Entonces existe un conjunto medible G de tipo Gδ
con la siguiente propiedad: si E es medible y A ⊆ E ⊆ G, entonces µ( G \ E) = 0.
Prueba. Por el Corolario 6.2.13 existe un Gδ medible G, tal que
A⊆G
y
µ( G ) = µ∗ ( A) < +∞.
Si E es medible y A ⊆ E ⊆ G, entonces µ∗ ( A) ≤ µ∗ ( E) ≤ µ∗ ( G ), de donde se sigue que
µ∗ ( A) = µ( E) = µ( G ). Por esto y puesto que µ es finitamente aditiva se tiene que
µ ( E ) = µ ( G ) = µ ( G ∩ E ) + µ ( G \ E ) = µ ( E ) + µ ( G \ E ).
Finalmente, el hecho de que µ( E) < +∞, conduce a que µ( G \ E) = 0.
Al comienzo de la Sección 6.3 cuando introducimos la noción de conjunto medible, vimos que
si Z 6∈ Mµ (R ) con µ∗ ( Z ) < +∞, entonces para cualquier conjunto medible G conteniendo a Z
se cumplía que
µ ∗ ( G \ Z ) > µ ( G ) − µ ∗ ( Z ).
Para conjuntos medibles, sin embargo, este hecho nunca ocurre como lo muestra el siguiente
resultado.
Sec. 6.3 La Medida de Lebesgue
283
Corolario 6.3.39. Sea E ∈ Mµ (R ). Si F ⊆ E es medible con µ( F ) < + ∞, entonces
µ ( E \ F ) = µ ( E ) − µ ( F ).
Prueba. Nótese que como E = F ∪ ( E \ E) es una unión disjunta de conjuntos medibles, de la
aditividad finita de µ se sigue que µ( E) = µ( F ) + µ( E \ F ) y entonces µ( E \ F ) = µ( E) − µ( F ),
gracias a que µ( F ) es finita.
Observe que si F es un conjunto cerrado y acotado, entonces existe un intervalo compacto,
digamos J = [ a, b], tal que F ⊆ J. Si G = J \ F, resulta que G es abierto y por lo anterior y el
Corolario 6.3.39, se tiene que
µ( F ) = ℓ( J ) − µ( G ) = (b − a) −
donde In
∞
n =1
∞
X
ℓ( In ),
n =1
es una sucesión disjunta de intervalos abierto cuya unión es G.
El siguiente corolario es una de la buenas razones de por qué la medida de Lebesgue es
exquisita: cualquier conjunto medible de medida finita se puede aproximar por un compacto.
Corolario 6.3.40 (Aproximación por compactos). Sea E ∈ Mµ (R ) con µ( E) < +∞. Entonces,
para cada ε > 0, existe un conjunto compacto K tal que
K⊆E
En particular,
y
µ( E \ K ) < ε.
µ( E) = sup µ(K ) : K ⊆ E, K es compacto .
Prueba. Sea ε > 0. Por el Lema 6.3.10 existe un subconjunto medible y acotado E0 ⊆ E tal
que µ( E \ E0 ) < ε/2. Más aun, por el Corolario 6.3.9, existe un conjunto cerrado K ⊆ E0 y,
por consiguiente, acotado, tal que µ( E0 \ K ) < ε/2. Resulta que K es compacto y K ⊆ E. En
particular, µ(K ) ≤ µ( E) < +∞. Por otro lado, como E \ K = E \ E0 ∪ E0 \ K es la unión
disjunta de dos conjuntos medibles, obtenemos, por la aditividad finita de µ, que
µ( E \ K ) = µ( E \ E0 ) + µ( E0 \ K ) <
ε
ε
+
= ε
2
2
Finalmente, puesto que µ(K ) < + ∞, se obtiene del corolario anterior que µ( E) − µ(K ) =
µ( E \ K ) < ε y, en consecuencia,
µ( E) < µ(K ) + ε.
Esto prueba que µ( E) = sup µ(K ) : K ⊆ E, K compacto .
Hemos visto, Corolario 6.2.6, que si A es cualquier subconjunto numerable de R, entonces
µ∗ ( A) = 0 y habíamos anunciado que el recíproco de ese corolario era falso. En efecto, el conjunto
ternario de Cantor Γ es un contraejemplo.
Corolario 6.3.41. Sea Γ el conjunto ternario de Cantor. Entonces Γ es no-numerable con µ(Γ) = 0.
284
Cap. 6 La Medida de Lebesgue en R
Prueba. Ya hemos demostrado que Γ es no-numerable. Para probar que Γ es de medida cero,
S n −1
recordemos que, para cada n ∈ N, Jn = 2k=1 Jn (k), donde Jn (1), . . . , Jn (2n−1 ) son los intervalos
abiertos disjuntos que fueron eliminados en la n-ésima etapa en la construcción de Γ, los cuales
tienen, cada uno, longitud 1/3n . Luego,
1
µ( Jn ) = ℓ Jn (1) + · · · + ℓ Jn (2n−1 ) = 2n−1 n .
3
Por esto, la longitud de todos los intervalos borrados es, gracias al Teorema 6.3.37,
µ
[
∞
n =1
Jn
=
∞
X
∞
X
2n − 1
µ( Jn ) =
n =1
n =1
3n
∞
=
1X
3
n =0
n
2
= 1
3
y así, por el Corolario 6.3.39,
µ(Γ) = µ [0, 1] \
∞
[
Jn
n =1
= µ([0, 1]) − µ
[
∞
n =1
La prueba es completa.
Jn
= 0.
¿Cuál es la medida de la unión de dos conjuntos medibles que no son disjuntos? La respuesta
viene dada por el siguiente resultado.
Corolario 6.3.42. Sean E, F ∈ Mµ (R ). Entonces
µ ( E ∪ F ) + µ ( E ∩ F ) = µ ( E ) + µ ( F ).
Prueba. Si µ( E) o µ( F ) es + ∞, entonces la igualdad es inmediata. Suponga entonces que tanto
µ( E), así como
µ( F ), son finitos. Entonces µ( E ∩ F ) < + ∞ y se sigue del Corolario 6.3.39 que
µ F \ ( E ∩ F ) = µ( F ) − µ( E ∩ F ). Por esto,
µ( E ∪ F ) = µ E ∪ F \ ( E ∩ F )
= µ( E) + µ F \ ( E ∩ F )
= µ( E) + µ( E) − µ( E ∩ F )
y termina la prueba.
El Teorema 6.3.37 sirve, como se muestra a continuación, para obtener otro criterio para que
la medida exterior de la unión de una sucesión disjunta de subconjuntos de R sea igual a la suma
de las medidas exteriores de los conjuntos de la sucesión.
∞
Corolario 6.3.43. Sea An n=1 una sucesión arbitraria de subconjuntos de R. Si existe una sucesión
∞
disjunta En n=1 en Mµ (R ) con An ⊆ En para todo n ∈ N, entonces
µ
∗
[
∞
n =1
An
=
∞
X
n =1
µ ∗ ( A n ).
Sec. 6.3 La Medida de Lebesgue
285
Prueba. Seleccionemos, haciendo uso del Corolario 6.2.13, de un conjunto Gδ , digamos G, tal que
G ⊇
∞
[
y
An
µ( G ) = µ
n =1
∗
[
∞
n =1
An .
Puesto que G ∈ Mµ (R ), resulta que para cada n ≥ 1, el conjunto En′ = G ∩ En es medible
′
′ ∞
y
de conjuntos medibles según Lebesgue con
S∞An ⊆′ En . Siendo ( En )n=1 una sucesión disjunta
∗
n =1 En ⊆ G, se tiene, por la monotonía de µ y el Teorema 6.3.37, que
µ
∗
[
∞
n =1
An
= µ( G ) ≥ µ
La desigualdad contraria µ∗
prueba.
S∞
n =1
[
∞
En′
n =1
=
∞
X
µ( En′ )
n =1
≥
∞
X
µ ∗ ( A n ).
n =1
P∞
∗
An ≤
n =1 µ ( A n ) sigue del Teorema 6.2.5 y termina la
Uno de los rasgos sobresalientes que debe poseer cualquier medida que extienda la longitud
de los intervalos de R es que ella sea invariante por traslación, es decir, que la medida de
cualquier conjunto y su trasladado sean iguales.
Teorema 6.3.44 (µ es invariante por traslación). Sea E un subconjunto de R. La siguientes condiciones son equivalentes:
( 1) E ∈ Mµ ( R ) .
(2) x + E ∈ Mµ (R ) para todo x ∈ R.
Además, se cumple que
para todo x ∈ R.
µ( E) = µ( x + E)
Prueba. Suponga que E ∈ Mµ (R ) y sea ε > 0. Entonces existe un conjunto abierto G ⊇ E tal
que µ∗ ( G \ E) ≤ ε. Fijemos x ∈ R. Claramente x + G es un conjunto abierto, x + G ⊇ x + E y
como
( x + G ) \ ( x + E) ⊆ x + ( G \ E)
resulta, por la propiedad de ser µ∗ invariante por traslación, que
µ ( x + G ) \ ( x + E) ≤ µ x + ( G \ E) = µ∗ x + ( G \ E) = µ∗ ( G \ E) ≤ ε.
Esto prueba que x + E ∈ Mµ (R ). Suponga ahora que x + E ∈ Mµ (R ) para todo x ∈ R. Fijemos
un x ∈ R. Entonces, de la primera parte, se tiene que E = − x + ( x + E) es medible. La igualdad
µ( E) = µ( x + E) sigue del Teorema 6.2.4 y termina la prueba.
Recordemos, Teorema 2.1.44, que si En
∞
n =1
es una sucesión monótona creciente, entonces
lı́m En =
n→∞
∞
[
En .
n =1
Los siguientes dos teoremas establecen que la medida de Lebesgue es continua en el sentido
de que si una sucesión monótona de conjuntos medibles converge, entonces la sucesión de sus
medidas también converge. Esos dos hechos jugarán un papel importante en nuestro desarrollo.
286
Cap. 6 La Medida de Lebesgue en R
∞
Teorema 6.3.45 (µ es continua). Sea En n=1 una sucesión monótona creciente en Mµ (R ). Entonces
[
∞
µ lı́m En = µ
En = lı́m µ( En ).
n→∞
n→∞
n =1
Prueba. Si para algún N ∈ N ocurre que µ( EN ) = + ∞, entonces
[
∞
µ
En ≥ µ ( E N ) = + ∞
n =1
y puesto que E1 ⊆ E2 ⊆
· · · ⊆ EN ⊆ · · · tendremos que µ( En ) ≥ µ( EN ) = + ∞ para todo n ≥ N
S∞
y, en consecuencia, µ n=1 En = lı́mn→∞ µ( En ) = + ∞.
Suponga ahora que µ( En ) < + ∞ para todo n ∈ N. Como E1 ⊆ E2 ⊆ · · · ⊆ En ⊆ · · · ,
podemos escribir
∞
[
En = E1 ∪ E2 \ E1 ∪ · · · ∪ En+1 \ En ∪ · · ·
n =1
lo cual es una unión numerable y disjunta de conjuntos medibles. Usando el hecho de que µ es
numerablemente aditiva y el Corolario 6.3.39, tenemos que
[
∞
∞
X
µ
En = µ( E1 ) +
µ En + 1 \ En
n =1
n =1
= µ( E1 ) + lı́m
n→∞
= lı́m µ( En+1 ).
n X
k=1
µ ( Ek + 1 ) − µ ( Ek )
n→∞
Esto finaliza la prueba.
En general, el resultado anterior se puede usar para demostrar que µ∗ también es continua.
∞
Corolario 6.3.46 (µ∗ es continua). Sea En n=1 una sucesión monótona creciente de subconjuntos de
R no necesariamente medibles. Entonces
[
∞
∗
µ
En = lı́m µ∗ ( En ).
n→∞
n =1
S∞
Prueba. Claramente lı́mn→∞ µ∗ ( En ) ≤ µ∗
n =1 En . Para demostrar la otra desigualdad usemos
el Corolario 6.3.38 para seleccionar, por cada n ∈ N, unTconjunto Gδ , digamos Gn ⊇ En tal que
∞
µ( Gn ) = µ∗ ( En ). Observe que si reemplazamos Gn por ∞
m = n Gm , podemos asumir que ( Gn ) n =1
es una sucesión monótona creciente de conjuntos medibles y, así, gracias al Teorema 6.3.45,
[
∞
∗
lı́m µ ( En ) = lı́m µ( Gn ) = µ
Gn
n→∞
n→∞
= µ
∗
n =1
[
∞
n =1
Esto termina la prueba.
Gn
≥ µ
∗
[
∞
n =1
En .
Sec. 6.3 La Medida de Lebesgue
287
Teorema 6.3.47 (µ es continua). Sea En
algún n0 ∈ N, µ( En0 ) < +∞, entonces
µ lı́m En
n→∞
∞
n =1
= µ
una sucesión monótona decreciente en Mµ (R ). Si para
\
∞
En
n =1
= lı́m µ( En ).
n→∞
Prueba. Sin perder generalidad, asumiremos que µ( E1 ) < +∞. Observe, en primer lugar, que
lı́mn→∞ µ( En ) existe y es finito. En efecto, como E1 ⊇ E2 ⊇ · · · ⊇ En ⊇ · · · y µ( E1 ) < + ∞,
entonces
+ ∞ > µ( E1 ) ≥ µ( E2 ) ≥ · · · ≥ µ( En ) ≥ · · · ≥ 0
∞
y, por lo tanto, por ser la sucesión
T∞(µ( En ))n=1 decreciente y acotada, ella converge. Por esto,
lı́mn→∞ µ( En ) ≤ µ( E1 ). Sea H = n=1 En y pongamos Fn = En \ En+1 para n = 1, 2, .S. . Resulta
∞
que los conjuntos Fn son medibles y disjuntos dos a dos. Más aun, como E1 \ H =
n =1 Fn se
tiene, por el Teorema 6.3.47 y el Corolario 6.3.39, que
[
∞
µ( E1 ) − µ( H ) = µ( E1 \ H ) = µ
Fn
n =1
=
∞
X
µ( Fn ) = lı́m
n→∞
n =1
n X
k=1
µ ( Ek + 1 ) − µ ( Ek )
= µ( E1 ) − lı́m µ( En ).
n→∞
Finalmente, como µ( E1 ) < + ∞ se concluye que µ
T∞
n = 1 En
= lı́mn→∞ µ( En ).
Nota Adicional 6.3.2 Es importante destacar que la hipótesis µ( En0 ) < + ∞ en el Teorema 6.3.47
no se puede suprimir ya el resultado pudiera
∞ no ser cierto. Por ejemplo, si para cada n ∈ N,
definimos En = [n, + ∞), entonces En n=1 es una sucesión decreciente de subconjuntos
medibles para T
la cual µ( En ) = + ∞ para todo n ∈ N.
T∞En particular, lı́mn→∞ µ( En ) = + ∞.
=
∅
Por otro lado, ∞
E
y,
en
consecuencia,
µ
(
n =1 n
n =1 En ) = 0.
6.3.6. El Lema de Borel-Cantelli
En esta sección mostraremos cómo las nociones de límites superior e inferior de sucesiones de
conjuntos medibles permiten demostrar algunos resultados no triviales en la Teoría de la Medida.
∞
Recordemos que dada una sucesión En n=1 de subconjuntos de R, los conjuntos
lı́m En =
n→∞
∞ \
∞
[
Ek
y
lı́m En =
n→∞
n =1 k= n
∞ [
∞
\
Ek
n =1 k= n
son llamados los límites inferior y superior, respectivamente, de la sucesión En
∞
Lema 6.3.48. Sea En n=1 una sucesión de conjuntos medibles. Entonces
( a) µ lı́m En ≤ lı́m µ( En ).
n→∞
n→∞
(b) µ lı́m En ≥ lı́m µ( En ) siempre que µ
n→∞
n→∞
S∞
n = 1 En
< + ∞.
∞
n =1
.
288
Cap. 6 La Medida de Lebesgue en R
∞
T
Prueba. ( a) Para cada n ≥ 1, sea Gn = ∞
k= n Ek . Puesto que G n n =1 es una sucesión monótona
creciente, se sigue del Teorema 6.3.45 que
µ lı́m En
n→∞
= µ
[
∞
Gn
n =1
= lı́m µ Gn .
n→∞
Fijemos un n ∈ N y observe que Gn ⊆ En+k y µ( Gn ) ≤ µ( En+k ) para todo k ∈ N. De esto se
sigue que
µ Gn ≤ lı́m µ( En+k ) = lı́m µ( Ek )
k→∞
k→∞
para cada n ∈ N y, por consiguiente,
µ lı́m En ≤ lı́m µ( En ).
n→∞
n→∞
(b) La prueba es similar a la del caso anterior usando, esta vez, el Teorema 6.3.47.
S
Nota Adicional 6.3.3 De nuevo, la condición de que µ( ∞
∞, en el lema anterior, no
n =1 En ) < +
∞
se puede omitir. En efecto, para la sucesión de conjuntos En n=1 , donde En = [n, n + 1),
S
se cumple que µ( ∞
n =1 En ) = + ∞, lı́m µ ( En ) = 1, pero µ lı́m En = 0.
n→∞
n→∞
Estamos listo para presentar el celebre Lema de Borel-Cantelli. Sus aplicaciones son de tal
importancia en la Teoría de Probabilidades que el Dr. Tapas Kumar Chandra ha escrito un libro,
The Borel-Cantelli Lemma, [33], dedicado exclusivamente a mostrar algunas de las aplicaciones
de dicho lema.
∞
P∞
Lema 6.3.49 (Borel-Cantelli). Sea En n=1 ⊆ Mµ (R ). Si
n =1 µ ( En ) < + ∞, entonces
µ lı́m En = 0.
n→∞
∞
S
Prueba. Para cada n ∈ N, defina Fn = ∞
k= n Ek . Resulta entonces que Fn n =1 es una sucesión
decreciente de conjuntos medibles con µ( F1 ) < +∞. Se sigue ahora del Teorema 6.3.47 que
µ
\
∞
n =1
y como lı́m En =
n→∞
∞ [
∞
\
n =1 k= n
En =
∞
\
n =1
Fn
= lı́m µ( Fn ) = 0,
n→∞
Fn , entonces µ lı́m En = 0.
n→∞
Al resultado anterior lo llamaremos el primer Lema de Borel-Cantelli. Observe que la conclusión
de este resultado también se puede enunciar del modo siguiente: la colección de los puntos x ∈ R
que pertenecen a infinitos En tiene medida cero. El primer Lema de Borel-Cantelli es un caso especial
de un famoso teorema llamado el Teorema de Beppo Levi o Teorema de la Convergencia Monótona que veremos más adelante cuando estudiemos la convergencia de sucesiones de funciones
integrables según Lebesgue. El segundo Lema de Borel-Cantelli es, en cierto sentido, el recíproco del
primero bajo una hipótesis adicional: la independencia de los conjuntos. Él es consecuencia de
la Ley Fuerte de los Grandes Números de Kolmogorov para una sucesión de variables aleatorias
independientes.
Sec. 6.3 La Medida de Lebesgue
289
Definición 6.3.50. Una colección finita {En : n = 1, . . . , N } de conjuntos medibles se dice que es
independiente si
µ En 1 ∩ · · · ∩ En k = µ ( En 1 ) · . . . · µ ( En k )
∞
para todo k ≤ N, n1 < · · · < nk ≤ N. Una colección infinita numerable En n=1 de conjuntos medibles
se llama independiente si cada subcolección finita de ella es independiente.
Lema 6.3.51
P∞(Borel-Cantelli). Sea En
[0, 1]. Si n=1 µ( En ) = +∞, entonces
∞
una sucesión de conjuntos independientes incluidos en
n =1
µ lı́m En = 1
n→∞
Prueba. Gracias a las Leyes de Morgan, tenemos que
lı́m En
n→∞
c
=
∞ \
∞
[
Ekc ,
n =1 k= n
de modo que para demostrar que µ lı́m En = 1 será suficiente probar que
n→∞
µ ( lı́m En )
c
n→∞
= µ
[
∞ \
∞
n =1 k= n
Ekc
= 0,
T
c
o lo que es lo mismo, ver que µ ∞
k= n Ek = 0 para todo n ≥ 1. Fijemos un tal n ≥ 1. Ahora
bien, para cada m ≥ 1, los conjuntos En , En+1 , . . . , En+m son independientes y como 1 − x ≤ e− x ,
resulta entonces que
µ
\
∞
k= n
Ekc
≤ µ
P∞
n\
+m
Ekc
k= n
=
nY
+m
k= n
1 − µ ( Ek )
≤
P∞
nY
+m
e − µ ( Ek )
k= n
Por
lado, puesto que
n =1 µ ( En ) = + ∞, entonces
k= n µ ( Ek ) = + ∞, de modo que
Pn+otro
m
− x = 0, se sigue que el producto
= n µ( Ek ) → + ∞ cuando m → ∞. Finalmente, como lı́m x →∞ e
Qnk+
m − µ ( Ek )
→ 0 cuando m → ∞ (véase Ejercicios 3.2 (3), página 191).
k= n e
Uno puede obtener la misma conclusión del segundo Lema de Borel-Cantelli sin ser la sucesión independiente, pero imponiendo otra condición.
∞
Ejemplo 6.3.2. Sea En n=1 una sucesión de conjuntos medibles en [0, 1] con la siguiente propiedad:
para cada A ∈ Mµ (R ),
∞
X
µ( A) > 0 ⇒
µ( A ∩ En ) = +∞.
n =1
Entonces µ lı́m En = 1.
n→∞
Prueba. Es suficiente demostrar, gracias al Teorema 6.3.47, que
µ
[
∞
k= m
Ek
= 1 para todo m ≥ 1
290
Cap. 6 La Medida de Lebesgue en R
Suponga que esto es falso. Entonces existe un entero m > 1 tal que
µ
[
∞
Ek
k= m
Pongamos A =
T∞
k= m
< 1.
Ekc . Entonces µ( A) > 0 pero
∞
X
n =1
µ ( A ∩ En ) =
m
−1
X
µ( A ∩ En ) < +∞,
n =1
lo que contradice nuestra hipótesis.
La siguiente desigualdad, demostrada por Ivan D. Arandelović [6], permite obtener algunos
resultados clásicos importantes de manera sencilla.
Teorema 6.3.52 (Arandelović). Sea E ∈ Mµ (R ) con µ( E) > 0 y sea ( xn )∞
n =1 una sucesión acotada
de números reales. Entonces
µ( E) ≤ µ lı́m ( xn + E) .
n→∞
Prueba. Sea K un conjunto compacto contenido en E. Puesto que xn + K ⊆ xn + E para todo
n ∈ N, se sigue de la relación lı́m ( xn + K ) ⊆ lı́m ( xn + E) que
n→∞
n→∞
µ lı́m ( xn + K ) ≤ µ lı́m ( xn + E) .
n→∞
n→∞
Puesto que µ es invariante por traslación, resulta que µ(K ) = µ( xn + K ) para todo n ∈ N y, por
consiguiente,
µ(K ) = lı́m µ( xn + K ) = lı́m µ( xn + K ).
n→∞
n→∞
Ahora bien, como la sucesión
es acotada y K es compacto, resulta que el conjunto
S
∞
x
+
K
)
es
acotado
y,
por
lo
tanto,
(
n =1 n
( xn ) ∞
n =1
µ
[
∞
( xn + K )
n =1
< + ∞.
Invocando el Lema 6.3.48 (b), vemos que
µ(K ) = lı́m µ( xn + K ) ≤ µ lı́m ( xn + K ) ≤ µ lı́m ( xn + E) .
n→∞
n→∞
n→∞
Sabemos, Corolario 6.3.40, que µ( E) = sup{µ(K ) : K ⊆ E, K compacto} y como el compacto
K ⊆ E fue elegido de modo arbitrario, se sigue que
0 < µ( E) ≤ µ lı́m ( xn + E) .
n→∞
La prueba es completa.
La conclusión más importante que hay que destacar del resultado anterior es que el conjunto
lı́m sup( xn + E) 6= ∅, de hecho, es no-numerable. Las siguientes dos aplicaciones del teorema
anterior son bien conocidas y con variadas demostraciones.
Sec. 6.3 La Medida de Lebesgue
291
Corolario 6.3.53 (H. Steinhaus). Sea E ∈ Mµ (R ) con µ( E) > 0. Entonces existe una sucesión de
puntos distintos ( xn )∞
n =1 en E tal que | xn − xm | es un número racional para cualesquiera m, n ∈ N
con m 6= n.
Prueba. Sea (rn )∞
n =1 una sucesión arbitraria pero acotada de números racionales tal que rn 6 = rm
para todo m, n ∈ N con m 6= n. Por el Teorema de Arandelović se tiene que
0 < µ( E) ≤ µ lı́m (rn + E) ,
n→∞
de donde se sigue que el conjunto lı́m sup(rn + E) es no vacío. Fijemos un elemento x ∈
lı́m sup(rn + E). Por el Teorema 2.1.41 sabemos que existe una cantidad infinita de términos
de la sucesión (rn + E)∞
n =1 que contienen a x, es decir, existe una sucesión de enteros positivos
(n j )∞
tal
que
x
∈
r
E para todo j = 1, 2, . . .. Por cada j ∈ N, seleccionemos un punto x j
+
nj
j=1
en E de modo tal que
x = rn j + x j
Entonces, para cualesquiera i 6= j, se tiene que | xi − x j | = |rni − rn j | 6= 0 y, en consecuencia,
xi 6= x j para i 6= j. De aquí se concluye que
| x i − x j | = |r n i − r n j | ∈ Q
y termina la prueba.
Nota Adicional 6.3.4 El argumento clásico para demostrar el corolario anterior es como sigue.
Suponga, en primer lugar, que el conjunto medible E de medida positiva es acotado, digamos E ⊆ [ a, b]. El siguiente razonamiento permite encontrar un par de elementos distintos
x, y ∈ E tal que | x − y| es un racional. Sea {r1 , r2 , . . . } una enumeración, sin repetición,
de los números racionales en [ a, b] y para cada n ∈ N, sea En = rn + E. Como cada En
es medible y µ es invariante por traslación, tenemos que µ( En ) = µ( E) para todo n ∈ N.
Afirmamos que existen m1 6= n1 en N tal que Em1 ∩ En1 6= ∅. En efecto, si ocurre que
Em ∩ En = ∅ para todo m 6= n, entonces
µ
[
∞
n =1
En
=
∞
X
n =1
µ ( En ) =
∞
X
µ( E) = + ∞,
n =1
S
S∞
y como ∞
n =1 En ⊆ [ a, 2b], resulta que µ ( n =1 En ) ≤ 2b − a < + ∞, lo que origina una
contradicción. Esto establece nuestra afirmación. Sea z ∈ Em1 ∩ En1 . Entonces existen
x, y ∈ E tales que z = rm1 + x = rn1 + y y, en consecuencia,
| x − y| = |rm1 − rn1 | ∈ Q.
Para demostrar el caso general, sea In = [−n, n] para cada n ∈ N y definamos
E1 = E ∩ I1
y
En = E ∩ ( In \ In−1 )
para n = 2, 3, . . .
Como En es medible y 0 < µ( En ) < + ∞, se sigue del primer
S caso que existen xn 6= yn en
En tal que | xn − yn | es racional. Más aun, puesto que E = ∞
n =1 En es una unión disjunta,
∞
los elementos en la sucesión ( xn )n=1 ⊆ E son distintos dos a dos y se cumple que | xn − yn |
es un racional para cada n ∈ N.
292
Cap. 6 La Medida de Lebesgue en R
Aunque un conjunto acotado E con medida positiva puede tener interior vacío (por ejemplo, los
irracionales en [0, 1], o cualquier conjunto tipo-Cantor de medida positiva posee tal propiedad),
lo que resulta sorprendente, sin embargo, es que el conjunto E − E siempre tiene interior novacío. Este es el contenido del siguiente resultado el cual posee, como veremos en el transcurso
de estas notas, demostraciones muy variadas.
Teorema 6.3.54 (Steinhaus). Sea E ∈ Mµ (R ) con µ( E) > 0. Entonces E − E contiene un entorno
abierto G del cero. En particular,
E ∩ ( g + E) 6= ∅
para todo g ∈ G.
S
Prueba. Puesto que E = ∞
n =1 ( E ∩ [− n, n ]) no se pierde generalidad en asumir que E es acotado.
Usemos el Corolario 6.3.40 para escribir µ( E) = sup{µ(K ) : K ⊆ E, K compacto} > 0. Seleccione
ahora un compacto K ⊆ E con µ(K ) > 0. Puesto que K − K ⊆ E − E, será suficiente demostrar
que K − K posee un entorno abierto del cero. Suponga, para generar una contradicción, que
K − K no contiene ningún entorno abierto del cero. Puesto que K − K es un conjunto compacto
y 0 ∈ K − K, entonces existe una sucesión ( xn )∞
n =1 en R tal que
lı́m xn = 0
n→∞
Por el Teorema 6.3.52,
y
{ x n : n ∈ N } ∩ ( K − K ) = ∅.
( 1)
0 < µ(K ) ≤ µ lı́m (K − xn )
n→∞
y, en consecuencia, el conjunto lı́m sup(K − xn ) es no vacío. Seleccionemos un punto de dicho
conjunto, digamos, x ∈ lı́m sup(K − xn ). Esto significa que x + xn ∈ K para infinitos valores
de n, lo cual es equivalente a afirmar que existe una sucesión estrictamente creciente (n j )∞
j=1 de
enteros positivos tal que x + xn j ∈ K para todo j ∈ N. Como lı́mj→∞ xn j = 0 y K es cerrado,
se concluye que x ∈ K. Escojamos ahora, por cada j ∈ N, un punto a j ∈ K tal que x + xn j = a j .
De lo anterior se obtiene que
xn j = a j − x ∈ K − K
lo cual es imposible por (1). Esta contradicción nos asegura que K − K posee un entorno abierto
del cero. Para demostrar la última parte, sea G un entorno abierto del 0 incluido en E − E y sea
g ∈ G. Entonces existen v1 , v2 ∈ E tal que g = v1 − v2 . De aquí se sigue que
v1 = g + v2 ∈ g + E,
lo cual prueba que v1 ∈ E ∩ ( g + E) y termina la prueba.
Nota Adicional 6.3.5 Es interesante observar que la conclusión del resultado de Steinhaus no
es una propiedad exclusiva de los conjuntos medibles con medida positiva. En efecto,
recordemos que el conjunto ternario de Cantor Γ satisface Γ − Γ = [−1, 1] y, por lo tanto,
contiene un entorno abierto del 0.
Sec. 6.3 La Medida de Lebesgue
293
6.3.7. Criterios de Medibilidad
Sea E un subconjunto no vacío de R. ¿Cómo se determina si E es o no un conjunto medible
según Lebesgue?. El objetivo de esta sección es presentar algunos de los criterios más conocidos
y usados que permiten identificar a los subconjuntos medibles de R.
La definición de conjunto medible que hemos dado al comienzo de esta sección usa explícitamente la noción topológica de conjuntos abiertos. La siguiente caracterización de conjuntos
medibles, aunque sigue estando relacionada con la topología de R, en el sentido de ella se formula en término de conjuntos abiertos, cerrados, Gδ y Fσ , tiene un mérito tremendo: describe
explícitamente cómo son los conjuntos medibles.
Teorema 6.3.55. Sea E ⊆ R. Las siguientes condiciones son equivalentes:
( a)
(b)
(c)
( d)
E ∈ Mµ ( R ) .
Para cada ε > 0, existe un conjunto cerrado F ⊆ E tal que µ∗ ( E \ F ) < ε.
E = H ∪ Z, donde H es un Fσ y µ∗ ( Z ) = 0.
E = H \ Z, donde H es un Gδ y µ∗ ( Z ) = 0.
Prueba. ( a) ⇒ (b). Es el Corolario 6.3.9.
(b) ⇒ (c). Suponga que (b) se cumple yS
seleccione, por cada n ∈ N, un conjunto cerrado Fn ⊆ E
∗
tal que µ ( E \ Fn ) < 1/n. Sean H = ∞
n =1 Fn y Z = E \ H. Entonces E = H ∪ Z, H es un
conjunto Fσ y como
∗
µ (E \ H ) = µ
∗
E∩
[
∞
n =1
Fn
c = µ
∗
\
∞
( E \ Fn )
n =1
≤ µ∗ ( E \ Fn ) <
1
n
para todo n ∈ N, resulta que µ∗ ( Z ) = µ∗ ( E \ H ) = 0.
(c) ⇒ ( a). Suponga que (c) se cumple. Como H y Z son medibles, entonces E = H ∪ Z también
lo es.
( a) ⇒ (d). Suponga que E ∈ Mµ (TR ). Para cada n ∈ N, escojamos un abierto Gn ⊇ E tal
que µ∗ ( Gn \ E) < 1/n. Si H = ∞
n =1 Gn , entonces H es un conjunto Gδ conteniendo a E,
por lo que si ahora definimos Z = H \ E, resultará que Z ⊆ Gn \ E para todo n ∈ N y, por
consiguiente, µ∗ ( Z ) ≤ µ∗ ( Gn \ E) < 1/n. Ya que esta última desigualdad es válida para todo
n ∈ N, concluimos que µ∗ ( Z ) = 0.
(d) ⇒ ( a). Es inmediata ya que H \ Z es medible.
Las partes (d) y (c) del resultado anterior es interesante por lo siguiente: para obtener, a partir
de los conjuntos abiertos, la familia de los conjuntos medibles según Lebesgue tan sólo se requiere llevar
a cabo el siguiente procedimiento:
Primero: Se comienza con la familia OR constituida por todos los conjuntos abiertos.
Segundo: Se forma ahora la familia Gδ (R ) de todas las intersecciones numerables de elementos de OR ,
es decir, los conjuntos de tipo Gδ , y finalmente,
Tercero: Se construye la familia Nσµ (R ) de todos los conjuntos nulos N que están incluidos en conjuntos
de tipo Gδ .
294
Cap. 6 La Medida de Lebesgue en R
Cuarto: El conjunto de las diferencias
Gδ (R ) \ Nσµ (R ) = H \ Z : H ∈ Gδ (R ), Z ⊆ E ∈ Gδ (R ), µ( E) = 0
constituye, según (d), la familia de los conjuntos medibles según Lebesgue. También, si uno
comienza con los conjuntos cerrados, construye la colección Fσ (R ) de los conjuntos Fσ ’s y luego
formamos la unión Fσ (R ) ∪ Nµ (R ), se obtiene:
Mµ ( R ) = B ∪ Z : B ∈ F σ ( R ) , Z ⊆ E ∈ F σ ( R ) , µ ( E ) = 0 .
Puesto que Fσ (R ) ⊆ Bo(R ) ⊆ Mµ (R ), lo anterior también se puede expresar en la forma:
Mµ (R ) = Bo(R ) ∪ Nµ (R ).
(MBN)
Esta última igualdad revela un hecho crucial: ya habíamos descubierto que Nµ (R ) no está incluido en Bo(R ), de modo que si queremos localizar conjuntos medibles según Lebesgue que no sean
borelianos tenemos que buscarlos precisamente en Nµ (R ).
Otra manera de reconocer a los conjuntos medibles, similar al resultado anterior, es a través
del siguiente teorema.
Teorema 6.3.56. Sea E ⊆ R. Son equivalentes:
( 1) E ∈ Mµ ( R ) .
(2) Para cada ε > 0, existen un conjunto abierto G y un conjunto cerrado F tales que
F⊆E⊆G
y
µ( G \ F ) < ε.
(3) Existe un conjunto G ∈ Gδ (R ) y un conjunto F ∈ Fσ (R ) tales que
F⊆E⊆G
y
µ( G \ F ) = 0.
Prueba. (1) ⇒ (2). Por definición de conjunto medible, existe un conjunto abierto G ⊇ E tal que
µ( G \ E) < ε/2, y por el Corolario 6.3.9 existe un conjunto cerrado F ⊆ E tal que µ( E \ F ) < ε/2.
Finalmente, como G \ F = ( G \ E) ∪ ( E \ F ), entonces
µ( G \ F ) = µ( G \ E) + µ( E \ F ) < ε.
(2) ⇒ (3). Suponga que (2) se cumple. Para cada n ∈ N, seleccione, usando nuestra suposición,
un conjunto abierto Gn y un conjunto cerrado Fn tales que
Fn ⊆ E ⊆ Gn
Tomando
F=
∞
[
n =1
Fn
y
µ( Gn \ Fn ) < 1/n.
y
G=
∞
\
Gn ,
n =1
vemos que G es un Gδ , F es un Fσ , F ⊆ E ⊆ G, y como G \ F ⊆ Gn \ Fn para todo n ∈ N, se
concluye que µ( G \ F ) = 0.
(3) ⇒ (1). Suponga que los conjuntos F y G satisfacen las condiciones impuestas en (3).
Observe que como E \ F ⊆ G \ F y µ( G \ F ) = 0, entonces E \ F ∈ Mµ (R ) y, en consecuencia,
E = F ∪ ( E \ F ) ∈ Mµ ( R ) .
Sec. 6.3 La Medida de Lebesgue
295
Nótese que las dos caracterizaciones anteriores sólo usan propiedades topológicas de R y, por
consiguiente, son susceptibles de ser generalizadas a espacios topológicos arbitrarios; sin embargo, es una caracterización sin utilidad para subconjuntos en espacios desprovistos de estructura
topológica, por lo que si queremos formular una noción de medibilidad en un contexto abstracto,
es decir, en cualquier conjunto donde no intervenga noción alguna de topología, debemos buscar
otras formas de representarlos. La siguiente manera de caracterizar a los conjuntos medibles, atribuida a Constantin Carathéodory (1873–1950), es interesante ya que no requiere ningún concepto
topológico en su formulación.
Definición 6.3.57. Un conjunto E ⊆ R se dice que satisface el Criterio de Carathéodory si, para
cualquier subconjunto A de R, se cumple que
µ∗ ( A) = µ∗ ( A ∩ E) + µ∗ ( A ∩ Ec )
(6.3.3)
Nótese que por ser A = ( A ∩ E) ∪ ( A ∩ Ec ) una unión disjunta, la subaditividad de µ∗
siempre garantiza que
µ∗ ( A) ≤ µ∗ ( A ∩ E) + µ∗ ( A ∩ Ec ),
de modo que, para verificar que un conjunto E satisface el Criterio de Carathéodory sólo es
suficiente demostrar que
µ∗ ( A) ≥ µ∗ ( A ∩ E) + µ∗ ( A ∩ Ec )
para todo A ⊆ R. La siguiente caracterización de medibilidad es utilizado con frecuencia como
la definición habitual de conjunto medible.
Teorema 6.3.58 (Carathéodory). Sea E ⊆ R. Las siguientes condiciones son equivalentes:
( 1) E ∈ Mµ ( R ) .
(2) E satisface el Criterio de Carathéodory.
Prueba. (1) ⇒ (2). Suponga que E es medible y sea A cualquier subconjunto de R. Puesto que
A = ( A ∩ E) ∪ ( A ∩ Ec ), donde los conjuntos A ∩ E y A ∩ Ec están contenidos, respectivamente,
en los conjuntos medibles y disjuntos E y Ec , resulta entonces del Corolario 6.3.43 que
µ ∗ ( A ) = µ ∗ ( A ∩ E ) + µ ∗ ( A ∩ E c ).
(2) ⇒ (1). Suponga que el conjunto E satisface el Criterio de Carathéodory. Para cada n ∈ N,
sea
En = x ∈ E : | x| ≤ n = E ∩ [−n, n].
S
Entonces cada conjunto En es acotado y E = ∞
n =1 En . Por cada entero n ∈ N, usando de nuevo
el Corolario 6.2.13, escojamos un conjunto Gδ , digamos Gn , tal que
Gn ⊇ En
y
µ ( Gn ) = µ ∗ ( En ) .
Observe que como En ⊆ E y Gn ⊇ En , entonces En = ( En ∩ E) ⊆ ( Gn ∩ E). Si ahora reemplazamos A por Gn en (6.3.3) se tiene que
µ ∗ ( En ) = µ ( Gn ) = µ ∗ ( Gn ∩ E ) + µ ∗ ( Gn ∩ E c ) ≥ µ ∗ ( En ) + µ ∗ ( Gn ∩ E c ) .
296
Cap. 6 La Medida de Lebesgue en R
Puesto que que cada En es acotado, resulta que µ∗ ( En ) < + ∞ y se sigue la desigualdad anterior
que µ∗ ( Gn ∩ Ec ) = 0. Sea Zn = Gn ∩ Ec , n = 1, 2, . . . Del Teorema 6.3.2 sabemos que Zn es
medible y, por lo tanto,
G =
∞
[
y
Gn
Z =
n =1
∞
[
Zn
n =1
son medibles. Finalmente, como
c
G\E = G∩E =
[
∞
n =1
Gn ∩ E c =
∞
[
( Gn ∩ E c ) =
n =1
∞
[
Zn = Z,
n =1
resulta que E = G \ ( G \ E) = G \ Z ∈ Mµ (R ).
Nota Adicional 6.3.6 ( a) Es importante destacar que si en el Criterio de Carathéodory la condición “para todo A ⊆ R” se reemplaza por “para todo A ∈ Mµ (R )”, entonces E ∈ Mµ (R ).
De hecho, algo más fuerte se puede afirmar. Del Corolario 6.2.13 y los argumentos dados
en la demostración del resultado anterior se tiene que:
(b) si el Criterio de Carathéodory se cumple para todo conjunto A ∈ Gδ , entonces E ∈ Mµ (R ).
Corolario 6.3.59. Sea A ⊆ R con µ∗ ( A) < + ∞. Si existe un conjunto medible E ⊆ A tal que
µ( E) = µ∗ ( A), entonces A es medible.
Prueba. Siendo E medible, se sigue del Teorema de Carathéodory que,
µ∗ ( A) = µ∗ ( A ∩ E) + µ∗ ( A ∩ Ec )
= µ∗ ( E) + µ∗ ( A ∩ Ec )
= µ ( E ) + µ ∗ ( A ∩ E c ).
Por otro lado, como µ∗ ( A) < + ∞ y E ⊆ A, entonces µ∗ ( E) < + ∞ y, en consecuencia,
0 = µ ∗ ( A ) − µ ( E ) = µ ∗ ( A ∩ E c ).
Esto nos muestra que A ∩ Ec es medible y, por consiguiente, A = E ∪ ( A ∩ Ec ) también es
medible.
Teorema 6.3.60. Sea E ∈ Mµ (R ) con µ( E) < +∞. Para cada conjunto A ⊆ E, las siguientes
condiciones son equivalentes:
( 1) A ∈ Mµ ( R ) .
( 2) µ ( E ) = µ ∗ ( A ) + µ ∗ ( E \ A ) .
Prueba. (1) ⇒ (2). Si A ∈ Mµ (R ), entonces
µ ( E ) = µ ( E ∩ A ) + µ ( E ∩ Ac ) = µ ( A ) + µ ( E \ A ).
Sec. 6.3 La Medida de Lebesgue
297
(2) ⇒ (1). Suponga que (2) se cumple. Por el Corolario 6.3.38 existe un conjunto G1 de
tipo Gδ tal que A ⊆ G1 y µ( G1 ) = µ∗ ( A). Sea G = G1 ∩ E. Entonces G ∈ Mµ (R ), A ⊆ G,
E \ G ⊆ E \ A y µ( G ) = µ∗ ( A). Nuestra hipótesis y el hecho de que G es medible implican que
µ ∗ ( A ) + µ ∗ ( E \ A ) = µ ( E ) = µ ( E ∩ G ) + µ ( E \ G ) = µ ( G ) + µ ( E \ G ).
De esto se sigue que µ∗ ( E \ A) = µ( E \ G ) y, entonces, por el Corolario 6.3.59, el conjunto E \ A
es medible. Finalmente, A = E \ ( E \ A) ∈ Mµ (R ).
Del resultado anterior se tiene que si E ⊆ [0, 1] y
µ∗ ( E) + µ∗ ([0, 1] \ E) = 1,
entonces E es medible.
Ejemplo 6.3.3. Ya hemos visto, Teorema 6.2.17, que si A y B son subconjuntos de R que cumplen
la desigualdad dist( A, B) > 0, entonces µ∗ ( A ∪ B) = µ∗ ( A) + µ∗ ( B). Si se omite la condición
dist( A, B) > 0, pero se impone esta otra: existe un conjunto medible E tal que
A⊆E
B∩E = ∅
y
entonces la conclusión es la misma, es decir, µ∗ ( A ∪ B) = µ∗ ( A) + µ∗ ( B).
Prueba. Como E es medible, el Teorema de Carathéodory nos dice
µ∗ ( A ∪ B) = µ∗ ( A ∪ B) ∩ E + µ∗ ( A ∪ B) ∩ Ec
= µ∗ ( A ∩ E) + µ∗ ( B ∩ Ec )
= µ ∗ ( A ) + µ ∗ ( B ).
Podemos ahora dar otra condición bajo la cual la medida exterior es numerablemente aditiva.
Aquí supondremos que Mµ (R ) $ P (R ), es decir, que existen conjuntos no-medibles.
∞
Teorema 6.3.61. Sea En n=1 una sucesión disjunta en Mµ (R ) con µ( En ) > 0 para todo n ∈ N.
∞
Si An n=1 es una sucesión de conjuntos no-medibles tal que An ⊆ En para todo n ≥ 1, entonces
∞
[
n =1
A n 6 ∈ Mµ ( R )
y
µ
∗
[
∞
An
n =1
=
∞
X
µ ∗ ( A n ).
n =1
S∞
S∞
Prueba.
S∞Claramente n=1 An 6∈ Mµ (R ). En efecto, suponer que n=1 An ∈ Mµ (R ) conduce a
que ( n=1 An ) ∩ Em = Am ∈ Mµ (R ) para cualquier m ∈ N, lo cual es imposible. Veamos ahora
que
[
∞
∞
X
∗
µ
An =
µ ∗ ( A n ).
n =1
Puesto que
µ∗
n =1
es numerablemente subaditiva, sólo necesitamos demostrar que
µ
∗
[
∞
n =1
An
≥
m
X
n =1
µ∗ ( An )
298
Cap. 6 La Medida de Lebesgue en R
para cualquier m ∈ N. Veamos esto último. Como µ∗ es monótona, resulta que
µ
∗
[
∞
An
n =1
≥ µ
∗
[
m
An
n =1
para todo m ≥ 1. Demostremos ahora, por inducción, que
µ
∗
[
m
An
n =1
=
m
X
µ ∗ ( A n ).
n =1
La igualdad es trivial para m = 1. Suponga que ella se cumple para m = k. Puesto que
Sk
c
A k + 1 ⊆ Ek + 1 y
n =1 A n ⊆ Ek+1 , entonces la medibilidad de Ek+1 implica, aplicando el Criterio
de Carathéodory y la hipótesis inductiva, que
µ
∗
k[
+1
n =1
An
= µ
∗
k[
+1
n =1
A n ∩ Ek + 1
∗
= µ ( A k+1 ) + µ
∗
[
k
+µ
n =1
= µ ∗ ( A k+1 ) +
k
X
∗
k[
+1
n =1
An
µ∗ ( An ) =
n =1
An ∩
k+1
X
Ekc+1
µ∗ ( An )
n =1
La prueba es completa.
Finalizamos esta sección con una nueva e interesante caracterización de medibilidad para
conjuntos con medida exterior finita. J. E. Littlewood simplificó la conexión de la Teoría de La
Medida con el Análisis Real Clásico mostrando tres principios, conocidos ahora como los Tres
Principios de Littlewood, que los vinculan (es necesario señalar que Littlewood no tuvo ninguna
contribución en la prueba de esos principios).
Teorema 6.3.62 (Primer Principio de Littlewood). Sea E ⊆ R con µ∗ ( E) < + ∞. Las siguientes
condiciones son equivalentes:
( 1) E ∈ Mµ ( R ) .
(2) Dado ε > 0, existe una familia finita de intervalos abiertos
tal que
n
[
∗
µ E△
Ii < ε.
I1 , . . . , In , disjuntos dos a dos,
i=1
Prueba. (1) ⇒ (2). Suponga que E ∈ Mµ (R ) y sea ε > 0. Como µ∗ ( E) < + ∞, el Corolario 6.3.40 nos garantiza la existencia de un conjunto compacto K ⊆ E tal que µ( E \ K ) < ε/2.
Siendo K un conjuntoSmedible, existe unconjunto abierto G ⊇ K tal que µ( G \ K ) < ε/2. Escriba∞
mos a G como G = ∞
n =1 In , donde In n =1 es una sucesión de intervalos abiertos disjuntos dos
Sec. 6.3 La Medida de Lebesgue
299
a dos. Puesto que K es compacto y K ⊆ G =
∞
S
de In n=1 tal que K ⊆ ki=1 Ini . Por esto,
µ
∗
E△
k
[
Ini
i=1
= µ
∗
S∞
n =1 In ,
E\
k
[
existe una subcolección finita
Ini
i=1
∪
[
k
i=1
Ini \ E
In1 , . . . , Ink
[
k
k
[
= µ E\
Ini + µ
Ini \ E
i=1
i=1
≤ µ( E \ K ) + µ( G \ E)
< ε.
(2) ⇒ (1). Suponga que (2) se cumple y sea ε > 0. Lo que queremos
es demostrar la existencia
de un conjunto abierto G ⊇ E tal que µ∗ ( G \ E) < ε. Sea I1 , . . . , In una colección finita de
Sn
∗ E △
intervalos
abiertos
bajo
la
cual
la
desigualdad
µ
I
< ε/3 se cumple.
Pongamos
i
i
=
1
S
S
O1 = ni=1 Ii . Observe que como E \ O1 y O1 \ E son subconjuntos de E △ ni=1 Ii , entonces
µ ∗ E \ O1
<
ε
3
µ ∗ O1 \ E
y
<
ε
.
3
Invocando el Teorema 6.2.12 podemos garantizar la existencia de un conjunto abierto O2 de modo
tal que
ε
O2 ⊇ E \ O1
y
µ ∗ (O2 ) ≤ µ ∗ E \ O1 + .
3
Esta última desigualdad combinada con la desigualdad µ∗ E \ O1 < ε/3 produce
µ ∗ (O2 ) <
2ε
.
3
Definamos ahora G = O1 ∪ O2 . Como E = E \ O1 ∪ E ∩ O1 y G es abierto, resulta que E ⊆ G
y
µ ∗ ( G \ E ) = µ ∗ O1 ∪ O2 \ E
∗
≤ µ O1 \ E + µ ∗ O2 \ E
<
ε
+ µ ∗ O2
3
< ε.
La prueba es completa.
Los otros dos principios de Littlewood, conocidos como los Teorema de Lusin y SeveriniEgoroff, serán dados a conocer en la sección sobre funciones medibles desarrolladas un poco más
adelante.
300
Cap. 6 La Medida de Lebesgue en R
6.3.8. Medida Interior
El concepto de medida interior es de mucha utilidad para entender de modo más cabal el fenómeno de la no existencia de subconjuntos medibles que viven en conjuntos que poseen medida
exterior positiva. Recordemos, Corolario 6.3.40, que si E es un conjunto medible de medida
finita, entonces
µ( E) = sup µ(K ) : K ⊆ E, K compacto .
En general, para conjuntos arbitrarios, se tiene la siguiente definición.
Definición 6.3.63. Sea A un subconjunto de R. La medida interior de Lebesgue de A se define por
µ∗ ( A) = sup µ(K ) : K ⊆ A, K compacto .
Como antes, escribiremos medida interior en lugar de medida interior de Lebesgue. Algunas
de las propiedades que posee la medida interior se dan a continuación. Observe la similitud de
algunas de ellas con la de la medida exterior.
Lema 6.3.64. Sea A un subconjunto de R. Entonces las siguientes condiciones se cumplen:
( i1 )
( i2 )
( i3 )
( i4 )
µ ∗ ( A ) ≤ µ ∗ ( A ).
Si B ⊆ A, entonces µ∗ ( B) ≤ µ∗ ( A).
µ∗ ( x + A) = µ∗ ( A) para cualquier x ∈ R.
∞
Si An n=1 es una sucesión disjunta de subconjuntos de R, entonces
µ∗
[
∞
n =1
An
≥
∞
X
n =1
µ ∗ ( A n ).
Prueba. (i1 ). Sean K y G subconjuntos arbitrarios de R de modo tal que K sea compacto, G
abierto y se cumpla que K ⊆ A ⊆ G. Puesto que µ(K ) ≤ µ( G ), resulta que si mantenemos a G
fijo y variamos a K tendremos que
µ∗ ( A) = sup µ(K ) : K ⊆ A, K compacto
≤ µ ( G ).
Por otro lado, por el Teorema 6.2.12 sabemos que
µ∗ ( A) = ı́nf{µ( G ) : A ⊆ G, G abierto}
y, por lo tanto, µ∗ ( A) ≤ µ∗ ( A).
(i2 ) sigue directamente de la definición, mientras que (i3 ) es consecuencia de la definición y del
hecho de que µ es invariante por traslación.
(i4 ). Escojamos, para cada n ∈ N, un conjunto compacto Kn ⊆ An . La sucesión (Kn )∞
n =1 es
SN
medible
y
disjunta.
Sea
N
∈
N
arbitrario.
Puesto
que
K
es
un
conjunto
compacto
incluido
n =1 n
S
en ∞
A
entonces
por
la
definición
de
µ
y
la
aditividad
de µ tenemos que
n
∗
n =1
µ∗
[
∞
n =1
An
≥ µ
[
N
n =1
Kn
=
N
X
n =1
µ ( K n ).
Sec. 6.3 La Medida de Lebesgue
301
Con N fijo y tomando el supremo sobre todos los compactos Kn que habitan en An , resulta que
[
∞
N
X
µ∗
An ≥
µ ∗ ( A n ).
n =1
n =1
Si ahora hacemos que N tienda a + ∞, obtendremos el resultado deseado.
Una de las grandes diferencias entre la medida exterior y la medida interior de Lebesgue es la
siguiente: si E es cualquier conjunto tal que µ∗ ( E) = 0, entonces E siempre es medible. Sin embrago,
es posible obtener un conjunto no medible V tal que µ∗ (V ) = 0. Por ejemplo, el conjunto de Vitali,
que construiremos en la próxima sección, es un tal conjunto.
El siguiente resultado, que no es ninguna sorpresa, es una nueva caracterización de conjuntos
medibles con medida finita.
Teorema 6.3.65 (La Igualdad µ∗ = µ∗ ). Sea E un subconjunto de R. Si E es medible, entonces
µ ∗ ( E ) = µ ∗ ( E ).
(6.3.4)
Recíprocamente, si µ∗ ( E) = µ∗ ( E) < + ∞, entonces E ∈ Mµ (R ).
Prueba. Suponga que E es medible. Si µ∗ ( E) < + ∞, entonces la igualdad (6.3.4) sigue del
Corolario 6.3.40. Si µ∗ ( E) = + ∞, entonces con ε = 1, podemos invocar el Corolario 6.3.9 para
obtener un subconjunto cerrado F ⊆ E tal que µ∗ ( E \ F ) < 1. Por esto,
µ∗ ( E) = µ∗ F ∪ ( E \ F ) ≤ µ∗ ( F ) + µ∗ ( E \ F ) < µ∗ ( F ) + 1
F ∩ [−n, n]. Observe que como
y, por consiguiente, µ∗ ( F ) = + ∞. Para cada n ∈ N, sea Kn = S
∞
(Kn )n=1 es una sucesión monótona creciente de compactos con ∞
n =1 K n = F, el Teorema 6.3.45
nos garantiza entonces que
lı́m µ(Kn ) = µ( F ) = + ∞.
n→∞
De esto se deduce que µ∗ ( E) ≥ supn≥1 µ(Kn ) = + ∞ = µ∗ ( E) y termina la prueba de la igualdad
(6.3.4).
Para demostrar el recíproco, suponga que µ∗ ( E) = µ∗ ( E) < + ∞ y fijemos un ε > 0 elegido
arbitrariamente. Seleccionemos un conjunto compacto K ⊆ E de modo tal que
ε
ε
µ(K ) ≥ µ∗ ( E) −
≥ µ∗ ( E) − .
2
2
Invoquemos ahora el Teorema 6.2.12 para hallar un conjunto abierto G ⊇ E que satisfaga
ε
µ( G ) ≤ µ∗ ( E) + .
2
Finalmente, de las dos desigualdades anteriores podemos concluir que
µ∗ ( G \ E) ≤ µ( G \ K ) = µ( G ) − µ(K )
= µ( G ) − µ∗ ( E) + µ∗ ( E) − µ(K ) ≤ ε,
lo cual prueba que E es medible.
El Teorema 6.2.12 combinado con el Teorema 6.3.65, conducen a una de las representaciones
más importantes de la medida de Lebesgue, comúnmente conocida con el nombre de regularidad
de la medida de Lebesgue.
302
Cap. 6 La Medida de Lebesgue en R
Corolario 6.3.66 (Regularidad de µ). Si E ∈ Mµ (R ), entonces
µ( E) = ı́nf µ( G ) : E ⊆ G, G abierto
= sup µ(K ) : K ⊆ E, K compacto .
Los siguientes dos resultados muestran una estrecha e interesante relación entre la medida exterior y la medida interior. Debemos resaltar que tales resultados son fundamentales para conocer
algunas de las extrañas propiedades que poseen los conjuntos no-medibles que estudiaremos un
poco más abajo.
Teorema 6.3.67. Sea E ∈ Mµ (R ). Entonces para cualquier conjunto A ⊆ E, se verifica que
µ ( E ) = µ ∗ ( A ) + µ ∗ ( E \ A ).
Prueba. Por cada ε > 0 seleccionemos, usando la definición de µ∗ ( A), un subconjunto compacto
K ⊆ A tal que µ(K ) > µ∗ ( A) − ε. De esto se sigue que
µ( E) = µ(K ) + µ( E \ K ) > µ∗ ( A) − ε + µ∗ ( E \ A)
y como nuestro ε es arbitrario, se concluye que
µ ( E ) ≥ µ ∗ ( A ) + µ ∗ ( E \ A ).
Para demostrar la otra desigualdad, trabajemos ahora con el conjunto E \ A e invoquemos el
Corolario 6.2.13 para hallar un conjunto Gδ , digamos G, tal que E \ A ⊆ G ⊆ E y se cumpla que
µ( G ) = µ∗ ( E \ A). Puesto que E \ G es medible y E \ G ⊆ A, se sigue del Teorema 6.3.65 que
µ( E \ G ) = µ∗ ( E \ G ) = µ∗ ( E \ G ) ≤ µ∗ ( A) y, en consecuencia,
µ ( E ) = µ ( G ) + µ ( E \ G ) = µ ∗ ( E \ A ) + µ ( E \ G ) ≤ µ ∗ ( E \ A ) + µ ∗ ( A ).
Combinando las desigualdades anteriores obtenemos que
µ ( E ) = µ ∗ ( A ) + µ ∗ ( E \ A ).
Esto termina la prueba.
Teorema 6.3.68. Sea A ⊆ R un conjunto arbitrario. Las siguientes condiciones son equivalentes:
( 1)
( 2)
( 3)
( 4)
µ∗ ( Ac ) = 0.
A ∩ E 6= ∅ para cualquier conjunto E ∈ Mµ (R ) con µ( E) > 0.
µ( E) = µ∗ ( A ∩ E) para cualquier conjunto E ∈ Mµ (R ).
µ( I ) = µ∗ ( A ∩ I ) para cualquier intervalo abierto I ⊆ R.
Prueba. (1) ⇒ (2) Sea A ⊆ R satisfaciendo (1) y sea E ∈ Mµ (R ) con µ( E) > 0. Si A ∩ E = ∅,
entonces E ⊆ Ac y se sigue del Lema 6.3.64 y el Teorema 6.3.65 que
µ∗ ( Ac ) ≥ µ∗ ( E) = µ( E) > 0
lo cual contradice a (1).
Sec. 6.3 La Medida de Lebesgue
303
(2) ⇒ (3) Suponga que (2) se cumple y sea E ∈ Mµ (R ). Entonces
µ ∗ ( A ∩ E ) ≤ µ ∗ ( E ) = µ ( E ).
Veamos que la desigualdad estricta µ∗ ( A ∩ E) < µ( E) no puede ocurrir. Suponga que existe
algún conjunto medible E ⊆ R tal que
µ ∗ ( A ∩ E ) < µ ( E ).
Por el Corolario 6.2.13, existe un conjunto medible G tal que A ∩ E ⊆ G y µ( G ) = µ∗ ( A ∩ E).
De allí que µ( G ) = µ∗ ( A ∩ E) < µ( E) y, por consiguiente,
µ ( G ∩ E ) ≤ µ ( G ) < µ ( E ).
(α)
Ahora bien, puesto que µ( E) < +∞, resulta de (α) que µ( G ∩ E) < +∞ y, por lo tanto, usando
una vez más (α), se obtiene que
µ( E \ ( G ∩ E)) = µ( E) − µ( G ∩ E) > 0.
Por otro lado, como A ∩ E ⊆ G ∩ E, entonces E \ ( G ∩ E) ⊆ E \ ( A ∩ E) ⊆ Ac lo cual muestra la
existencia de un conjunto medible E0 = E \ ( G ∩ E) de medida positiva disjunto de A. Esto, por
supuesto, contradice a (2) y, en consecuencia, la suposición de que µ∗ ( A ∩ E) < µ( E) es falsa.
(3) ⇒ (4) Es trivial ya que todo intervalo abierto es un conjunto medible.
(4) ⇒ (1) Suponga que µ∗ ( Ac ) > 0. Se sigue de la definición de µ∗ ( Ac ) que podemos elegir
un conjunto compacto K ⊆ Ac tal que µ(K ) > 0. Para cada n ∈ N, pongamos Jn = (−n, n).
Puesto que
[
∞
∞
[
Jn =
K = K∩R = K∩
K ∩ Jn ,
y la sucesión K ∩ Jn
n =1
∞
n =1
n =1
es creciente, la continuidad de µ nos garantiza entonces que
µ(K ) = lı́m µ K ∩ Jn ,
n→∞
y, por lo tanto, µ K ∩ Jn > 0 para algún n suficientemente grande. Pongamos J = Jn para tal
n. Observe ahora que como K ⊆ Ac , entonces A ∩ J ∩ K = ∅ y, por consiguiente,
A ∩ J = ( A ∩ J ∩ K) ∪ ( A ∩ J ∩ Kc) = A ∩ J ∩ Kc ⊆ J ∩ Kc.
Se sigue de esto que
µ( J ) = µ∗ ( A ∩ J ) ≤ µ∗ ( J ∩ K c ) = µ( J ∩ K c )
= µ( J \ ( J ∩ K )) = µ( J ) − µ( J ∩ K ) < µ( J )
lo que constituye una incuestionable inconsistencia. La prueba es completa.
Recordemos que un subconjunto D de R es denso en R si D ∩ V 6= ∅ para todo conjunto
abierto no vacío V ⊆ R. Puesto que todo conjunto abierto en R tiene medida positiva, se sigue
de (2) del resultado anterior que si µ∗ ( Ac ) = 0, entonces A es denso en R. También, nótese que
los intervalos abiertos en la condición (4) del resultado anterior pueden ser reemplazados por
intervalos cerrados. Obsérvese que cuando A = R todas esas condiciones se satisfacen.
304
Cap. 6 La Medida de Lebesgue en R
6.4. Conjuntos Medibles con Propiedades Especiales
En esta parte nos proponemos mostrar la existencia de algunos conjuntos medibles que poseen
propiedades que desbordan la imaginación.
El siguiente argumento constituye otra manera de demostrar que Γ, el conjunto ternario de
Cantor, es nunca-denso.
Teorema 6.4.1. Sea E un conjunto cerrado no vacío de R y suponga que µ( E) = 0. Entonces E es
nunca-denso. En particular, Γ es nunca-denso en [0, 1].
Prueba. Vamos a demostrar que cada intervalo abierto I ⊆ R contiene un subintervalo abierto J
tal que J ∩ E = ∅. En efecto, sea I un intervalo abierto arbitrario no vacío. Puesto µ( E) = 0,
el intervalo I no puede estar contenido en E y, en consecuencia, I ∩ (R \ E) 6= ∅. Ahora bien,
como R \ E es abierto, el conjunto abierto no vacío I ∩ (R \ E) contiene un intervalo J el cual es
disjunto de E y termina la prueba.
Otra forma, tal vez más sencilla, de demostrar el resultado anterior es observar que si int( E) 6=
∅ y J es un intervalo abierto incluido en int( E), entonces 0 = µ( E) ≥ µ( J ) > 0. Esta contradicción nos indica que E es nunca-denso.
El hecho de todo conjunto nunca-denso no contiene ningún intervalo abierto en su interior
puede hacer suponer que su medida es siempre cero. Sin embargo, tal presunción es falsa: todo
conjunto tipo-Cantor de medida positiva es cerrado y nunca-denso. Lo que es realmente sorprendente
es la existencia de un conjunto cerrado, nunca-denso, de medida positiva que, además, está
contenido en el complemento de un Gδ -denso, es decir, un conjunto de primera categoría que
también es no-numerable.
Teorema 6.4.2 (Conjunto nunca-denso de medida positiva). ( a) Para cada ε > 0, existe un conjunto abierto y denso Gε ⊆ R tal que µ( Gε ) ≤ ε.
(b) Existe un conjunto medible E ⊆ R con las siguientes propiedades:
(b1 ) E es cerrado, nunca-denso con µ( E) > 0 y
(b2 ) existe un conjunto Gδ -denso, digamos G ⊆ R, con µ( G ) = 0 tal que E ⊆ R \ G.
En particular, E es de primera categoría.
Prueba. ( a) Sea ε > 0 y suponga que (qn )∞
n =1 es una lista de los números racionales. Considere
el conjunto
∞ [
ε
ε
Gε =
q n − n +1 , q n + n +1
2
2
n =1
Observe que cada Gε es un conjunto abierto y, además, denso en R ya que contiene a Q. Más
aun,
∞
∞
X
X
ε
ε ε
µ ( Gε ) ≤
µ q n − n +1 , q n + n +1
=
= ε.
2
2
2n
n =1
n =1
Esto último nos indica que el conjunto Gε $ R.
(b) Seleccione, usando la parte ( a), el conjunto E = R \ G1/2 . Resulta entonces que E es cerrado
y como no contiene a ningún número racional dicho conjunto es nunca-denso. Más aun,
µ( E) = µ(R \ G1/2 ) ≥ µ([0, 1] \ G1/2 ) = µ([0, 1]) − µ( G1/2 ) ≥
1
.
2
Sec. 6.4 Conjuntos Medibles con Propiedades Especiales
305
¿Puede
T el lector exhibir algún número irracional en E? Para demostrar la segunda parte, sea
G= ∞
n =1 G1/n . Por el Teorema de Categoría de Baire, G es un Gδ -denso y, por consiguiente, nonumerable. En particular, R \ G es de primera categoría. Además, puesto que µ( G ) ≤ µ( G1/n ) ≤
1/n para todo n ≥ 1, se tiene que µ( G ) = 0 y concluye la prueba.
Teorema 6.4.3. El conjunto de los números reales se puede expresar en la forma R = A ∪ G, donde A
es de primera categoría con µ( A) > 0, G es un Gδ -denso con µ( G ) = 0 y A ∩ G = ∅.
Prueba. Sea (qn )∞
n =1 una lista de los números racionales en R y como en el resultado anterior,
defina
∞ [
ε
ε
Gε =
q n − n +1 , q n + n +1
2
2
n =1
T∞
para cada 0 < ε < 1. Entonces G = n=1 G1/n es, gracias al Teorema de Categoría de Baire, un
Gδ -denso en R con µ( G ) = 0. De allí que, si definimos A = R \ G tendremos que A es de
primera categoría, R = A ∪ G y µ( A) > 0.
Nota Adicional 6.4.7 Lo que nos muestra el Teorema 6.4.3 es que R se puede descomponer en los
dos conjuntos A y N que son, desde dos puntos de vista diferentes, pequeños y grandes
a la vez. En efecto, la noción de conjunto de primera categoría es, desde el punto de vista
topológico, un objeto “pequeño”, por lo que A es pequeño desde la perspectiva topológica
pero grande desde la perspectiva de medida. Lo mismo ocurre con el conjunto N: desde la
óptica de la Teoría de la Medida N es pequeño pero inmensamente grande topológicamente.
Corolario 6.4.4. Si L es un conjunto de Lusin, entonces L es de segunda categoría y de medida
cero.
Prueba. Usando el resultado anterior, escriba a R como R = A ∪ N, donde A es de primera
categoría y N es un conjunto nulo. Si L es un conjunto de Lusin, entonces él se puede escribir
como la unión disjunta L = (L ∩ A) ∪ (L ∩ N ). Ahora bien, como A es primera categoría, se
tiene que card(L ∩ A) ≤ ℵ0 , es decir, L ∩ A es a lo más numerable y, por lo tanto, µ(L ∩ A) = 0.
Por otro lado, como L ∩ N es un subconjunto de un conjunto nulo, resulta que µ(L ∩ N ) = 0.
Por esto,
µ(L ) = µ(L ∩ A) + µ(L ∩ N ) = 0.
La prueba es completa.
Podemos afinar un poco más el resultado anterior si permitimos la siguiente definición.
Definición 6.4.5. Un conjunto A ⊆ R se dice que es fuertemente de medida cero si para cada sucesión
∞
(ε n )∞
n =1 de números reales positivos, se puede encontrar una sucesión de intervalos abiertos In n =1 tal
que
∞
[
A ⊆
In
y
µ( In ) < ε n para todo n ≥ 1.
n =1
Como la definición de conjunto fuertemente de medida cero no impone restricciones sobre los
números positivos ε n , considerar el caso en que todo ellos son iguales conduce a la conclusión:
todo conjunto fuertemente de medida cero es de medida cero. Sin embargo, el recíproco de ésta
conclusión no es, en general cierto: existen conjuntos nulos que no son fuertemente de medida cero.
306
Cap. 6 La Medida de Lebesgue en R
Teorema 6.4.6. Si L es un conjunto de Lusin, entonces L es fuertemente de medida cero.
Prueba. Sea (ε n )∞
de números reales positivos. Deseamos encontrar una sucesión
n =1 una sucesión
∞
de intervalos abiertos In n=1 tal que
L ⊆
∞
[
y
In
µ( In ) < ε n
n =1
para todo n ≥ 1.
Sea {qn : n = 1, 2, . . . } una enumeración de los racionales
∞ en R y construya, tal como se hizo
en la demostración del Teorema S
6.4.2, una sucesión In n=1 de intervalos abiertos de modo que
qn ∈S In , µ( In ) < ε 2n y R " ∞
n =1 In . Con esta prescripción resulta que el conjunto A =
R\ ∞
I
es
un
conjunto
cerrado
y nunca-denso ya que no contiene a ningún número racional.
n =1 n
Por consiguiente, A es primera categoría y como L es un conjunto de Lusin se tiene que L ∩ A
es a lo más numerable. Sea { xn : n ∈ N } una enumeración (finita o infinita numerable) de los
elemento de L ∩ A y para cada n ∈ N, seleccione un intervalo abierto
S∞Jn tal queSxn ∈ Jn y
µ( Jn ) < ε 2n+1 para todo n ∈ N. De todo lo anterior se sigue que L ⊆
n =1 In ∪
n ∈ N Jn lo
cual muestra que L es fuertemente de medida cero.
Sabemos que todo conjunto medible de medida positiva es no-numerable y que existen conjuntos no-numerables de medida cero. Consideremos este otro hecho: si denotamos por I [0,1] el
conjunto de los números irracionales en [0, 1], entonces I [0,1] es no numerable, denso en [0, 1] y,
además, se cumple que µ(I [0,1] ) = 1. En base a este ejemplo podemos formularnos la siguiente
pregunta: ¿es cualquier conjunto medible, denso y no numerable de medida positiva? El siguiente es un
contraejemplo a nuestra pregunta.
Ejemplo 6.4.1. Si definimos E = Γ ∪ Q [0,1] , donde Q [0,1] es el conjunto de los racionales en [0, 1] y Γ
es el conjunto ternario de Cantor, resulta que E es un conjunto medible, no numerable, denso en [0, 1]
y, sin embargo, µ( E) = 0.
El conjunto ternario de Cantor es un ejemplo de un conjunto compacto, perfecto y nunca-denso
de medida nula. Podemos preguntarnos: ¿es cierto que todo conjunto compacto, perfecto y nunca-denso
de R posee medida cero? La respuesta, como lo muestra el siguiente resultado, es que cualquier
conjunto tipo-Cantor de medida positiva es un contraejemplo a dicha presunción.
Ejemplo 6.4.2. Existe un conjunto compacto, perfecto y nunca-denso P ⊆ R con µ( P) > 0.
Prueba. Fijemos α ∈ (0, 1) y sea Γα el conjunto tipo-Cantor de medida positiva construido en la
Sección 5.1.6, página 229. Resulta que Γα es compacto, perfecto y nunca-denso. Además, como
[0, 1] \ Γα =
2n − 1
∞
[
Jnα
n =1
donde cada
es la unión disjunta de los
intervalos abiertos borrados en la etapa n-ésima,
cada uno de los cuales tiene longitud α/22n−1 , se tiene que:
Jnα
µ [0, 1] \ Γα
=
∞
X
µ( Jnα )
n =1
α
α
α
α
α
n −1
=
+ 2 3 + 4 5 + 8 7 + ··· + 2
+ ···
2
2
2
2
22n−1
X
∞
1
= α·
= α.
2n
n =1
Sec. 6.4 Conjuntos Medibles con Propiedades Especiales
307
Por el Corolario 6.3.39 se sigue entonces que µ(Γα ) = 1 − α > 0.
Otra manera de obtener un conjunto perfecto como el del ejemplo anterior es considerar el
conjunto I de los números irracionales en [0, 1]. Puesto que I es medible con µ(I ) = 1, el
Teorema 6.3.56, página 294, permite seleccionar un conjunto cerrado F ⊆ I tal que µ(I \ F ) <
1/2. De esto se sigue que µ( F ) = µ(I ) − µ(I \ F ) > 1/2. En particular, F es no-numerable. Por
el Teorema de Cantor-Bendixson, página 130, existen un conjunto perfecto P y conjunto a lo más
numerable N tal que F = P ∪ N. Como µ( F ) = µ( P) + µ( N ) = µ( P), se tiene entonces que
µ( P) > 0. Más aun, P es compacto y nunca-denso ya que no contiene ningún número racional
en [0, 1].
Teorema 6.4.7. Cualquier subconjunto Gδ no-numerable de R contiene un subconjunto no-numerable, cerrado, nunca-denso y de medida cero.
Prueba. Sea G subconjunto Gδ y
no-numerable de R. Seleccione una sucesión ( Gn )∞
n =1 de
T∞
conjuntos abiertos tal que G = n=1 Gn . Denote por F el conjunto de todos los puntos de
condensación de G y observe que, gracias al Teorema 2.2.21, página 130, F 6= ∅. Además,
cualquier punto de F es un punto límite de F. Sean J0 y J1 intervalos cerrados y disjuntos tales
que, para cada i ∈ {0, 1},
( a1 ) Ji ⊆ G1 ,
(b1 ) µ( Ji ) ≤ 1/3
y
(c1 ) int( Ji ) ∩ F 6= ∅.
Observe que G2 ∩ J0 y G2 ∩ J1 son ambos no vacíos pues cada uno de ellos contienen puntos de
condensación de G. Seleccione intervalos cerrados y disjuntos J00 , J01 , J10 y J11 tales que, para
cada i, j ∈ {0, 1},
( a2 ) Jij ⊆ G2 ∩ Ji ,
(b2 ) µ( Jij ) ≤ 1/32 ,
y
(c2 ) int( Jij ) ∩ F 6= ∅.
Continuando de este modo indefinidamente, se obtiene una familia de intervalos cerrados
J =
n
Ji1 i2 ...in : n ∈ N, i j ∈ {0, 1}
o
tales que cada uno de ellos tiene un punto en común con F y, además, verifican, para cada
n ∈ N, lo siguiente:
( a3 ) Ji1 i2 ...in+1 ⊆ Gn ∩ Ji1 i2 ...in
y
(b3 ) µ( Ji1 i2 ...in ) ≤ 1/3n .
Defina, para cada n ∈ N, el conjunto
Fn =
1
1
[
[
i1 = 0 i2 = 0
···
1
[
in =0
Ji1 i2 ...in
308
Cap. 6 La Medida de Lebesgue en R
T
y sea F = ∞
n =1 Fn . Veamos que F tiene las propiedades deseadas. En efecto, observe en primer
lugar que F escerrado ya que cada Fn lo es. Además, como µ( Fn ) ≤ 2n /3n para todo n ≥ 1 y
∞
la sucesión Fn n=1 es decreciente, resulta que
µ( F ) = lı́m µ( Fn ) = 0.
n→∞
Se sigue del Teorema 6.4.1 que F es nunca-denso. Finalmente, para ver que F es no numerable,
observe que a cada x ∈ F, le corresponde una única sucesión (i j )∞
j=1 de 0’s y 1’s tal que
x ∈ Ji1 i2 ...in para todo n ≥ 1. Recíprocamente, sea (i j )∞
una
sucesión
con i j ∈ {0, 1} y observe
j=1
∞
decreciente y sus diámetros tienden a cero, el Teorema de
que como la sucesión ( Ji1 i2 ...in )n=1 es T
Encaje de Cantor nos garantiza que ∞
n =1 Ji1 i2 ...in = { x }. Este argumento revela que existe una
identificación entre los puntos de F y las sucesiones de 0’s y 1’s, es decir, 2N . Puesto que
card(2N ) = c, resulta que card( F ) = c y termina la prueba.
La parte ( a) siguiente resultado establece que los subconjuntos medibles de un conjunto
medible de medida positiva son super abundantes: hay tantos como la cardinalidad del continuo,
lo cual nos hace recordar la Propiedad del Valor Intermedio.
Teorema 6.4.8. Sea E un conjunto medible y acotado con µ( E) > 0. Para cada q ∈ (0, µ( E)), se
tiene que:
( a) Existe un conjunto medible F ⊆ E tal que µ( F ) = q.
(b) Existe un conjunto perfecto P ⊆ E con q < µ( P) < µ( E).
(c) Existen x, y ∈ E tales que | x − y| es irracional.
Prueba. ( a) Defina la función ϕ : [0, +∞) → [0, +∞) por
ϕ( x) = µ E ∩ [− x, x] para todo x ∈ [0, +∞).
Se verifica fácilmente que:
(i) ϕ(0) = 0, y
(ii) ϕ es creciente y continua.
Puesto que E es acotado, existe un x0 ∈ (0, +∞) tal que E ⊆ [− x0 , x0 ] y, en consecuencia,
ϕ( x0 ) = µ E ∩ [− x0 , x0 ] = µ( E).
Puesto que q ∈ (0, µ( E)), el Teorema del Valor Intermedio para funciones continuas garantiza la
existencia de un xq ∈ (0, x0 ) tal que ϕ( xq ) = q. Si ahora definimos F = E ∩ [− xq , xq ], vemos
que F es un subconjunto medible de E verificando
µ( F ) = µ E ∩ [− xq , xq ] = ϕ( xq ) = q.
Esto finaliza la prueba de ( a)
Para demostrar (b) seleccione, haciendo uso de la parte ( a), un conjunto medible B ⊆ E tal
que µ( B) = (q + µ( E))/2. Por otro lado, como B es medible, se sigue del Teorema 6.3.55 que
existe un conjunto cerrado F ⊆ B tal que µ( B \ F ) < µ( B) − q y, por lo tanto,
µ( B) − µ( F ) = µ( B \ F ) < µ( B) − q.
Sec. 6.5 Conjuntos no-medibles
309
De aquí se obtiene que µ( F ) > q. Finalmente, gracias al Teorema de Cantor-Bendixson, página 130, existen un conjunto perfecto P y conjunto a lo más numerable N tal que F = P ∪ N y
como µ( F ) = µ( P) + µ( N ) = µ( P), resulta que 0 < µ( P) < µ( E) lo que finaliza la prueba de
( b ).
Para ver (c), sea P el conjunto perfecto obtenido en (b) y fijemos un x ∈ E. Por el Teorema
de Categoría de Baire sabemos que P posee la cardinalidad del continuo y, en consecuencia, es
no-numerable. Por lo tanto, el conjunto A x = {| x − y| : y ∈ P} es no-numerable, de donde se
sigue que | x − y| es irracional para algún y ∈ P.
Suponga, por ejemplo, que E = [0, 1]. El Teorema 6.4.8 parte ( a) nos muestra que el rango
de µ es el intervalo [0, 1], es decir,
µ Mµ ([0, 1]) = µ( E) : E ∈ Mµ ([0, 1]) = [0, 1].
Este resultado es la versión unidimensional de un famoso teorema conocido con el nombre de
Teorema de Convexidad de Lyapunov.
Ya habíamos visto que, en presencia de la Hipótesis del Continuo, cualquier subconjunto E
de R con medida exterior positiva posee la cardinalidad del continuo y nos habíamos formulado
la pregunta de si la conclusión era la misma en ausencia de esa hipótesis. La respuesta es que no
se requiere la Hipótesis del Continuo para obtener dicha conclusión.
Corolario 6.4.9. Sea E ∈ Mµ (R ) con µ( E) > 0. Entonces card( E) = c.
Prueba. Por la parte (b) del resultado anterior sabemos que E contiene un conjunto perfecto P de
medida positiva y como todo conjunto perfecto posee la cardinalidad del continuo (consecuencia
del Teorema de Categoría de Baire), resulta que card( E) = c.
Otra manera de verificar esto es invocar el Teorema de Steinhaus para obtener un intervalo
abierto, digamos J = (−δ, δ), tal que J ⊆ E − E. De allí que:
c = card( J ) ≤ card( E − E) = card( E) · card( E) ≤ card(R ) · card(R ) = c · c = c.
Es nos dice que card( E) · card( E) = c, de donde se deduce que card( E) = c. La prueba es
completa.
6.5. Conjuntos no-medibles
La medida exterior de Lebesgue µ∗ restringida a la σ-álgebra Mµ (R ) es la que hemos denominado la medida de Lebesgue sobre R. Lebesgue no sabía si su medida resolvía El Problema de
la Medida formulado por él que enunciamos a comienzo de este capítulo, es decir, él no sabía
si cualquier conjunto acotado de R era medible según Lebesgue. En 1905, G. Vitali demostró,
usando el Axioma de Elección, que El Problema de la Medida de Lebesgue no tenía solución al
construir un subconjunto acotado V de R que no pertenecía a la clase Mµ (R ).
Esta sección trata sobre varias construcciones diferentes de conjuntos no-medibles según Lebesgue. Todas esas ellas se sustentan sobre la base del Axioma de Elección o, en su defecto, de alguna
de sus formas equivalentes tales como el Lema de Zorn, o el Principio del Buen-Orden, y otras
sobre la Hipótesis del Continuo. Una vez demostrada la existencia de conjuntos no-medibles, se
abrió una especie de Caja de Pandora de tales “monstruos”. De hecho, en todo conjunto con medida
310
Cap. 6 La Medida de Lebesgue en R
exterior positiva siempre habita un tal monstruo lo que permite concluir que la cantidad de conjuntos
no-medibles es tan numerosa como la de los conjuntos medibles, de hecho, existen 2c de tales
monstruos. No obstante, Sierpiński afirma que la diversidad de los conjuntos no-medibles es infinitamente más grande que la de los conjuntos medibles. Intentar obtener extensiones de µ a todo P (R )
ha generado algunos de los problemas más interesantes en la Teoría Moderna de Conjuntos: la
existencia de los grandes cardinales.
6.5.1. Conjunto de Vitali
Aunque el Axioma de Elección es el responsable de muchos resultados hermosos, elegantes
y poderosos, él es igualmente responsable de la construcción de una variedad de hechos de apariencia contradictorios y de unas cuantas monstruosidades. Una de tales monstruosidades es el
irrenunciable conjunto no-medible de Vitali. La primera persona en exhibir un conjunto realmente extraño y que destruía las aspiraciones de algunos matemáticos de la época de construir una
“medida” que midiera a todos y cada uno de los subconjuntos de R y que preservase, además,
la noción de longitud de un intervalo, fue la del matemático italiano Giuseppe Vitali (1875-1932).
En efecto, en el año 1905, Vitali publicó un artículo titulado “Sul problema della misura dei gruppi
di punti di una retta” [134] donde, haciendo uso del poderoso, pero polémico Axioma de Elección,
construía un conjunto que no era medible en el sentido de Lebesgue. Algunos años después, y
sin conocimiento previo del trabajo de Vitali, tanto Edward Burr Van Vleck (1863-1943) [136], así
como Paul Lévy (1886-1971) [94] construían cada uno de ellos, pero separadamente, conjuntos
con la misma propiedad de ser no-medibles según Lebesgue. Esos ejemplos dieron origen a la
construcción de innumerables conjuntos no-medibles con propiedades monstruosamente excepcionales. Sobre tales “monstruosidades” solo mencionaremos algunas de ellas al final de esta
sección. ¿Por qué decimos que el conjunto de Vitali es realmente extraño? Pues bien, supongamos que V es el conjunto no-medible construido por Vitali. Como se demostrará un poco más
adelante, resulta que dicho conjunto satisface las dos propiedades siguientes:
( aa) µ∗ (V ) > 0, y
(bb) µ([0, 1]) = µ∗ ([0, 1] \ V ).
Como ya hemos visto, la primera condición es obvia pues sabemos, Teorema 6.3.2, que si µ∗ (V ) =
0, entonces V es un conjunto medible según Lebesgue, lo cual conduce a un contrasentido. En
particular, V es no-numerable. La segunda condición es, por supuesto, la que produce lo que
hemos llamado un “conjunto extraño”. En primer lugar, V es un conjunto que posee “masa” pues
su medida exterior es positiva; sin embargo, la condición (bb) nos revela un hecho realmente
paradójico y, por lo tanto, sorprendente: el conjunto V viola la ley de la conservación de la masa,
pues al sustraer de [0, 1] un conjunto que contiene “masa”, en este caso µ∗ (V ) > 0, el conjunto
resultante [0, 1] \ V sigue teniendo “la misma masa” que [0, 1].
Giuseppe Vitali se graduó en la Scuola Normale Superiore de Pisa en 1899. Trabajó dos
años con Ulisse Dini antes de entrar a la política como representante del Partido Socialista en
el Ayuntamiento de Génova. Con la llegada al poder de los fascistas en 1922 y la disolución
del Partido Socialista, regresa a las Matemáticas. En 1926 sufrió un derrame cerebral dejando la
mitad de su cuerpo paralizado, lo cual no le impidió seguir haciendo importantes contribuciones
al Análisis hasta su muerte ocurrida en 1932 de un ataque al corazón.
El siguiente resultado, producto de la mente brillante de G. Vitali, establece la existencia de un
conjunto no-medible en el intervalo [0, 1] fabricado usando el imprescindible Axioma de Elección.
Sec. 6.5 Conjuntos no-medibles
311
Teorema 6.5.1 (Vitali). En el intervalo [0, 1] existe un subconjunto no vacío V que no es medible
según Lebesgue.
Prueba. Nuestro primer paso es construir una partición muy especial de [0, 1] a partir de la
siguiente relación de equivalencia: dados dos números cualesquiera x, y ∈ [0, 1], escribiremos
x ∼ y
si, y sólo si,
y − x ∈ Q.
Es fácil establecer que ∼ es una relación de equivalencia sobre [0, 1]. Consideremos ahora la
familia A = {[ x] : x ∈ [0, 1]} formada por todas las clases de equivalencias determinadas por la
relación ∼, esto es,
[ x] =
y ∈ [0, 1] : y ∼ x
=
y ∈ [0, 1] : x − y ∈ Q
para cada x ∈ [0, 1]. Por ejemplo, escribiendo Q [0,1] = Q ∩ [0, 1], tenemos
[ 0] =
y ∈ [0, 1] : 0 − y ∈ Q
= Q [0,1]
y ∈ [0, 1] : 1/2 − y ∈ Q
=
1
+ Q [0,1]
2
√
√
1
[ 2/2] = y ∈ [0, 1] : 1/ 2 − y ∈ Q = √ + Q [0,1]
2
π
[π/4] = y ∈ [0, 1] : π/4 − y ∈ Q =
+ Q [0,1] ,
4
[1/2] =
y así sucesivamente. Observe que
( a) Cada clase de equivalencia [ x] es numerable.
(b) Si x es racional, entonces cada miembro de [ x] es un número racional.
(c) Si x es irracional, entonces cada miembro de [ x] es un número irracional.
(d) Puesto que x ∈ [ x] para cada x ∈ [0, 1], resulta que
[0, 1] =
[
[ x ],
x ∈[0,1]
(e) Para cualquier par de elementos distintos x, y ∈ [0, 1], las clases [ x] y [y] en A o son iguales,
o son disjuntas. En efecto, sean x, y ∈ [0, 1] con x 6= y. Entonces debe ocurrir que: x ∼ y, o
bien x 6∼ y.
(e1 ) Si x ∼ y, resulta entonces que x − y ∈ Q. Veamos que esto conduce a la igualdad
[ x] = [y]. En efecto, sea a ∈ [ x] y seleccione un ra ∈ Q tal que x − a = ra . Como
x − y ∈ Q, existe r ∈ Q tal que x = y + r, de donde se sigue que
a = x − r a = ( y + r ) − r a = y + (r − r a ) ∈ A y .
Esto es, [ x] ⊆ [y]. De modo enteramente similar se prueba que [y] ⊆ [ x].
312
Cap. 6 La Medida de Lebesgue en R
(e2 ) Si x 6∼ y, entonces x − y 6∈ Q. La conclusión, en este caso, es que [ x] ∩ [y] = ∅.
Suponga, por un momento, que [ x] ∩ [y] 6= ∅ y seleccione un a ∈ [ x] ∩ [y]. Sean rx y
ry números racionales tales que
x − a = rx
y
y − a = ry .
Entonces x − y = ry − rx ∈ Q, lo que contradice el hecho de que x − y 6∈ Q. Por esto,
[ x ] ∩ [ y ] = ∅.
Observe que la colección A = {[ x] : x ∈ [0, 1]} es no-numerable y constituye una partición
del intervalo [0, 1] gracias a las condiciones (d) y (e). En particular, card(A) = c.
Usemos ahora el Axioma de Elección para construir un nuevo conjunto, llamémoslo V, eligiendo de cada clase de equivalencia [ x] uno, y sólo un punto. Cualquier conjunto V construido
de este modo se le denomina un conjunto de Vitali. Observe que,
v ∈ V si, y sólo si, existe un único x ∈ [0, 1] tal que V ∩ [ x] = {v}.
Más aun, V es un subconjunto no-numerable de [0, 1]. Para finalizar la demostración del teorema
sólo resta probar que el conjunto V no puede ser medible según Lebesgue.
( f ) V no es medible según Lebesgue.
Primera Prueba. Sea D = {rn : n = 0, 1, . . . } una enumeración de los racionales en [−1, 1]
sin duplicaciones, con r0 = 0. Para cada n ∈ N0 , definamos
Vn = rn + V
La sucesión (Vn )∞
n =0 posee las siguientes dos propiedades:
( f1 ) (Vn )∞
n =0 es una colección disjunta.
Afirmamos que Vn ∩ Vm = ∅ si rn 6= rm . Suponga, para generar una contradicción, que
Vn ∩ Vm 6= ∅ y sea x ∈ Vn ∩ Vm . Entonces existen x′ , x′′ ∈ V tales que
x = rn + x′ = rm + x′′ .
De esto se sigue que x′ − x′′ = rm − rn ∈ Q y así, gracias a (e1 ), tenemos que [ x′ ] = [ x′′ ],
es decir, x′ y x′′ pertenecen a una misma clase de equivalencia y, entonces, como V fue
construido eligiendo un único punto en cada clase de equivalencia, resulta que x′ = x′′ .
De esto se deduce que rn = rm , lo cual es imposible. Esta contradicción establece que
Vn ∩ Vm = ∅.
S
( f2 ) [0, 1] ⊆ ∞
n =0 Vn ⊆ [−1, 2].
S
Para demostrar estas inclusiones, sea a ∈ [0, 1] = x ∈[0,1] [ x]. Entonces existe un único
x0 ∈ [0, 1] tal que a ∈ [ x0 ]. Sea v el único elemento de [ x0 ] que pertenece a V. Entonces,
S
a ∼ v; es decir, a − v = rn0 para algún racional rn0 . Esto nos dice que a ∈ Vn0 ⊆ ∞
n =0 Vn .
La otra inclusión es inmediata.
Para verificar que V no es medible según Lebesgue, vamos a usar el hecho de µ es numerablemente aditiva e invariante por traslación. Suponga, por un momento, que V es medible según
Lebesgue. La invariancia por traslación de µ, Teorema 6.3.44, nos revela que cada Vn es medible
y que µ(Vn ) = µ(V ) para todo n ∈ N0 . Existen sólo dos posibilidades para V: o bien µ(V ) = 0,
o bien, µ(V ) > 0:
Sec. 6.5 Conjuntos no-medibles
313
( g1 ) Suponga que µ(V ) = 0. Como µ es numerablemente aditiva, con la primera inclusión en
( f2 ) se origina la siguiente contradicción:
[
∞
∞
∞
X
X
Vn =
µ(Vn ) =
µ(V ) = 0.
1 = µ [0, 1] ≤ µ
n =0
n =0
n =0
( g2 ) Si ahora suponemos que µ(V ) > 0, entonces la segunda inclusión en ( f2 ) nos conduce a
esta otra contradicción:
[
∞
∞
∞
X
X
3 ≥ µ
Vn =
µ(Vn ) =
µ(V ) = + ∞.
n =0
n =0
n =0
Con las contradicciones obtenidas en ( g1 ) y ( g2 ) queda demostrado que V no puede ser medible
según Lebesgue y termina la prueba.
Segunda Prueba. Suponga que V es medible y, como antes, sea D = {rn : n = 0, 1, . . . } una
enumeración de los racionales en [−1, 1] sin duplicaciones con r0 = 0. Puesto que
[0, 1] =
[
x ∈ [0,1]
[ x] ⊆
∞
[
(r n + V ) ,
n =0
∗
∗
entonces la subaditividad
P∞ de∗ µ más el hecho de µ ∗ también es invariante por traslación, revelan
∗
que 1 = µ ([0, 1]) ≤ n=0 µ (V ) y, por lo tanto, µ (V ) > 0. Se sigue del Teorema de Steinhaus,
Teorema 6.3.54, que V − V contiene un intervalo abierto J = (−δ, δ) para algún δ > 0 tal que
( x + V ) ∩ V 6= ∅ para todo x ∈ (−δ, δ). Sin embargo, si x es un racional distinto de cero,
entonces se sigue de (e2 ) que ( x + V ) ∩ V = ∅. Esta contradicción establece el resultado.
Una vez establecido que V es un conjunto no-medible, del Teorema 6.3.44 resulta que cada
uno de los conjuntos Vn definidos anteriormente también es no-medible. Más aun, [0, 1] \ V es no-medible
lo que conduce a otra sorpresa: [0, 1] se puede expresar como la unión de dos conjuntos disjuntos nomedibles: [0, 1] = V ∪ ([0, 1] \ V ). Otras consecuencias interesantes que se obtienen del conjunto
V de Vitali son las siguientes.
(h1 ) µ∗ (V ) > 0 pues, suponer que µ∗ (V ) = 0, conlleva a que V sería medible lo que resulta ser
imposible.
(h2 ) µ∗ (V ) = 0.
Prueba. Sea K ⊆ V con K compacto. Veamos que µ(K ) = 0. En efecto, como K ⊆ V,
resulta que rn + K ⊆ rn + V = Vn para todo n ∈ N0 y, en consecuencia, por ser (Vn )∞
n =0
una sucesión disjunta también lo es la sucesión de conjuntos medibles (rn + K )∞
n =0 . Por
otro lado, teniendo en cuenta que D = {rn : n = 0, 1, . . . } y K son conjuntos medibles y
acotados, entonces D + K es medible y acotado y, por lo tanto, µ( D + K ) < + ∞. Usando
ahora el hecho de que µ es numerablemente aditiva e invariante por traslación, tenemos que
[
∞
+ ∞ > µ( D + K ) = µ
(r n + K )
=
∞
X
n =0
µ rn + K
=
n =0
∞
X
n =0
µ K ).
314
Cap. 6 La Medida de Lebesgue en R
De esto último se concluye que µ(K ) = 0 y como K era un subconjunto compacto arbitrario
incluido en V, resulta que
µ∗ (V ) = sup µ(K ) : K ⊆ V, K compacto = 0.
(h3 ) Si E y F son conjuntos medibles de [0, 1] tales que E ⊆ V ⊆ F, entonces µ( E) = 0 y µ( F ) = 1.
Prueba. Suponga que E ⊆ V es medible. Por el Lema 6.3.64 y el Teorema 6.3.65 se tiene que
0 ≤ µ( E) = µ∗ ( E) = µ∗ ( E) ≤ µ∗ (V ) = 0.
Para demostrar que µ( F ) = 1, observe que F c ⊆ V c ⊆ Ec . Como V c es no-medible, se sigue
de la primera parte que µ( F c ) = 0 y, por consiguiente, 1 = µ([0, 1]) = µ( F ) + µ( F c ) = µ( F ).
(h4 ) µ([0, 1]) = µ∗ ([0, 1] \ V ).
Prueba. Por el Teorema 6.3.67 sabemos que
µ([0, 1]) = µ∗ (V ) + µ∗ ([0, 1] \ V )
y como µ∗ (V ) = 0 el resultado sigue.
(h5 ) µ∗ no es numerablemente aditiva, ni aun finitamente aditiva.
Prueba. La sucesión de conjuntos no medibles (Vn )∞
n =0 satisface
µ
∗
[
∞
n =0
Vn
<
∞
X
µ∗ (Vn ).
n =0
En efecto, puesto que µ∗ (Vn ) = µ∗ (V ) > 0, si µ∗ fuese numerablemente aditiva obtendríamos la siguiente contradicción:
3 ≥ µ
∗
[
∞
n =0
Vn
=
∞
X
∗
µ (Vn ) =
n =0
∞
X
µ∗ (V ) = + ∞.
n =0
Por otro lado, como [0, 1] = V ∪ [0, 1] \ V y µ∗ (V ) > 0, resulta de (h3 ) que
1 = µ([0, 1]) = µ∗ ([0, 1] \ V ) < µ∗ ([0, 1] \ V ) + µ∗ (V ).
lo cual prueba que µ∗ tampoco es finitamente aditiva.
(h6 ) int(V ) = ∅. En efecto, si int(V ) 6= ∅, entonces V contendría un intervalo abierto, digamos
I, y se seguiría de (h3 ) que µ( I ) = 0 lo que es imposible. En particular, V no es de primera
categoría. Es consecuencia inmediata del Teorema de Categoría de Baire ya que la sucesión
(r n + V ) ∞
n =1 cubre a [0, 1] y cada uno de ellos tiene interior vacío.
La condición (h3 ) es realmente curiosa: cualquier subconjunto medible incluido en V posee medida
cero. Como veremos un poco más abajo, el conjunto de Bernstein y muchos otros conjuntos nomedibles, poseen esa condición. En general, el siguiente resultado nos da información de cómo
se obtienen conjuntos no-medibles.
Sec. 6.5 Conjuntos no-medibles
315
Teorema 6.5.2. Sea M ⊆ [0, 1] tal que:
( a) µ( N ) = 0 para cualquier conjunto medible N ⊆ M y
(b) µ( E) = 1 para cualquier conjunto medible E ⊇ M.
Entonces M no es medible según Lebesgue.
Prueba. Suponga, para generar una contradicción, que M es medible. Tomando N = M y
E = M, se tiene que N ⊆ M ⊆ E y entonces, por ( a), µ( M ) = µ( N ) = 0, mientras que (b)
nos dice que µ( M ) = µ( E) = 1 lo que es, evidentemente, una contradicción. Por esto, M no es
medible según Lebesgue.
Al comienzo de este capítulo habíamos formulado el Problema de la Medida de Lebesgue y
adelantamos la opinión de que la medida de Lebesgue no podía asignar a cada subconjunto de
R un número real extendido. Pues bien, con la prueba de la existencia de conjuntos no-medibles
establecida anteriormente, el cual es posible bajo el imperio del Axioma de Elección, tenemos
ahora la certeza de que
Mµ ( R ) $ P ( R ) ,
de donde resulta que la condición (α1 ) en el Problema de la Medida de Lebesgue no se cumple para la
medida de Lebesgue y, en consecuencia, dicho problema no admite solución.
En lo sucesivo escribiremos
¬ Mµ ( R ) = P ( R ) \ Mµ ( R )
para designar a la familia de todos los subconjuntos de R que son no-medibles según Lebesgue.
Ya hemos visto que los conjuntos no-medibles no pueden vivir dentro de conjuntos cuya
medida exterior es nula; en particular, todo conjunto no-medible es no-numerable. Este hecho
demuestra que:
La noción de medida exterior de Lebesgue más el Axioma de Elección sirven, además del Método
de la Diagonal de Cantor y los números ordinales, como instrumentos para obtener conjuntos nonumerables.
¿Podemos encontrar conjuntos no-medibles en cualquier conjunto cuya medida exterior es positiva? El siguiente resultado, dado a conocer por Hans Rademacher (1892-1969) y que también
descansa sobre el Axioma de Elección, establece que la respuesta es siempre afirmativa.
Teorema 6.5.3 (Rademacher). Sea A ⊆ R con µ∗ ( A) > 0. Entonces existe un conjunto no vacío
V ⊆ A tal que V 6∈ Mµ (R ).
Prueba. Sin perder
que A ⊆ [0, 1]. En efecto,
S generalidad en el razonamiento, asumiremos
S
puesto que R = n∈Z [n, n + 1], resulta que A = A ∩ R = n∈Z A ∩ [n, n + 1] y, entonces
0 < µ∗ ( A) ≤
X
n ∈Z
µ∗ A ∩ [n, n + 1] .
De aquí se sigue la existencia de al menos un n0 ∈ Z tal que
µ∗ A ∩ [n0 , n0 + 1] > 0.
316
Cap. 6 La Medida de Lebesgue en R
Sea B0 = A ∩ [n0 , n0 + 1] y observe que el conjunto A0 = −n0 + B ⊆ [0, 1] satisface µ∗ ( A0 ) > 0.
Por consiguiente, si logramos demostrar que A0 contiene un conjunto no-medible, entonces B
también contendría un conjunto no-medible y, en consecuencia, A tendría la misma propiedad.
Supongamos entonces que A ⊆ [0, 1] y sea V el conjunto no-medible de Vitali obtenido
anteriormente. Como antes, sea (rn )∞
n =1 una enumeración de los racionales, sin repetición, en
[−1, 1] y sea Vn = rn + V para todo n ∈ N.
Suponga ahora, para fabricar una contradicción, que cualquier subconjunto de A es medible.
Observe que, para cada n ∈ N, el conjunto Vn ∩ A, siendo un subconjunto de A es, por nuestra
suposición, medible y, por supuesto, también está incluido en Vn . Afirmamos que:
µ Vn ∩ A = 0
para todo n ∈ N.
( 1)
En efecto, si para algún n ∈ N, ocurre que µ Vn ∩ A > 0, entonces usando el hecho de que µ∗
es monótona y que µ∗ (Vn ) = µ∗ (V ) = 0 tendremos, por el Teorema 6.3.65, página 301, que
0 < µ Vn ∩ A = µ∗ Vn ∩ A ≤ µ∗ (Vn ) = 0
S
lo cual esSimposible. Esto prueba nuestra afirmación. Finalmente, como [0, 1] ⊆ ∞
n =1 Vn , enton∞
ces A ⊆ n=1 (Vn ∩ A) de donde se sigue, usando (1), que
∗
0 < µ A
≤
∞
X
n =1
µ∗ Vn ∩ A
= 0,
lo que origina, una vez más, una contradicción. Por consiguiente, la suposición de que cualquier
subconjunto de A es medible conduce a una contradicción y, en consecuencia, nuestro conjunto
A debe contener algún conjunto no-medible.
Varias consecuencia se pueden derivar del resultado anterior. Comencemos con la primera:
Corolario 6.5.4. Para cada ε > 0, existe un conjunto no-medible V tal que
0 < µ∗ (V ) < ε.
Prueba. Como µ([0, ε/2]) = ε/2 > 0, el Teorema de Rademacher termina la prueba.
El siguiente corolario confirma, una vez más, que µ∗ no es finitamente aditiva.
Corolario 6.5.5. Sea E ∈ Mµ (R ) con µ( E) > 0. Entonces para cualquier conjunto no-medible
V ⊆ E se tiene que
µ ∗ ( E ) < µ ∗ (V ) + µ ∗ ( E \ V ).
Prueba. Sin perder generalidad, asumiremos que E es acotado. Sea V un subconjunto nomedible incluido en E (el cual existe por el Teorema de Rademacher). Si ocurriese que
µ ∗ ( E ) = µ ∗ (V ) + µ ∗ ( E \ V ) ,
entonces el Teorema 6.3.60, página 296, nos diría que V es medible. Esta contradicción combinado con la subaditividad de µ∗ finaliza la prueba.
Ya vimos en (h4 ) que el complemento V c del conjunto no-medible de Vitali, el cual también
es no-medible, satisface la igualdad µ∗ (V c ) = µ([0, 1]). En el siguiente resultado se prueba que
esa es la regla y no la excepción.
Sec. 6.5 Conjuntos no-medibles
317
Teorema 6.5.6. Sea E ∈ Mµ (R ) con µ( E) > 0. Entonces existe un conjunto no-medible A ⊆ E tal
que
µ ∗ ( A ) = µ ( E ).
Prueba. En primer lugar, vamos a demostrar la existencia de un conjunto no-medible A ⊆ E, tal
que
1
µ ∗ ( A ) ≥ µ ( E ).
( 1)
2
En efecto, seleccione, usando el Teorema de Rademacher, un conjunto no-medible V0 ⊆ E.
( a) Si 0 < µ( E) < +∞, entonces por el Corolario 6.5.5 se tiene que
µ( E) < µ∗ (V0 ) + µ∗ ( E \ V0 ),
de donde se sigue que
µ∗ (V0 ) >
1
µ( E)
2
µ∗ ( E \ V0 ) >
o
1
µ ( E ).
2
( 2)
También, como E \ V0 es no-medible, resulta que tomando A = V0 o A = E \ V0 , según se
cumpla (2), el resultado (1) sigue.
(b) Si µ( E) = +∞, entonces, usando
S el hecho de que µ es σ-finita, elija una sucesión disjunta
∞
En n=1 en Mµ (R ) tal que E = ∞
n =1 En y µ ( En ) < + ∞ para todo n ≥ 1 (por supuesto,
podemos suponer que 0 < µ( En ) < +∞ para todo n ≥ 1). Por cada n ∈ N seleccione,
invocando
la parte ( a), un conjunto no-medible An ⊆ En tal que µ∗ ( An ) > 21 µ( En ). Sea A =
S∞
n =1 A n . Por el Teorema 6.3.61, página 297, se tiene que
A 6 ∈ Mµ ( R )
y
µ∗ ( A) =
∞
X
n =1
∞
µ∗ ( An ) ≥
1X ∗
1
µ ( A n ) = µ ( E ).
2
2
n =1
Esto finaliza la demostración de la desigualdad (1).
Pongamos ahora r0 = µ( E) y B0 = ∅. Usemos la primera parte para elegir un conjunto
no-medible A1 ⊆ E tal que µ∗ ( A1 ) ≥ 21 µ( E) = r20 . También, por el Corolario 6.2.13, página 249,
existe B1 ∈ Mµ (R ) tal que
A1 ⊆ B1 ⊆ E \ B0
y
µ( B1 ) = µ∗ ( A1 ).
Sea r1 = µ( E \ B1 ). Claramente, 0 ≤ r1 ≤ r0 /2. Si r1 = 0 nos detenemos ya que, en este caso,
µ∗ ( A1 ) = µ( E). Suponga entonces que r1 > 0. Con un argumento similar al anterior, podemos
seleccionar dos conjuntos A2 y B2 tales que
A 2 6 ∈ Mµ ( R ) ,
B2 ∈ Mµ (R ),
y
A2 ⊆ B2 ⊆ E \ ( B0 ∪ B1 )
µ( B2 ) = µ∗ ( A2 ).
Defina r2 = µ( E \ ( B0 ∪ B1 )). Entonces 0 ≤ r2 ≤ r1 /2 ≤ r0 /22 . Suponga que ( Ai )ni=1 , ( Bi )ni=0 y
(ri )ni=0 han sido construidos de modo tal que, para cada i ∈ {1, 2, . . . , n},
A i 6 ∈ Mµ ( R ) ,
Bi ∈ M µ ( R ) ,
A i ⊆ Bi ⊆ E \
n[
−1
i=0
Bi ,
µ ( Bi ) = µ ∗ ( A i )
318
Cap. 6 La Medida de Lebesgue en R
y
n[
−1 ri = µ E \
Bi ≤ r0 /2i .
i=0
Claramente la familia deS
conjuntos medibles { B0 , B1 , . . . , Bn } es disjunta y entonces, por el Teorema 6.3.61 se tiene que ni=1 Ai 6∈ Mµ (R ) y
µ
∗
[
n
Ai
i=1
=
n
X
µ∗ ( Ai ) =
i=1
= µ
n
X
µ ( Bi )
i=1
[
n
Bi
i=1
= µ( E ) − rn .
S
Si rn = 0 paramos la construcción ya que el conjunto A = ni=1 Ai satisface, gracias a la igualdad
anterior, la conclusión del teorema. Si rn > 0, entonces procediendo como antes seleccione
conjuntos An+1 6∈ Mµ (R ) y Bn+1 ∈ Mµ (R ) tales que
A n + 1 ⊆ Bn + 1 ⊆ E \
[
n
Bi ,
i=0
µ ( Bn + 1 ) = µ ∗ ( A n + 1 ) .
∞
S
Defina rn+1 = µ( E \ ni=0 Bi ). Si el proceso no termina, se obtienen las tres sucesiones An n=1 ,
∞
S∞
Bn n = 1 y ( r n ) ∞
n =1 A n . Por el Teorema 6.3.61 se tiene que A 6 ∈ Mµ (R ) y
n =1 . Sea A =
∗
µ ( A) =
∞
X
∗
µ ( An ) =
n =1
∞
X
µ ( Bn ) = µ
n =1
[
∞
n =1
Bn .
De esto se sigue que, para todo n ≥ 1,
∗
µ( E) ≥ µ ( A) ≥ µ
[
n
i=1
Bi
= µ( E) − rn ≥ µ( E)(1 − 1/2n )
y, en consecuencia, tomando límite cuando n → ∞, se obtiene que µ∗ ( A) = µ( E).
Otra consecuencia del Teorema de Rademacher es que en cualquier conjunto tipo-Cantor de
medida positiva habita un conjunto no-medible y, por consiguiente:
Corolario 6.5.7. Existen conjuntos cerrados, nunca-densos de medida positiva conteniendo conjuntos no-medibles.
6.5.2. Conjunto no-medible de un Grupo Aditivo
En el construcción del conjunto de Vitali usamos el hecho de que Q es un subgrupo aditivo
de R. En esta parte vamos a construir un conjunto no-medible A en un cierto subgrupo aditivo
Sec. 6.5 Conjuntos no-medibles
319
de R tal que cualquier conjunto medible E incluido en A o en Ac posee medida cero. Fijemos
un número irracional ξ y considere los conjuntos
r + nξ : r ∈ Q, n ∈ Z = Q + ξZ
G2 = r + 2nξ : r ∈ Q, n ∈ Z
G3 = r + (2n + 1)ξ : r ∈ Q, n ∈ Z
G1 =
Se comprueba fácilmente que G1 y G2 son subgrupos aditivos de R,
G2 ∩ G3 = ∅,
y
G3 = G2 + ξ
G1 = G2 ∪ G3 .
Defina la relación ∼ sobre R del modo siguiente: para todo x, y ∈ R,
x ∼ y
⇔
x − y ∈ G1 .
Se comprueba fácilmente que ∼ es una relación de equivalencia sobre R. Usemos ahora el
Axioma de Elección para formar un subconjunto A0 de R que contenga exactamente un punto
de cada una de las clases de equivalencias determinadas por ∼. Sea
A = A0 + G2 ,
es decir, A consiste de todos los puntos que tienen la forma a + g2 para algún a ∈ A0 y algún
g2 ∈ G2 . Veamos que A posee las propiedades requeridas.
( a) Cualquier subconjunto medible E de A es de medida cero. Para ver esto, suponga que existe
un conjunto medible E ⊆ A con µ( E) > 0. Se sigue del Teorema de Steinhaus que existe un
intervalo abierto, digamos J = (−ε, ε), tal que J ⊆ E − E ⊆ A − A. Puesto que G3 es denso
en R, resulta que G3 ∩ J 6= ∅; en particular, G3 ∩ (A − A) 6= ∅. Sin embargo, esto último es
imposible que ocurra. En efecto, cada elemento de A − A es de la forma a1 − a2 + g2 donde
a1 , a2 ∈ A0 y g2 ∈ G2 y, en consecuencia, no puede pertenecer a G3 (la relación a1 − a2 + g2 = g3
implicaría que a1 = a2 y g2 = g3 lo cual es imposible ya que G2 ∩ G3 = ∅). Esta contradicción
establece que µ( E) = 0.
(b) Cualquier subconjunto medible E de Ac es de medida cero. Para verificar esta afirmación, observe
que Ac = A0 + G3 , de allí que Ac = A + ξ. De esto último se sigue que cualquier subconjunto
medible de Ac es de la forma E + ξ para algún subconjunto medible E de A. Puesto que todos
los subconjuntos medibles de A son de medida cero y µ es invariante por traslación, resulta que
los subconjuntos medibles de Ac también son de medida cero.
(c) A no es medible según Lebesgue. En efecto, si A fuese medible, entonces también lo sería Ac
y R = A ∪ Ac . Sea E cualquier subconjunto medible de R con µ( E) > 0. Entonces E ∩ A es un
conjunto medible incluido en A y, por lo tanto, su medida es cero. Similarmente, µ( E ∩ Ac ) = 0.
Estos hechos producen la siguiente contradicción:
0 < µ( E) = µ( E ∩ A) + µ( E ∩ Ac ) = 0.
320
Cap. 6 La Medida de Lebesgue en R
6.5.3. Conjunto Saturado no-medible
En esta sección veremos cómo se construye, con un argumento muy similar al de la sección
anterior, un caso muy particular de un conjunto no-medible pero esta vez con propiedades relacionadas con la medida interior. En los ejercicios, al final de este capítulo, se proponen otras
formas de obtener tales conjuntos. En este sentido, también es apropiado echarle una miradita al
libro de M. Kuczma [82].
Definición 6.5.8. Un conjunto A ⊆ R se dice que es saturado no-medible si
µ∗ ( A) = µ∗ ( Ac ) = 0.
Nótese que si existe algún conjunto saturado no-medible A ⊆ R, entonces automáticamente él es nomedible según Lebesgue, lo cual justifica su nombre. En efecto, suponga A es medible. Entonces,
Ac también es medible y como R = A ∪ Ac , se sigue de la aditividad de µ y del Teorema 6.3.65
que
+ ∞ = µ (R ) = µ ( A ) + µ ( A c ) = µ ∗ ( A ) + µ ∗ ( A c ) = 0
lo que, por supuesto, es imposible.
Una consecuencia del Teorema 6.3.65 y del Teorema 6.3.68 es que la existencia de un conjunto
saturado no-medible da origen a una cantidad enorme de conjuntos no-medibles.
Corolario 6.5.9. Si A ⊆ R es un conjunto saturado no-medible, entonces
µ∗ ( A ∩ E) = 0
y
µ∗ ( A ∩ E) = µ( E)
para cualquier conjunto E ∈ Mµ (R ). En particular, A ∩ E es no-medible para cualquier conjunto
E ∈ Mµ (R ) con µ( E) > 0.
Prueba. Suponga que A es un conjunto saturado no-medible y sea E ∈ Mµ (R ). Puesto que
A ∩ E ⊆ A, entonces µ∗ ( A ∩ E) ≤ µ∗ ( A) = 0 y, por lo tanto, µ∗ ( A ∩ E) = 0. Por otro lado, como
µ∗ ( Ac ) = 0, entonces el Teorema 6.3.68 nos asegura que µ∗ ( A ∩ E) = µ( E).
Finalmente, sea E ∈ Mµ (R ) con µ( E) > 0. Si A ∩ E fuese medible, entonces el Teorema 6.3.65 y la primera parte no conduciría a la siguiente contradicción:
0 = µ∗ ( A ∩ E) = µ∗ ( A ∩ E) = µ( E) > 0.
Esto termina la prueba.
Teorema 6.5.10. En R existen conjuntos saturados no-medibles.
Prueba. Un conjunto no-medible tipo Vitali se puede obtener argumentando como la en la sección 6.5.2. Fijemos un número irracional ξ y considere el subgrupo aditivo de R,
Dξ = {m + nξ : m, n ∈ Z } = Z + ξZ.
Por el Teorema de Kronecker, Teorema 2.2.37, página 135, sabemos que Dξ es denso y, además,
numerable en R. Para cada x, y ∈ R escribamos:
x ∼ y
si, y sólo si,
x − y ∈ Dξ .
Sec. 6.5 Conjuntos no-medibles
321
Esta relación es, por supuesto, una relación de equivalencia, lo cual implica que la colección
([ x]) x∈R de todas las clases de equivalencias determinadas por ∼, constituye una partición de
R. Observe que [ x] = x + Dξ para cada x ∈ R. Usemos de nuevo el Axioma de Elección para
construir un conjunto V el cual contiene exactamente un punto de cada clase [ x], x ∈ R. Nótese
que si v1 , v2 ∈ V y ellos son distintos, resulta que tales números están en clases de equivalencias
diferentes, por lo que v1 − v2 6∈ Dξ . En otras palabras, si v1 , v2 ∈ V, entonces
significa que
v1 − v2 ∈ V
v1 = v2 .
(∗)
De esto se concluye que
( V − V ) ∩ D ξ = {0}.
( 1)
Para demostrar que V no es medible según Lebesgue, supondremos lo contrario para producir
una contradicción. Suponga entonces que V es medible. En este caso se tiene que µ(V ) = 0 o
µ(V ) > 0. Veamos que ambas situaciones conducen a una contradicción.
( a) Suponga que µ(V ) = 0. Nuestra primera tarea es verificar que
[
R =
( x + V ).
( 2)
x ∈ Dξ
S
En efecto, sea z ∈ R. Puesto que R = x ∈R [ x] y la colección {[ x] : x ∈ R } es disjunta, entonces
existe un único x ∈ R tal que z ∈ [ x] y, por lo tanto, z − y ∈ Dξ para cualquier y ∈ [ x]. Sea
v el único elemento de V que pertenece a [ x]. Entonces u = z − v ∈ Dξ , de donde se sigue
que z = u + v ∈ u + V y así, (2) se cumple. Ahora bien, como Dξ es numerable y µ es
numerablemente aditiva e invariante por traslación, resulta que
X
X
+ ∞ = µ (R ) =
µ ( x + Dξ ) =
µ( Dξ ) = 0.
x ∈ Dξ
x ∈ Dξ
Esta contradicción impide que µ(V ) = 0.
(b) Suponga que µ(V ) > 0. En este caso podemos hacer uso de la Teorema de Steinhaus,
Teorema 6.3.54, para obtener un intervalo abierto, digamos J = (−ε, ε) ⊆ V − V. Aquí viene
la contradicción: como Dξ es denso en R, resulta que J ∩ Dξ 6= ∅ y, de hecho, tal intersección
contiene infinitos puntos; sin embargo, por (1) sabemos que (V − V ) ∩ Dξ = {0} lo cual niega
lo anterior y, por lo tanto, tampoco puede ocurrir que µ(V ) > 0. La conclusión es simple: V no
puede ser medible.
Nos apoyaremos en el conjunto no-medible V que acabamos de obtener para construir nuestro conjunto saturado no-medible. Consideremos el conjunto
H = {2m + nξ : m, n ∈ Z }.
Sabemos que H es denso en R (véase la Observación 2.2.2 después del Teorema de Kronecker)
y, por consiguiente, H1 = H + 1 también lo es. Afirmamos que el conjunto
S = V+ H
es saturado no-medible. Para verificar esta afirmación, vamos a demostrar, en primer lugar, que
(S − S ) ∩ H1 = ∅. En efecto, sea x ∈ S − S y suponga que x ∈ H1 . Puesto que x ∈ S − S,
existen v1 , v2 ∈ V y h1 , h2 ∈ H tales que
x = ( v1 + h1 ) − ( v2 + h2 ) = ( v1 − v2 ) + ( h1 − h2 ) .
322
Cap. 6 La Medida de Lebesgue en R
Además, como H, H1 ⊆ Dξ y Dξ es un subgrupo, se tiene que h1 − h2 ∈ Dξ . Como hemos supuesto que x ∈ H1 , resulta que x − (h1 − h2 ) ∈ Dξ y, en consecuencia, v1 − v2 = x − (h1 − h2 ) ∈
Dξ . Se sigue de (∗) que v1 = v2 y así, x = h1 − h2 . Esto, por supuesto, origina la siguiente
contradicción: x ∈ H ∩ H1 = H ∩ ( H + 1) = ∅ ya que x = h1 − h2 ∈ H y x ∈ H1 = H + 1. Esta
incongruencia muestra que
(S − S ) ∩ H1 = ∅.
( 3)
Observe que como H1 es denso en R, la igualdad (3) nos indica que int(S − S ) = ∅ y, por
consiguiente, gracias a la Teorema de Steinhaus, se tiene que µ∗ (S ) = 0. Finalmente, como
µ∗ (S ) ≤ µ∗ (S ) se concluye que µ∗ (S ) = 0.
Veamos ahora que µ∗ (S c ) = 0. En efecto, como µ∗ (V ) > 0, podemos seleccionar un conjunto
medible E tal que V ⊆ E y µ( E) = µ∗ (V ). Usemos el Teorema de Densidad de Lebesgue,
Teorema 9.1.33, página 480, para hallar un conjunto medible N ⊆ E con µ( N ) = 0 tal que
µ E ∩ ( x − δ, x + δ)
= 1
( 4)
lı́m
δ →0
µ ( x − δ, x + δ)
para todo x ∈ E \ N. El hecho de que µ∗ (V ) > 0 impide que V ⊆ N de modo que
V ∩ ( E \ N ) 6= ∅. Fijemos un punto x0 ∈ V verificando (4) y sea 0 < c < 1. Entonces
existe un δ > 0 tal que
µ∗ (V ∩ ( x − δ/2, x + δ/2)) > c · µ(( x − δ/2, x + δ/2)) = c · δ.
De esto se sigue que si J es cualquier intervalo con centro en cualquier punto de x0 + Dξ y de
longitud menor que δ, entonces
µ ∗ (S ∩ J ) > c · µ ( J ).
Tomemos ahora cualquier intervalo abierto I ⊆ R. Puesto que x0 + Dξ es denso en R, resulta
que I ∩ ( x0 + Dξ ) 6= ∅ y, por consiguiente, la familia V de todos los intervalos Jx ⊆ I cuyos
centros son puntos de x0 + Dξ y poseen longitud menor que δ, constituyen un cubrimiento
de Vitali. Un llamado al Teorema del Cubrimiento de Vitali, Teorema 9.1.28, página 473, nos
garantiza la existencia de una sucesión disjunta de conjuntos en V, digamos ( Jn )∞
n =1 , tal que
∞
[
µ I\
Ji = 0.
i=1
i=1
Lo anterior permite obtener
∗
µ ( I ) ≥ µ (S ∩ I ) = µ
= µ
∗
∗
[
∞
∞
[
∗
S∩
Ji + µ S ∩ I \
Ji
i=1
n
∞
∞
[
X
X
∗
S∩
Ji =
µ (S ∩ Ji ) > c
µ( Ji ) = c µ( I ).
i=1
i=1
i=1
Haciendo que c → 1 se obtiene que
µ ( I ) = µ ∗ (S ∩ I )
para cualquier intervalo abierto I ⊆ R. Un llamado al Teorema 6.3.68 nos revela que µ∗ (S c ) = 0
y termina la prueba.
Sec. 6.5 Conjuntos no-medibles
323
6.5.4. Conjunto de Bernstein
En esta sección mostraremos la existencia de un conjunto no-medible B tal que cualquier conjunto
medible E incluido en B o en Bc , posee medida cero.
Recordemos, Teorema 1.3.49, página 78, que B ⊆ R es un conjunto de Bernstein si él, así como
su complemento, intersectan a cualquier subconjunto cerrado, no-numerable de R. Nuestro objetivo, en
esta sección, es demostrar que cualquier conjunto de Bernstein no es medible según Lebesgue.
En lo inmediato, también es necesario recordar que: si B es un conjunto de Bernstein, entonces
(B1 ) R \ B también lo es, y
(B2 ) si F ⊆ B es cerrado, entonces F es numerable.
Teorema 6.5.11 (Bernstein). Si E es un subconjunto medible de B, entonces µ( E) = 0. En particular, B 6∈ Mµ (R ).
Prueba. Sea E un subconjunto medible de B y fijemos un conjunto compacto arbitrario K ⊆ E.
Puesto que K es cerrado, sabemos por (B2 ) que K es numerable y, en consecuencia, µ(K ) = 0.
Se sigue del Corolario 6.3.66, página 302, que
µ( E) = sup µ(K ) : K ⊆ E, K compacto
= 0.
De modo enteramente similar se prueba que cualquier conjunto medible según Lebesgue incluido
en R \ B tiene medida cero. Finalmente, si B fuese medible, entonces también lo sería R \ B y
ambos conjuntos tendrían medida cero. Esto, por supuesto, generaría la siguiente contradicción:
+ ∞ = µ(R ) = µ(B) + µ(R \ B) = 0.
En conclusión, B no puede ser medible según Lebesgue.
Cuando estudiamos el conjunto no-medible según Vitali, vimos que todo conjunto medible
con medida positiva contiene un conjunto no-medible según Lebesgue. El resultado anterior
también permite obtener una respuesta inmediata a tal afirmación.
Corolario 6.5.12. Sea E un subconjunto medible de R con µ( E) > 0. Entonces E ∩ B y E ∩ Bc son
no-medibles según Lebesgue.
Prueba. Si ambos conjuntos fuesen medibles, entonces por el Teorema 6.5.11 tendríamos que
µ( E ∩ B) = 0 = µ( E ∩ Bc ), de donde se seguiría que µ( E) = µ( E ∩ B) + µ( E ∩ Bc ) = 0. Suponga
ahora que uno de ellos es medible, por ejemplo, que E ∩ B es medible. Entonces E \ ( E ∩ B) =
E ∩ Bc sería medible lo cual es imposible por la primera parte.
Por ejemplo, los conjuntos tipo-Cantor Γα que poseen medida positiva son conjuntos cerrados, no-numerables y, en consecuencia, intersectan a B. Por lo tanto, Γα ∩ B es no-medible
según Lebesgue. En el siguiente resultado se muestra la existencia de conjuntos no-medibles que
también son nunca-densos.
Corolario 6.5.13. Existe un conjunto no-medible y, por consiguiente, no-numerable que es nuncadenso con la propiedad adicional de que todo conjunto cerrado incluido en él es numerable.
324
Cap. 6 La Medida de Lebesgue en R
Prueba. Sea B un conjunto de Bernstein y sea Γα un conjunto tipo-Cantor con µ(Γα ) = α > 0.
Entonces W = B ∩ Γα es, por el corolario anterior, un conjunto no-medible, nunca-denso y, por
supuesto, cualquier subconjunto cerrado de él es numerable.
Si denotamos por Vµ (R ), (respectivamente, Bµ (R )) la subfamilia de ¬ Mµ (R ) conteniendo a
los conjuntos de Vitali (respectivamente, los conjuntos de Bernstein) se tiene, véase [77], Theorem
3, p. 22, que
V µ ( R ) ∩ B µ ( R ) 6 = ∅.
6.5.5. Conjunto de Sierpiński
Si en lugar de considerar conjuntos de primera categoría en la construcción del conjunto Lusin,
lo reemplazamos por conjuntos de medida de Lebesgue cero se obtiene, aceptando la Hipótesis del
Continuo, un nuevo tipo de conjunto al que se le denominará conjunto de Sierpiński. Como antes,
Nµ (R ) denotará la colección de todos los conjuntos nulos.
Teorema 6.5.14 (Sierpiński). Bajo la Hipótesis del Continuo, existe un conjunto S ⊆ R, llamado
conjunto de Sierpiński, tal que:
( a) S es no-numerable, y
(b) card(S ∩ N ) ≤ ℵ0 para cualquier conjunto N ∈ Nµ (R ).
Prueba. Denote por Nδ (R ) la colección de todos aquellos elementos de Nµ (R ) que son de tipo Gδ .
Puesto que { x} es un Gδ para cada x ∈ R, la Hipótesis del Continuo nos revela que
ℵ1 = 2ℵ0 = card({{ x} : x ∈ R }) ≤ card(Nδ (R )) ≤ card(Gδ ) = 2ℵ0 ,
y así, Nδ (R ) puede ser escrito en términos de una sucesión transfinita, es decir, en la forma
Nδ (R ) = { Nα : α < ω1 }. Sea x1 ∈ R tal que x1 6∈ N1 ∈ Nδ (R ). Fijemos un ξ < ω1 y
supongamos que la familia ( xα )α<ξ ha sido construida. Consideremos el conjunto
[
Xξ =
Nα ∪ xα : α < ξ
α<ξ
y observemos que como ξ es numerable y Mµ (R ) es una σ-álgebra, Xξ es un conjunto nulo, por
lo que R \ Xξ es no vacío. Si ahora elegimos un xξ ∈ R \ Xξ , entonces el Principio de Inducción
Transfinita da por finalizada la construcción de ( xξ )ξ <ω1 . Definamos ahora
S = xξ : ξ < ω1 .
Afirmamos que S posee las propiedades requeridas. En efecto:
( a) S es no numerable. Esto sigue del hecho de que la aplicación f : ω1 → S que asigna a cada
α ∈ ω1 el elemento f (α) = xα , es biyectiva.
(b) Sea N un conjunto nulo. Por el Corolario 6.2.13, página 249, existe un conjunto Gδ , llamémoslo N0 , tal que N ⊆ N0 y µ( N ) = µ( N0 ), es decir, N0 ∈ Nδ (R ). Puesto que Nδ (R )
consiste de la familia de todos los subconjuntos nulos que son Gδ , existe un α < ω1 tal que
N0 = Nα ∈ Nδ (R ). Por construcción, sabemos que
S ∩ N ⊆ S ∩ Nα ⊆ x β : β < α
y como éste último conjunto es numerable, tenemos que S ∩ N es a lo más numerable.
Sec. 6.5 Conjuntos no-medibles
Esto termina la prueba.
325
El hecho de que S no contiene subconjuntos medibles no-numerables de medida cero conduce a que dicho conjunto es no-medible.
Teorema 6.5.15. S no es medible según Lebesgue.
Prueba. Es suficiente demostrar que S no contiene subconjuntos medibles no-numerables. En
efecto, suponga, para generar una contradicción, que E es un subconjunto medible no-numerable
incluido en S. Puesto que S ∩ E = E es no-numerable, entonces la definición de S nos indica
que µ( E) > 0. Ahora bien, como µ es regular, Corolario 6.3.66,
µ( E) = sup µ(K ) : K ⊆ E, K compacto
y, por lo tanto, existe un conjunto compacto K ⊆ E tal que µ(K ) > 0. Por supuesto, como
K ⊆ S y µ(K ) > 0, dicho conjunto es no-numerable y, además, es un Gδ pues él es cerrado.
Gracias al Teorema 6.4.7 tenemos que K contiene un subconjunto no-numerable de medida cero,
lo cual contradice la definición de S. Esto termina la prueba de nuestra afirmación. Finalmente,
si S fuese medible según Lebesgue, entonces la inclusión S ⊆ S nos indica la existencia un
subconjunto medible no-numerable incluido en S lo cual es imposible por la primera parte. Nota Adicional 6.5.8 Observe que S es de primera categoría. En efecto, escriba a R como R =
A ∪ N donde A es de primera categoría y N es un conjunto de medida cero. Entonces
S = S ∩ R = (S ∩ A) ∪ (S ∩ N ). Puesto que S es un conjunto de Sierpiński y µ( N ) = 0,
resulta que S ∩ N es a lo más numerable, de modo que todos los elementos de N, salvo
una cantidad a lo más numerable, están contenidos en A el cual es de primera categoría y,
por lo tanto, S es de primera categoría.
Es claro que bajo la Hipótesis del Continuo, cualquier conjunto N de cardinalidad menor que c
es numerable y, en consecuencia, de medida cero y entonces, similar al caso de la existencia de
conjuntos de Lusin, se tiene que:
Teorema 6.5.16. La Hipótesis del Continuo es equivalente a la existencia de un conjunto de Sierpiński y a que cualquier conjunto de cardinalidad menor que c es de medida cero.
Otra manera de obtener conjuntos no-medibles según Lebesgue sin usar la Teoría ZFC + CH
es la siguiente:
Teorema 6.5.17 (Sierpiński). Sea X un subconjunto no-numerable de R. Las siguientes dos
condiciones son equivalentes dentro de la Teoría ZF + DC.
(1) X es un conjunto de Sierpiński.
(2) Cada subconjunto no-numerable de X es no-medible según Lebesgue.
En general, si aceptamos la Hipótesis del Continuo en el sistema ZF + DC, entonces existen
conjuntos no-medibles según Lebesgue. La demostración de éstos hechos se pueden ver,
por ejemplo, en [75].
Como antes, denote por Nµ (R ) la familia de todos los conjuntos nulos y por Apc (R ) todos
los subconjuntos de R que son de primera categoría. Una relación fenomenal y, por supuesto,
fundamental entre los conjuntos de primera categoría y los conjuntos nulos fue hallado por
P. Erdös y W. Sierpiński cuando demostraron que:
326
Cap. 6 La Medida de Lebesgue en R
Teorema 6.5.18 (Erdös-Sierpiński). Asumiendo la Hipótesis del Continuo, existe una función
biyectiva f : R → R con la siguiente propiedad: para todo A ⊆ R,
( a) f ( A) ∈ Nµ (R ) si, y sólo si A ∈ Apc (R ).
(b) f ( A) ∈ Apc (R ) si, y sólo si A ∈ Nµ (R ).
6.5.6. Ultrafiltros no-medibles
Usando la noción de ultrafiltro sobre un conjunto X, introducida por H. Cartan, es posible
construir otros tipos de conjuntos no-medibles en R. La existencia de tales objetos, los ultrafiltros,
se sustentan sobre el Lema de Zorn el cual, como sabemos, es equivalente al Axioma de Elección.
La noción de filtro, al igual que la noción de red, son generalizaciones del concepto de sucesión.
Como sabemos, las sucesiones son herramientas fundamentales para caracterizar, por ejemplo, en
espacios métricos, compacidad, funciones continuas y muchas otras propiedades. Cuando dicho
espacio no satisface el primer axioma de numerabilidad, hay que apelar a la noción de redes, o
en su defecto, la de filtro para caracterizar tales objetos.
Definición 6.5.19 (Cartan). Sea X un conjunto no vacío. Un filtro sobre X es una colección no vacía
F de subconjuntos de X que cumple con las siguientes propiedades:
( a) ∅ 6∈ F.
(b) Si A, B ∈ F, entonces A ∩ B ∈ F.
(c) Si A ∈ F y A ⊆ B ⊆ X, entonces B ∈ F.
Observe que si F es un filtro sobre X, entonces la condición (c) garantiza que X ∈ F.
Además, si A ⊆ X, entonces A y X \ A no pueden, simultáneamente, pertenecer a F, pues ello
forzaría a que ∅ = AT∩ ( X \ A) pertenezca a F. Más aun, de (b) se sigue que si A1 , . . . , An
están en F, entonces ni=1 Ai ∈ F para cualquier n ≥ 2.
Tres ejemplos importantes de filtros son los siguientes:
(1) Sea X un conjunto no vacío y fijemos un punto x ∈ X. Si
Fx = { A ⊆ X : x ∈ A },
entonces Fx es un filtro sobre X, llamado el filtro principal sobre X en x. En general, si A ⊆ X
es un subconjunto no vacío, entonces
F A = { F ⊆ X : A ⊆ F },
es un filtro sobre X.
(2) Sea X un conjunto infinito y sea
Fco ( X ) = { A ⊆ X : X \ A es finito}.
Entonces Fco ( X ) es un filtro sobre X, al que llamaremos filtro co-finito. Cuando X = N, al
filtro Fco (N ) se le llama filtro de Fréchet. Observe que ningún subconjunto finito de N puede
pertenecer a Fco (N ).
Sec. 6.5 Conjuntos no-medibles
327
(3) Nótese que, gracias a la propiedad (b) de la definición anterior, todo filtro F sobre X
posee la Propiedad
de Intersección Finita, es decir, si A1 , . . . , An son elementos arbitrarios de
Tn
F, entonces i=1 Ai 6= ∅. Además, si G ⊆ P ( X ) posee la Propiedad de Intersección Finita,
entonces la colección
FG =
A⊆X :
n
\
i=1
Ai ⊆ A para alguna colección finita { A1 , . . . , An } ⊆ G
es un filtro conteniendo a G. A FG se le llama el filtro generado por G.
Definición 6.5.20. Sea F un filtro sobre X. Diremos que F es un ultrafiltro si F no está contenido
propiamente en ningún otro filtro sobre X; en otras palabras, si para cualquier filtro G sobre X se tiene
que
F ⊆ G ⇒ G = F.
Los ultrafiltros son, por lo general, objetos muy extraños salvo los que son de la forma Fx .
Aunque existen ultrafiltros distintos de los anteriores, ellos son imposible de describir explícitamente. Además, si card( X ) ≥ ℵ0 , entonces cada ultrafiltro sobre X posee la cardinalidad del
continuo.
Nótese que: Cualquier filtro principal es un ultrafiltro. En general, si X es un conjunto finito,
cualquier ultrafiltro sobre X es principal. Si X es infinito, entonces existen ultrafiltros sobre X
que no son principales. Ultrafiltros que no son principales se llaman libres o no-principales.
Teorema 6.5.21. Sea X un conjunto no vacío. F es un ultrafiltro sobre X si, y sólo si, para cualquier
conjunto A ⊆ X, se cumple que A ∈ F o bien X \ A ∈ F.
Prueba. . Suponga que F es un ultrafiltro y sea A ⊆ X. Si ocurre que A 6∈ F y X \ A 6∈ F,
entonces la colección G = { B ⊆ X : A ∪ B ∈ F } es un filtro conteniendo propiamente a F ya que
A ∈ G \ F lo que, por supuesto, contradice el hecho de que F es un ultrafiltro.
Para demostrar el recíproco, suponga que para cualquier conjunto A ⊆ X, ocurre que A ∈ F
o bien X \ A ∈ F, pero que F no es un ultrafiltro. Entonces existe un filtro G conteniendo
propiamente F, esto es, F $ G. Sea A0 ∈ G \ F. Puesto que G es un filtro, no puede ocurrir
que X \ A0 ∈ G y, en consecuencia, como F ⊆ G, también es imposible que X \ A0 ∈ F. Hemos
entonces demostrado que si F no es un ultrafiltro, entonces existe al menos un conjunto A0 ⊆ X
tal que ni A0 ni X \ A0 pertenecen a F, lo que constituye una contradicción a nuestra hipótesis.
Por esto, F es un ultrafiltro.
Otra forma de pensar a los ultrafiltros es por medio de medidas finitamente aditivas que
toman sólo dos valores definidas sobre la σ-álgebra P ( X ). Sea X un conjunto no vacío y sea
λ : P ( X ) → {0, 1} una medida finitamente aditiva tal que λ( X ) = 1. Considere la colección
U =
Veamos que U es un ultrafiltro.
( a) Claramente X ∈ U pero ∅ 6∈ U.
U ⊆ X : λ (U ) = 1 .
(b) También es claro que si U ∈ U y U ⊆ V ⊆ X, entonces V ∈ U.
328
Cap. 6 La Medida de Lebesgue en R
(c) Sean U, V ∈ U y suponga que U ∩ V 6∈ U. Entonces
1 = λ (U ) = λ (U \ V ) + λ (U ∩ V ) = λ (U \ V )
y, similarmente, λ(V \ U ) = 1. De esto se sigue que
λ (U ∪ V ) = λ (U \ V ) + λ (U ∩ V ) + λ (V \ U ) = 2
lo cual es absurdo ya que U ∪ V ∈ U por la parte (b). Todo lo anterior confirma que U es un
filtro. Finalmente, para cualquier conjunto U ⊆ X se cumple que U ∈ U o X \ U ∈ U. En
efecto, si, por ejemplo, U 6∈ U, entonces de la relación
1 = λ ( X ) = λ (U ) + λ ( X \ U ) = λ ( X \ U )
se sigue que X \ U ∈ U y, en consecuencia, U es un ultrafiltro. Además, U es no-principal.
Recíprocamente, si U es un ultrafiltro no-principal sobre X, entonces considerando la función de conjuntos λ : P ( X ) → {0, 1} definida por
λ( A) =

1 si A ∈ U
0 si A 6∈ U
se tiene que λ es una medida finitamente aditiva tomando sólo dos valores y satisfaciendo
λ( X ) = 1. En efecto, claramente λ( X ) = 1 ya que X ∈ U. Sean A1 , A2 ∈ X con A1 ∩ A2 = ∅.
Nótese que si A1 ∪ A2 ∈ U, entonces A1 ∈ U o A2 ∈ U pero ambos no pueden estar en U ya
que A1 ∩ A2 = ∅. En consecuencia,
1 = λ ( A1 ∪ A2 ) = λ ( A1 ) + λ ( A2 ).
Por otro lado, si A1 ∪ A2 6∈ U, entonces A1 6∈ U y A2 6∈ U y, así,
0 = λ ( A1 ∪ A2 ) = λ ( A1 ) + λ ( A2 ).
Lo que acabamos de demostrar se puede enunciar del modo siguiente:
Teorema 6.5.22. Existe una biyección entre el conjunto de todos los ultrafiltros no-principales sobre
X y el conjunto de todas las medidas finitamente aditivas λ : P ( X ) → {0, 1}.
La siguiente caracterización es una simple, pero elegante, forma de interpretar a los ultrafiltros
libres.
Lema 6.5.23 (Ultrafiltros libres). Sea U un ultrafiltro sobre X. Las siguientes afirmaciones son equivalentes:
(1) U es libre.
T
( 2 ) A ∈ U A = ∅.
(3) Para cualquier A ∈ U, card( A) ≥ ℵ0 .
Sec. 6.5 Conjuntos no-medibles
329
T
T
Prueba. (1) ⇒ (2). Suponga que A∈U A 6= ∅ y sea x ∈ A∈U A. Entonces x ∈ A para todo
A ∈ U, por lo que U ⊆ Fx . Puesto que U es un filtro maximal, resulta que U = Fx , lo cual
es imposible ya que U es libre.
(2) ⇒ (3). Sea A ∈ U y suponga que card( A) = n ∈ N. Usando el Teorema 6.5.21 se obtiene
la existencia de un a ∈ A tal que {a} ∈ U. Se sigue de esto que U = Fa lo cual es imposible.
(3) ⇒ (1). Es inmediata.
La existencia de ultrafiltros libres fue probada por primera vez por A. Tarski y su demostración
se sustenta sobre el Axioma de Elección (equivalente al Lema de Zorn). Es importante destacar
que no se puede probar la existencia de ultrafiltros libres sin el Axioma de Elección.
Teorema 6.5.24 (Teorema del Ultrafiltro). Sean X un conjunto no vacío y F0 un filtro sobre X. Entonces existe un ultrafiltro U sobre X tal que F0 ⊆ U.
Prueba. Considere la familia
F = {F ⊆ P ( X ) : F es un filtro sobre X con F0 ⊆ F }.
Ordene
S a F parcialmente con la relación de inclusión ⊆. Sea C una cadena en F. Tomando
G = A∈C A, entonces es fácil ver que G es un filtro sobre X y, por lo tanto, G ∈ F. Además,
G es una cota superior para C. Se sigue del Lema de Zorn que F posee un elemento maximal,
digamos U. Claramente U es un ultrafiltro conteniendo a F0 .
k ◮ Ultrafiltros Libres sobre N.
Hagamos X = N. Un resultado de B. Pospís̆il estable que existen tantos ultrafiltros sobre N
como subconjuntos de N, es decir, si
βN = U ⊆ P (N ) : U es un ultrafiltro sobre N ,
entonces card( βN ) = 2c . Considere ahora el filtro de Fréchet Fco (N ). Éste filtro no es un
ultrafiltro ya que, por ejemplo, N = P ∪ I (los pares y los impares) y tanto P, así como I, no
están en Fco (N ). Sin embargo, el Teorema 6.5.24 nos garantiza la existencia de un ultrafiltro
Uco ∈ βN tal que Fco (N ) ⊆ Uco . Observe que, en este caso, y gracias al Lema 6.5.23 (3), se
tiene que Uco es libre. En efecto, suponga que existe un conjunto A ∈ Uco tal que card( A) < ∞.
Puesto que Uco es un ultrafiltro sobre N, resulta del Teorema 6.5.21 que N \ A 6∈ Uco . Sin
embrago, como N \ (N \ A) = A y card( A) < ∞, se tiene que N \ A ∈ Fco (N ) ⊆ Uco .
Esta contradicción establece que card( A) ≥ ℵ0 y, entonces, por el Lema 6.5.23 (3), Uco es un
ultrafiltro libre.
Recíprocamente, cualquier ultrafiltro libre U sobre N contiene a Fco (N ). En efecto, suponga
que algún conjunto A ∈ Fco (N ) no está en U. Entonces, A es infinito por pertenecer a Fco (N ),
pero a su vez es finito por estar fuera de U. Esta contradicción establece que Fco (N ) ⊆ U.
Lo anterior se puede resumir en el siguiente:
Teorema 6.5.25. Sea U ∈ βN. Son equivalentes:
(1) U es libre.
(2) Fco (N ) ⊆ U.
330
Cap. 6 La Medida de Lebesgue en R
Recordemos que un racional diádico en (0, 1) es cualquier número de la forma m/2n con
m ∈ {1, . . . , 2n − 1} y que cada uno de tales números posee exactamente dos representaciones
binarias: las que terminan en cero y las que todos sus términos son, a partir de un cierto lugar, 1.
Por ejemplo,
∞
X
1
an
= (0,100 . . . )2 =
,
2
2n
n =1
∞
X
an
= (0,011 . . . )2 =
,
2n
n =1
donde a1 = 1 y an = 0 para todo n ≥ 2
donde, a1 = 0 y an = 1 para todo n ≥ 2.
Por otro lado, si x ∈ (0, 1) no es un racional diádico, entonces él posee una única representación
binaria infinita. En lo que sigue, siempre asumiremos que cualquier racional diádico en (0, 1) se
representa en su forma binaria con infinitos 1, de modo que cualquier x ∈ (0, 1) admite una, y
sólo una, representación binaria infinita.
Fijemos un ultrafiltro libre U ∈ βN. Por el Lema 6.5.23 sabemos que cada conjunto A ∈ U es
infinito. Asociemos, a cada conjunto A ∈ U, el número
xA =
X 1
∈ [0, 1]
2n
n∈ A
y considere, finalmente, el conjunto
ΛU =
(
)
X 1
: A∈U .
2n
n∈ A
Nótese que la inclusión Fco (N ) ⊆ U garantiza que cualquier racional diádico expresado en su
forma binaria con infinitos 1 pertenece a ΛU . En efecto, si x ∈ (0, 1) es diádico, entonces el
conjunto
A x = { n ∈ N : a n = 1}
es, por nuestra suposición, infinito y, por lo tanto, N \ A x es finito, lo cual prueba que A x ∈
Fco (N ). Existen dos aspectos importantes que se deben considerar respecto al conjunto ΛU .
P
1
(α1 ) x ∈ ΛU ⇔ 1 − x ∈ [0, 1] \ ΛU . En efecto, puesto que ∞
n =1 2n = 1, entonces
x ∈ ΛU
⇔
1− x = 1−
X 1
=
2n
n∈ A
X
n ∈N \ A
1
6 ∈ ΛU
2n
ya que U es un ultrafiltro (A ∈ U ⇔ N \ A 6∈ U).
∞
(α2 ) ΛU es un conjunto absorbente; en otras palabras, si x = ( xn )∞
n =1 ∈ ΛU y si y = ( yn ) n =1
es tal que el conjunto {n ∈ N : xn 6= yn } es finito, entonces y ∈ ΛU . Para demostrar esta
afirmación, basta verificar que
A ∈ U
⇔
A′ ∈ U
para cualesquiera conjuntos A, A′ que difieran por un conjunto finito. En efecto, como U es un
filtro, entonces la condición (c) de su definición nos muestra que:
A ∈ U
⇒
A∪F ∈ U
para cualquier conjunto finito F ⊆ N
Sec. 6.5 Conjuntos no-medibles
331
También,
A ∈ U
⇒
A\F ∈ U
para cualquier conjunto finito F ⊆ N
ya que A \ F = A ∩ (N \ F ) ∈ U pues N \ F ∈ Fco (N ) ⊆ U. Por esto, ΛU es absorbente.
Teorema 6.5.26 (Sierpiński). El conjunto ΛU no es medible según Lebesgue.
Prueba. Vamos a suponer, para generar una contradicción, que ΛU es medible. Nótese que por
(α1 ) se tiene que [0, 1] \ ΛU es la reflexión de ΛU en x = 1/2, lo cual significa que ambos
conjuntos tienen la misma medida, de donde se tiene que 1 = µ(ΛU ) + µ([0, 1] \ ΛU ) = 2µ(ΛU );
es decir,
1
µ ( ΛU ) = .
( 1)
2
Fijemos una partición arbitraria de [0, 1] formada por 2m subintervalos, digamos I1 , . . . , I2m .
Asumiremos que µ( Ik ) = 2−m para todo k ∈ {1, 2, . . . , 2m }. Afirmamos que
µ(ΛU ∩ I1 ) = · · · = µ(ΛU ∩ I2m ).
( 2)
De hecho, lo que vamos a demostrar es que cada ΛU ∩ Ik es un trasladado de ΛU ∩ I1 . De modo
más preciso, veamos que
x ∈ Λ U ⇔ x ± 2− m ∈ Λ U .
Esto, sin embargo, es consecuencia de (α2 ). Se sigue entonces de (1) y (2) que para cada
k ∈ {1, 2, . . . , 2m },
1
= µ ΛU = µ ΛU ∩ [0, 1]
2
= µ(ΛU ∩ I1 ) + · · · + µ(ΛU ∩ I2m )
= 2m µ(ΛU ∩ Ik ),
es decir,
1 1
1
= µ( I1 ) para k = 1, . . . , 2m .
( 3)
m
22
2
Nótese que (3) dice que sólamente la mitad de la medida de los intervalos Ik pertenecen a ΛU .
Sea ε > 0 y usemos el Primer Principio de Littlewood, Teorema 6.3.62, página 298, para
seleccionar una colección finita { J1 , . . . , Jn } de intervalos abiertos y disjuntos tal que
n
[
ε
µ ΛU △
Ji < .
2
µ(ΛU ∩ Ik ) =
i=1
S
Escoja ahora un m lo suficientemente grande de modo que la unión ni=1 Ji pueda ser aproximada a menos de ε/2 por una subcolección { In1 , . . . , Ink } de la partición { I1 , . . . , I2m } de [0, 1]; es
decir,
[
n
k
[
ε
Ji \
Ii j < .
µ
2
i=1
Observe que
µ ΛU \
k
[
j=1
Ii j
≤ µ ΛU
j=1
[
n
n
k
[
[
\
Ji + µ
Ji \
Ii j < ε
i=1
i=1
j=1
332
Cap. 6 La Medida de Lebesgue en R
y entonces
k
k
[
[
µ ( ΛU ) = µ ΛU \
Ii j + µ ΛU ∩
Ii j
j=1
< ε+
k
X
j=1
= ε+
j=1
µ(ΛU ∩ Ii j ) = ε +
k
2m + 1
k
µ( I1 )
2
.
Si tomamos ε < 12 (1 − 2km ) se obtiene que µ(ΛU ) < 12 . Esta contradicción establece que ΛU no
puede ser medible Lebesgue y termina la prueba.
6.5.7. Conjunto de Lévy
Casi al mismo tiempo en que Vitali construyó su ejemplo de un conjunto no-medible, Paul
Lévy (1886-1971) [94] obtuvo un ejemplo similar. La construcción del conjunto no-medible de
Lévy se fabrica sobre una base de Hamel en RQ , donde RQ es el espacio vectorial R sobre
Q. Estas bases de Hamel han sido objeto de un estudio profundo derivándose de ellas algunos
resultados sorprendentes como se muestra un poco más abajo. Quien por primera vez consideró a
R como un espacio vectorial sobre Q fue Georg Karl Wilhelm Hamel (1877-1954) quien construyó
una tal base usando métodos transfinitos. A dicha base se le llamará posteriormente base de Hamel.
El objetivo de Hamel era construir una solución no trivial (o de modo equivalente, discontinua)
de la ecuación funcional de Cauchy
f ( x + y) = f ( x ) + f ( y)
para todo x, y ∈ R.
Hamel pudo demostrar que existían funciones f : R → R que satisfacían dicha ecuación pero que
eran discontinuas en todo punto de R. Una prueba de este hecho será dada en el Corolario 6.5.31,
página 339.
En lo que sigue, a R, como espacio vectorial sobre Q, lo denotaremos por RQ . Por el
Teorema 1.3.7 sabemos que todo espacio vectorial sobre un cuerpo no trivial posee una base de
Hamel, en particular, RQ posee una base de Hamel que denotaremos por H = { xα : α ∈ D }.
Recordemos que H queda determinada por las dos propiedades siguientes:
( a) H es linealmente independiente, y
(b) Lin(H, Q ) = R, donde
Lin(H, Q ) = q1 x1 + · · · + qk xk : q1 , . . . , qk ∈ Q, x1 , . . . , xk ∈ H, k ∈ N .
Un hecho simple, pero que siempre hay que tener presente (véase el Corolario 1.2.11, página 16), es el siguiente:
k◮
Si A es un conjunto infinito numerable, también lo es la familia
Pfin ( A) = F ⊆ A : F es finito .
Sec. 6.5 Conjuntos no-medibles
333
Teorema 6.5.27 (Hamel). Si H es una base de Hamel en RQ , entonces
card(H) = c.
Prueba. Aceptando la Hipótesis del Continuo. Suponga, por un momento, que H es numerable
y escribamos
H = { x1 , x2 , . . . }.
Por el resultado anterior, la familia Pfin (H) es numerable. Para cada F ∈ Pfin (H), digamos F =
{ xn1 , . . . , xnk }, sea Lin( F, Q ) el conjunto formado por todas las combinaciones lineales racionales
de elementos de F, es decir,
Lin( F, Q ) = q1 xn1 + · · · + qk xnk : (q1 , . . . , qk ) ∈ Q k .
Puesto que la aplicación ϕ : Q k × F → Lin( F, Q ) dada por
ϕ q1 , . . . , q k , x n1 , . . . , r n k = q1 x n1 + · · · + q k x n k
es claramente sobreyectiva, se sigue entonces de la numerabilidad de Q k × F que Lin( F, Q ) es
también numerable y, por consiguiente, el conjunto
[
Lin( F, Q )
F ∈Pfin (H )
es numerable. Observe finalmente que si x ∈ R, entonces x ∈ Lin( F, Q ) para algún F ∈ Pfin (H)
y, en consecuencia,
[
R =
Lin( F, Q ).
F ∈Pfin (H )
Esto último nos revela que R es numerable lo que constituye una flagrante contradicción. Por
esto, H es no-numerable y, entonces, por una aplicación de la Hipótesis del Continuo se concluye
que card(H) = c.
Evitando la Hipótesis del Continuo. Suponga que H es no-numerable y sea m = card(H). Para
cada n ∈ N, considere el conjunto
Hn = F ⊆ H : card( F ) = n .
Observe que card(Hn ) ≤ mn = m y, por lo tanto,
card
∞
[
n =1
Por otro lado, para cualquier F ∈
S∞
Hn
≤ ℵ0 · m = m.
se tiene que card(Lin( F, Q )) = ℵ0 y como
[
R = Lin(H, Q ) =
Lin( F, Q )
n = 1 Hn
F∈
S∞
n =1 H n
resulta que c = card(R ) ≤ m · ℵ0 = m ≤ c. Esto nos revela que m = c y, así, card(H) = c. Fin
de la prueba.
Fijemos una base de Hamel H en RQ . Algunas propiedades interesantes que posee H son
las siguientes:
334
Cap. 6 La Medida de Lebesgue en R
(H)1 a H es una base de Hamel para cualquier a ∈ R \ {0}.
(H)2 H ∩ ( a + H) = ∅ para todo a ∈ H.
En efecto, suponga que H ∩ ( a + H) 6= ∅ para algún a ∈ H y sea y ∈ H ∩ ( a + H).
Seleccionemos un x ∈ H de modo que y = a + x. También, como y ∈ H, resulta que el
conjunto {a, x, y} ⊆ H es linealmente dependiente, lo cual es imposible. Por esto, (H)2 se
cumple.
(H)3 a + H ⊆ R \ H para todo a ∈ H.
(H)4 No existe ninguna base de Hamel H tal que ab ∈ H para todo a, b ∈ H.
Por el Teorema de Hamel sabemos que card(H) = c, por lo que podemos escribir H =
xα : α ∈ [0, 1] . Observe que, por definición, para cada x ∈ R, existe F ∈ Pfin (H), digamos
F = { xα1 , . . . , xαn }, y coeficientes racionales únicos q1 ( x), . . . , qn ( x) tales que
x = q1 ( x ) x α1 + q2 ( x ) x α2 + · · · + q n ( x ) x α n .
Teorema 6.5.28 (Lévy). Para cada base de Hamel H en RQ , existe un subconjunto VH de R que no
es medible según Lebesgue.
Prueba. Escribamos H = xα : α ∈ [0, 1] y fijemos un índice α0 de [0, 1]. Considere ahora el
subespacio vectorial de RQ generado por el conjunto H \ { xα0 }. Denotemos a este subespacio
por VH . Observe que, por definición, xα0 6∈ VH . Nuestro objetivo es demostrar que VH no
puede ser medible según Lebesgue. Suponga lo contrario, es decir, que VH ∈ Mµ (R ) y sea
(qn )∞
n =0 una enumeración sin duplicaciones de Q con q0 = 0. Si para cada n ∈ N 0 definimos
Vn = qn xα0 + VH , resulta entonces que:
( a) Vn es medible y µ(Vn ) = µ(VH ) para todo n ≥ 0.
(b) Vm ∩ Vn = ∅ para todo m, n ∈ N con m 6= n.
En efecto, suponga por un momento que Vm ∩ Vn 6= ∅ y sea x ∈ Vm ∩ Vn . Entonces existen
xαm y xαn en VH tales que
x = q m x α0 + x α m = q n x α0 + x α n .
De esto se sigue que (qm − qn ) xα0 = xαn − xαm ∈ VH , pues VH es un espacio vectorial. Pero
como qm 6= qn , resulta que xα0 = (qm − qn )−1 ( xαn − xαm ) ∈ VH , lo cual es imposible.
(c) R =
∞
[
Vn .
n =0
(d) VH − VH = VH , pues VH es un espacio vectorial.
Observe que si µ(VH ) = 0, entonces de ( a), (c) y la numerabilidad de µ se tiene que
+ ∞ = µ (R ) =
∞
X
n =1
µ(Vn ) =
∞
X
n =1
µ(VH ) = 0,
Sec. 6.5 Conjuntos no-medibles
335
lo que obviamente es un disparate. Suponga ahora que µ(VH ) > 0 y nótese que, gracias a (b),
VH ∩ qn xα0 + VH = ∅
(∗∗)
para cualquier qn 6= 0. Por otro lado, como µ(VH ) > 0, el Teorema de Steinhaus, Teorema 6.3.54,
nos garantiza la existencia de un entorno abierto G0 del 0 tal que VH ∩ ( g + VH ) 6= ∅ para todo
g ∈ G0 . Sin embargo, como Q es denso, podemos elegir un qn ∈ Q lo suficientemente pequeño
de modo que qn xα0 ∈ G0 y, por consiguiente,
VH ∩ qn xα0 + VH 6= ∅
lo que constituye una violación a (∗∗). Esta contradicción establece que la condición µ(VH ) > 0
tampoco puede ocurrir y termina la prueba.
Nota Adicional 6.5.9 Es importante destacar que en la prueba del Teorema de Lévy se obtuvo
que R se puede representar como una unión numerable y disjunta de subconjuntos no-medibles.
Otro aspecto interesante es que, si bien es cierto que la existencia de una base de Hamel
conduce a la creación de un conjunto no-medible según Lebesgue surge, de modo natural,
la pregunta de si existen bases de Hamel que sean no-medibles. La respuesta, como era de
esperarse, es que existen bases de Hamel que son medibles y otras que no lo son. Algunas
otras propiedades relacionadas con bases de Hamel son las siguientes:
(1) Cualquier subconjunto medible de VH posee medida 0.
Prueba. Sea E ⊆ VH medible y suponga que µ( E) > 0. El Teorema de Steinhaus
muestra que E − E contiene un intervalo abierto J con 0 en su interior. Por lo tanto,
J ⊆ E − E ⊆ VH − VH = VH ,
de donde se concluye, por ser VH un espacio vectorial, que VH = R. Esta contradicción establece que µ( E) = 0.
(2) Si H es una base de Hamel medible según Lebesgue, entonces µ(H) = 0.
Prueba. Suponga que µ(H) > 0 y sea x0 ∈ H. Entonces H′ = H \ { x0 } es medible
con µ(H′ ) > 0. Invoquemos el Teorema de Steinhaus para obtener un intervalo abierto
J = (−ε, ε) tal que J ⊆ H′ − H′ . Por otro lado, como x0 ∈ R, el Principio de
Arquímedes nos garantiza la existencia de un número racional q 6= 0 de modo tal
que qx0 ∈ J y, en consecuencia, qx0 ∈ H − H. De allí que existen u, v ∈ H tales
que qx0 = u − v; en otras palabras, qx0 − (u − v) = 0. Esto nos revela que H no es
linealmente independiente y termina la prueba.
(3) Existe una base de Hamel que es medible según Lebesgue.
Prueba. Sea Γ el conjunto ternario de Cantor. Sabemos que Γ es medible de medida
cero, por lo que todo subconjunto de él es medible. Más aun, como
Γ + Γ = [0, 2],
(2a)
resulta que Γ genera a RQ , es decir, Lin(Γ, Q ) = R. Para ver esto, sea x ∈ R y
escoja q ∈ Q tal que qx ∈ [0, 2]. Use ahora (2a) para determinar un par de elementos
u, v ∈ Γ tal que u + v = qx. De aquí se sigue que x ∈ Lin(Γ, Q ) y, en consecuencia,
Lin(Γ, Q ) = R. Un llamado al Corolario 1.3.9, página 52, nos revela que existe una
base de Hamel H ⊆ Γ. Por supuesto, H es medible.
336
Cap. 6 La Medida de Lebesgue en R
(4) Bajo la Hipótesis del Continuo, existe una base de Hamel que es un conjunto de Bernstein. Por consiguiente, existen bases de Hamel que no son medibles según Lebesgue.
Prueba. Sea Fc la familia de todos los subconjuntos cerrados no numerables de R.
Sabemos que card(Fc ) = c. La Hipótesis del Continuo permite expresar a Fc en la
forma Fc = { Fα : α < ω1 }. Nuestro objetivo es usar el Método de Inducción Transfinita
para obtener una familia Q-linealmente independiente, digamos H = { xα : α < ω1 }
tal que xα ∈ Fα , para cada α < ω1 . Si G es un subconjunto no vacío de R, denote
por Lin( G, Q ) al conjunto de todas las combinaciones Q-lineales de elemento de G,
esto es, x ∈ Lin( G, Q ) si, y sólo si
x = q1 x α1 + · · · + q n x α n ,
donde xα1 , . . . , xαn ∈ G y q1 , . . . , qn ∈ Q. Sea x0 ∈ F0 con x0 6= 0. Suponga que, para
un ordinal β < ω1 , la familia Q-linealmente independiente Gβ = { xα : α < β} ha sido
definida. Considere el conjunto
Hβ = Lin Gβ , Q .
Puesto que ℵ0 = card( Hβ ) < c y Fβ es no-numerable, resulta que Fβ \ Hβ 6= ∅.
Seleccione un punto x β ∈ Fβ \ Hβ . De este modo queda construida la familia requerida
H =
xα : α < ω1 .
Ahora, usando el Corolario 1.3.8, página 52, encuentre una base de Hamel H tal que
H ⊆ H. Afirmamos que H es un conjunto de Bernstein. En efecto, sea F un conjunto
cerrado no-numerable. Entonces F = Fα para algún α < ω1 y, así, por construcción,
xα ∈ Fα ∩ H ⊆ F ∩ H. De modo similar, se verifica que F ∩ (R \ H) 6= ∅ y termina la
prueba.
(5) Ninguna base de Hamel es un conjunto analítico. En particular, ninguna base de
Hamel es medible según Borel.
Prueba. Sea H una base de Hamel y suponga que es un conjunto analítico. Fijemos
xα0 ∈ H y considere B = H \ { xα0 }. Para cada k ∈ N, sea B(k) el conjunto de todos
los números reales que pueden ser representados en la forma
q1 x α1 + · · · + q k x α k
donde xα1 , . . . , xαk ∈ B y q1 , . . . , qk ∈ Q \ {0} con qi 6= q j para i 6= j. Finalmente, sea
Bq = q · B para cada q ∈ Q \ {0}. Observe ahora que:
( a) B y Bq son claramente conjuntos analíticos.
[
( b ) B( 1) =
Bq es un conjunto analítico por el Lema 6.3.29, página 274.
q ∈Q \{0}
(c) B(k) = B(1) ⊕ B(1) ⊕ · · · ⊕ B(1) (k − veces) es un conjunto analítico. En efecto, en
primer lugar, observe que si H y K son conjuntos analíticos, entonces H + K, por ser
la proyección del conjunto analítico H × K sobre la recta y = x, es también analítico.
Luego, por inducción, si H1 , . . . , Hn son conjuntos analíticos, entonces H1 + · · · + Hn
es analítico.
Sec. 6.5 Conjuntos no-medibles
337
S
( k) es un conjunto analítico, en particular, medible según
De esto se sigue que ∞
k=1 B
Lebesgue gracias al Teorema 6.3.30. Sin embargo, esto no es posible ya que
∞
[
B(k) = VH ,
k=1
donde VH es el subespacio vectorial generado por B, el cual, por el Teorema de Levy,
no es medible según Lebesgue. Esta contradicción establece que H no puede ser un
conjunto analítico.
Combinado (3) y (5) se obtiene:
(6) Existe un conjunto medible según Lebesgue que no es medible según Borel.
(7) Existencia de funciones de Cauchy no-continuas.
Recordemos que una función f : R → R es llamada una función de Cauchy si ella es
aditiva, esto es, si
f ( x + y) = f ( x ) + f ( y)
para todo x, y ∈ R. Es fácil comprobar que toda función de Cauchy f es Q-lineal, es
decir,
f (qx) = q f ( x)
para todo x ∈ R y todo q ∈ Q. Veamos esto. En primer lugar, observe que
f ( 0) = 0
ya que f (0) = f (0 + 0) = 2 f (0). De aquí se deduce que
f (− x) = − f ( x).
Más aun, para cada x ∈ R y cada n ∈ N, se sigue por inducción que
f (2x) = 2 f ( x),
f (3x) = 3 f ( x),
··· ,
f (nx) = n f ( x).
Si n es un entero negativo, entonces −n es un entero positivo y, así,
f (nx) = f (−(−nx)) = − f (−nx) = −(−n) f ( x) = n f ( x).
Sea ahora q = m/n un número racional. Entonces, mx = n(qx) y, por lo tanto,
m f ( x) = f (mx) = f (n(qx)) = n f (qx),
de donde se tiene que
f (qx) = q f ( x).
Si tomamos a = f (1), resulta de lo anterior que
f (q) = a · q
para todo q ∈ Q.
(FC1 )
En presencia de continuidad las funciones Q-lineales se convierten automáticamente
en R-lineales (= lineales).
338
Cap. 6 La Medida de Lebesgue en R
Teorema 6.5.29. Si f : R → R es una función de Cauchy continua, entonces f es de la
forma
f ( x) = a · x para todo x ∈ R,
donde a = f (1).
Prueba. Sea x ∈ R. Como Q es denso en R, seleccione una sucesión (qn )∞
n =1 en Q
tal que qn → x. Ahora por (FC1 ) y la continuidad de f resulta que
f ( x) = lı́m f (qn ) = lı́m a · qn = a · x
n→∞
n→∞
La prueba es completa.
Uno puede preguntarse: ¿existen funciones de Cauchy que no son continuas? Aunque
nunca se ha construido una tal función, el Axioma de Elección garantiza la existencia
de tales monstruos.
Lema 6.5.30 (Existencia de funciones aditivas). Sea H una base de Hamel en RQ . Para cada función arbitraria g : H → R, existe una función de Cauchy f : R → R tal que
f ( x) = g( x) para todo x ∈ H.
Prueba. Pongamos H = xα : α ∈ [0, 1] . Para cada x ∈ R, existen xα1 , . . . , xαn en H
y q1 , . . . , qn en Q tales que x = q1 xα1 + · · · + qn xαn . Defina f : R → R por
f ( x ) = q1 g ( x α1 ) + · · · + q n g ( x α n ) .
Observe que f está bien definida ya que, al ser H una base de Hamel, la elección
de los números xα1 , . . . , xαn , q1 , . . . , qn son únicos. También es claro que f ( x) = g( x)
para cualquier x ∈ H. Resta por demostrar que f es aditiva. Sean x, y ∈ R. Entonces
x = q1 x α1 + · · · + q n x α n
y
y = r1 x β 1 + · · · + r m x β m
donde xα1 , . . . xαn , x β1 , . . . , x β m son miembros de la base H y los números q1 , . . . , qn y
r1 , . . . , rm son racionales. Observe que los dos conjuntos { xα1 , . . . , xαn } y { x β1 , . . . , x β m }
pueden tener miembros en común. Sea {z1 , . . . , zk } la unión de esos dos conjuntos.
Entonces k ≤ m + n, y se tiene que
x = a1 z1 + · · · + a k z k
y
y = b1 z1 + · · · + bk zk ,
donde los números a1 , b1 , . . . , ak , bk son racionales, algunos de los cuales pueden ser
ceros. Ahora,
x + y = ( a1 + b1 )z1 + · · · + ( ak + bk )zk
y
f ( x + y) = f ( a1 + b1 )z1 + · · · + ( ak + bk )zk
= ( a1 + b1 ) g(z1 ) + · · · + ( ak + bk ) g(zk )
= a1 g(z1 ) + · · · + ak g(zk ) + b1 g(z1 ) + · · · + bk g(zk )
= f ( x ) + f ( y).
Esto termina la prueba.
Sec. 6.5 Conjuntos no-medibles
339
Corolario 6.5.31 (Hamel). Existen funciones de Cauchy f : R → R que no son continuas.
Prueba. Sea H = xα : α ∈ [0, 1] una base de Hamel en RQ y fije cualquier elemento
h ∈ H. Defina gh : H → R del modo siguiente:
(
0
si x ∈ H \ {h}
gh ( x ) =
1
si x = h.
Por el Lema 6.5.30, existe una función de Cauchy f : R → R tal que f ( x) = gh ( x)
para todo x ∈ H. Afirmamos que f no puede ser continua. En efecto, suponga por
un momento que f es continua. Entonces existe una constante a tal que f ( x) = ax
para todo x ∈ R. Veamos que esto conduce a una contradicción. Seleccione un x ∈ H
arbitrario con x 6= h y observe que como h f ( x) = f (hx) = f ( xh) = x f (h), entonces
se tiene que
f ( x)
f ( h)
1
=
= .
0 =
x
h
h
Esta contradicción establece que f no puede ser continua y finaliza la prueba.
Observe que la función f del corolario anterior también se puede elegir inyectiva.
Para ver esto, sea φ : [0, 1] → [0, 1] una aplicación inyectiva arbitraria distinta de la
identidad. Si ahora imponemos la condición de que f ( xα ) = xφ(α) para todo xα ∈ H
resulta que f es inyectiva.
(8) Si f : R → R es una función de Cauchy no-continua, entonces
Graf( f ) = ( x, f ( x)) ∈ R2 : x ∈ R
es denso en R2 .
Prueba. Sea ( x, y) ∈ R2 y sea G un conjunto abierto en R2 conteniendo a ( x, y).
Veamos que G ∩ Graf( f ) 6= ∅. Puesto que f no es lineal, existen a 6= 0 y b 6= 0 tales
que
f ( a)
f (b)
y
a
b
son diferentes. Por consiguiente, los vectores
u = ( a, f ( a))
y
v = (b, f (b))
son linealmente independientes y, por lo tanto, forman una base de R2 . De esto se
sigue que existen números reales p, q tales que
( x, y) = pu + qv.
Ahora bien, como Q2 es denso en R2 , entonces G ∩ Q2 6= ∅ y, en consecuencia,
existen números racionales r p y rq tales que
r p u + rq v ∈ G.
Observe que
r p u + rq v =
=
r p a + rq b, r p f ( a) + rq f (b)
r p a + rq b, f (r p a + rq b) ∈ G ∩ Graf( f )
lo cual prueba que Graf( f ) es denso en R2 .
340
Cap. 6 La Medida de Lebesgue en R
(9) Las funciones de Cauchy no-continuas son más abundantes que las que son continuas.
Teorema 6.5.32. En ZFC existen:
( a) 2ℵ0 funciones de Cauchy continuas.
(b) 22
ℵ0
funciones de Cauchy que no son continuas.
Prueba. ( a) Para cada a ∈ R, la función f a : R → R definida por f a ( x) = a · x para
todo x ∈ R es una función de Cauchy continua. Más aun, gracias a (6), toda función
de Cauchy f : R → R que es continua es de la forma f = f a , donde a = f (1). Esto
prueba la parte ( a).
(b) Por Teorema 6.5.27, RQ posee una base de Hamel H con cardinalidad 2ℵ0 . Puesto
que cualquier aplicación g : H → R se puede extender unívocamente a una función
aditiva f : R → R, Lema 6.5.30, existen precisamente
card RH
= card(R )card(H) = 2ℵ0
2 ℵ 0
= 2ℵ 0 · 2
ℵ0
= 22
ℵ0
funciones de Cauchy y ya que sólo existen, por ( a), 2ℵ0 funciones de Cauchy contiℵ
nuas, resulta entonces que existen 22 0 de tales funciones que no son continuas.
Una vez que el Axioma de Elección entra en acción, se pueden construir ciertos conjuntos y funciones que, por lo general, poseen algunas patologías extrañas. Otros ejemplos
raros, sin embargo, no requieren el uso de tal herramienta. Por ejemplo, Henri Lebesgue, quien no era creyente del Axioma de Elección, construyó una función con una
patología muy rara: siempre es sobreyectiva, es decir:
Definición 6.5.33. Sea f : R → R una función. Se dice que f es siempre-sobreyectiva si
ocurre que f (( a, b)) = R para cualquier intervalo abierto ( a, b) ⊆ R con a < b.
El siguiente resultado nos dice cómo se caracterizan las funciones que son siempresobreyectivas.
Teorema 6.5.34 (Lebesgue). Sea f : R → R una función arbitraria. Las siguientes condiciones son equivalentes:
(1) f es siempre-sobreyectiva.
(2) f −1 (t) es denso en R para cualquier t ∈ R.
Prueba. Suponga que f es siempre-sobreyectiva pero que f −1 (t) no es denso en R
para algún t ∈ R. Esto, por supuesto, significa que existe algún intervalo abierto
( a, b) en R tal que f −1 (t) ∩ ( a, b) = ∅. Selecciones un x ∈ f −1 (t) de modo tal que
x 6∈ ( a, b) y observe ahora que t = f ( x) 6∈ f (( a, b)) = R. Esta contradicción prueba
que f −1 (t) es denso en R.
Recíprocamente, suponga que (2) se cumple y sea t ∈ R. Fijemos un intervalo abierto
( a, b) en R. Como f −1 (t) es denso en R, resulta que f −1 (t) ∩ ( a, b) 6= ∅. Si se
selecciona cualquier x ∈ f −1 (t) ∩ ( a, b), tendremos que f ( x) = t.
Teorema 6.5.35 (Lebesgue). Existen funciones f : R → R que son siempre-sobreyectivas.
Sec. 6.5 Conjuntos no-medibles
341
Prueba. Denote por A = { A x : x ∈ R } la colección de todas las clases de equivalencias
determinadas por la relación de equivalencia:
x∼y
⇔
x − y ∈ Q.
Tal como se demostró en la prueba de la existencia de un conjunto no-medible al estilo
Vitali, resulta que A es una colección no-numerable, donde cada par de sus miembros
o son iguales o son disjuntos. En particular,
t ∈ Ax
At = A x .
⇔
De lo anterior se deduce que card(A) = c. Teniendo en cuenta que también card(R ) =
c, podemos determinar una biyección g : A → R. Defina ahora la función f : R → R
por
f ( x) = g( A x ) para todo x ∈ R.
Veamos que f es siempre-sobreyectiva. Para ver esto, fijemos a, b ∈ R con a < b. Como
Q es denso en R, resulta que cada traslado x + Q = A x también es denso en R y,
en consecuencia A x ∩ ( a, b) 6= ∅ para todo x ∈ R. Sea y ∈ f (( a, b)) y seleccione un
t ∈ ( a, b) tal que y = f (t). Puesto que
[
t ∈ ( a, b) =
( a, b) ∩ A x
x ∈R
resulta que existe un único x ∈ R tal que t ∈ ( a, b) ∩ A x . En consecuencia, At = A x
y por lo tanto, f (t) = g( At ) = g( A x ). De esto se sigue que
f (( a, b)) = f (t) : t ∈ ( a, b) = g( A x ) : x ∈ R = g A = R.
La prueba es completa.
Otra forma de demostrar la existencia de funciones siempre-sobreyectivas es como
sigue:
Segunda Prueba del Teorema 6.5.35. Sea JQ la colección de todos los intervalos abiertos no vacíos con extremos racionales. Puesto que JQ es numerable podemos considerar una enumeración de sus elementos, digamos:
JQ = (r1 , s1 ), (r2 , s2 ), . . . .
Nuestro próximo objetivo es construir una sucesión (Γn )∞
n =1 de conjuntos ternarios de
Cantor con las siguientes propiedades:
( a) Γn ⊆ (rn , sn ) para todo n ∈ N, y
(b) Γm ∩ Γn = ∅ para todo m 6= n.
En efecto, sea Γ1 cualquier conjunto ternario de Cantor incluido en (r1 , s1 ) (simplemente construya Γ1 en cualquier subintervalo cerrado I ⊆ (r1 , s1 )). Suponga ahora
que hemos construidos conjuntos ternarios de Cantor Γ1 , . . . , Γn satisfaciendo las condiciones ( a) y (b). Para construir Γn+1 se procederá del modo siguiente: como cada
Γi para i = 1, . . . , n es de medida cero, también los es su unión Γ1 ∪ · · · ∪ Γn . Esto
nos indica que
(r n +1 , s n +1 ) * Γ1 ∪ · · · ∪ Γ n
342
Cap. 6 La Medida de Lebesgue en R
ya que µ((rn+1 , sn+1 )) > 0. Considere el conjunto
c
V = (r n +1 , s n +1 ) ∩ Γ1 ∪ · · · ∪ Γ n .
Observe que V es abierto y no vacío. Fijemos ahora cualquier x ∈ V y escoja un
ε > 0 de modo que el intervalo ( x − ε, x + ε) ⊆ V. Finalmente, construya un conjunto
ternario de Cantor Γn+1 ⊆ ( x − ε, x + ε). Esto termina la construcción de la sucesión
(Γn )∞
n =1 .
Ahora bien, como card(Γn ) = c para todo n ∈ N, podemos seleccionar una función
biyectiva f n : Γn → R y entonces definir f : R → R por
f ( x) =



 f n ( x)


0
si x ∈ Γn para algún n ∈ N,
si x 6∈
∞
[
Γn .
n =1
Para verificar que f es siempre-sobreyectiva, sea I un intervalo abierto no vacío y
escoja un intervalo (rn , sn ) ∈ JQ tal que (rn , sn ) ⊆ I. Por construcción Γn ⊆ (rn , sn ) y,
en consecuencia,
R = f n (Γn ) = f (Γn ) ⊆ f ( I ) ⊆ R.
De aquí se concluye que f ( I ) = R y termina la prueba.
Observe que el gráfico de f es siempre denso en R2 .
sorprendente es el siguiente resultado.
Un hecho que es realmente
Corolario 6.5.36. Cualquier función siempre-sobreyectiva f : R → R posee la Propiedad
del Valor Intermedio pero es discontinua en todo punto de R.
Prueba. Sea f : R → R una función siempre-sobreyectiva. Afirmamos que f no es
continua en ningún punto de R. En efecto, sea x0 ∈ R y suponga que f es continua en
x0 . Tomando V = ( f ( x0 ) − 1, f ( x0 ) + 1) existe, por la continuidad de f en x0 , un
intervalo abierto Ix0 conteniendo a x0 tal que f ( Ix0 ) ⊆ V. Pero como f es siempresobreyectiva, resulta que f ( Ix0 ) = R ⊆ ( f ( x0 ) − 1, f ( x0 ) + 1). Esta contradicción
establece que f es discontinua en todo punto de R. También es claro que f posee la
Propiedad del Valor Intermedio.
Invocando el Teorema 3.1.22, página 164, vemos que la función f del resultado anterior
nunca puede ser inyectiva.
En [61], páginas 31-33 y en el Ejercicio 6.9 (2), página 364, se muestran explícitamente la
construcción de otras dos funciones que son siempre-sobreyectivas. Más aun, se puede
demostrar la existencia de una función f : R → R tal que f ( P) = R para todo conjunto
perfecto P ⊆ R (véase, por ejemplo, [59], Example 3.12, p. 124).
El siguiente resultado muestra que las funciones de Cauchy que no son continuas se
parecen mucho a las funciones que son siempre-sobreyectivas.
Teorema 6.5.37. Si f : R → R es una función de Cauchy no continua, entonces f (( a, b))
es denso en R para cualquier intervalo abierto ( a, b) ⊆ R.
Sec. 6.5 Conjuntos no-medibles
343
Prueba. Sea ( a, b) un intervalo abierto. Para demostrar que f (( a, b)) es denso en R,
tomemos cualquier intervalo abierto J ⊆ R y veamos que f (( a, b)) ∩ J 6= ∅. En efecto,
puesto que Gra( f ) es denso en R2 resulta que
Gra( f ) ∩ ( a, b) × J 6= ∅.
Seleccione un ( x, f ( x)) ∈ Gra( f ) ∩ ( a, b) × J . Entonces x ∈ ( a, b) y f ( x) ∈ J, lo
cual muestra que f ( x) ∈ f (( a, b)) ∩ J. Por esto f (( a, b)) es denso en R y termina la
prueba.
Teorema 6.5.38. Sea f : R → R una función de Cauchy. Las siguientes condiciones son
equivalentes:
(1) f es siempre-sobreyectiva.
(2) f es sobreyectiva pero no inyectiva.
Prueba. (1) ⇒ (2). Suponga que (1) se cumple. Como R es un intervalo abierto,
resulta de la definición de función siempre-sobreyectiva que f (R ) = R lo cual prueba
que f es sobreyectiva. Por otro lado, como f −1 (t) es denso en R para cada t ∈
R, Teorema 6.5.34, se tiene que cualquier par de elementos distintos x, y ∈ f −1 (t)
satisfacen f ( x) = f (y). Esto prueba que f no es inyectiva.
Otra manera de probar que f no es inyectiva es recordar que el conjunto de los puntos
de discontinuidad de cualquier función monótona es a lo más numerable, Corolario 3.1.35, página 174, suponer que f es inyectiva y entonces aplicar el Corolario 6.5.36
para arribar a una contradicción.
(2) ⇒ (1). Suponga que (2) se cumple. Para demostrar que f es siempre-sobreyectiva
es suficiente, gracias al Teorema 6.5.34, verificar que f −1 (t) es denso en R para todo
t ∈ R. Esto lo haremos en dos pasos: el primero es comprobar que f −1 (0) es denso
en R. En efecto, puesto que f no es inyectiva resulta que
f − 1 ( 0) = x ∈ R : f ( x ) = 0
contiene elementos distintos de cero. Sea ( a, b) un intervalo abierto y sea x ∈ f −1 (0),
x 6= 0. Seleccione un número racional q tal que qx ∈ ( a, b) y observe que como f es
es una función de Cauchy, entonces f (qx) = q f ( x) = 0, es decir, qx ∈ f −1 (0) ∩ ( a, b).
Esto prueba que f −1 (0) es denso en R.
Veamos ahora que para cualquier t en R \ {0}, el conjunto f −1 (t) es denso en R.
En efecto, fijemos t ∈ R \ {0} y usemos el hecho de que f es sobreyectiva para
determinar un x0 ∈ R tal que f ( x0 ) = t. Puesto que x0 + f −1 (0) = f −1 (t) resulta de
la primera parte que f −1 (t) es denso en R y termina la prueba.
No queremos finalizar esta sección sin antes informar sobre esta otra dirección para la obtención de conjuntos no-medibles ligeramente diferente a los ofrecidos anteriormente. El Teorema
de Hahn-Banach, una de las Joyas de la Corona del Análisis Funcional, se demuestra usando el
Lema de Zorn el cual, como sabemos, es equivalente al Axioma de Elección; sin embargo dicho
teorema es estrictamente más débil que el Axioma de Elección: uno no puede probar la validez
344
Cap. 6 La Medida de Lebesgue en R
del Axioma de Elección usando ZF + HB, donde HB es el Axioma de que el Teorema de HahnBanach se cumple para todo espacio vectorial V. Lo que resulta interesante, asumiendo ZF +
HB como un sistema de axiomas de la Teoría de Conjuntos, es que es posible construir conjuntos
no-medibles según Lebesgue. En efecto, Matt Foreman y Friedrich Wehrung demostraron, en un
artículo publicado en la revista Studia Math. 138(1991), p. 13-19, que el Teorema de Hahn-Banach
implica la existencia de conjuntos no-medibles.
6.6. Notas Breves sobre El Problema de la Medida
El Problema de la Medida de Lebesgue, después de la solución negativa ofrecida por Vitali,
se convirtió en otros problemas al que hemos llamado el Problema de la Medida. En su versión
abstracta resulta ser profundo y complicado. En efecto, entre 1929 y 1930, S. Banach lo concibe
como un problema de la Teoría de Conjuntos en lugar de la visión geométrica que de el se tenía.
Esta nueva visión del problema permitió la creación de una nueva rama de la Teoría de Conjuntos
conocida como la Teoría de los Grandes Cardinales: sofisticada, elegante, pero difícil. En esas
aguas aun navega dicho problema. La modificación del Problema de la Medida de Lebesgue
derivó algunas variantes. En esta sección nos ocuparemos de revisar muy brevemente algunas de
ellas. En primer lugar, veremos que la medida de Lebesgue no puede extenderse a todo P (R ), es
decir, no existe ninguna función de conjuntos m : P (R ) → R que sea numerablemente aditiva,
invariante por traslación y, además, que satisfaga m( E) = µ( E) para todo E ∈ Mµ (R ). Es a partir
de este resultado, y por consiguiente, del Axioma de Elección, de donde comienzan a complicarse
las cosas: es la punta del iceberg del Problema de la Medida. En efecto, en la búsqueda por
obtener posibles extensiones de la medida de Lebesgue a σ-álgebras más grandes que Mµ (R )
hay que pasearse, por supuesto, por varias consideraciones del problema: por ejemplo, si se
insiste en obtener una extensión definida sore todo P (R ), entonces dicha extensión no puede,
por el resultado ya anunciado, ser, al mismo tiempo, invariante por traslación y numerablemente
aditiva, de modo que se presenta un nuevo problema con varias aristas. Necesariamente hay que
abandonar una de las dos condiciones anteriores, es decir, o se abandona la aditividad numerable
o, en su defecto, la invarianza por traslación. Cada una de estas consideraciones ha generado una
investigación sorprendente y, a veces, difícil. Por otro lado, si no se requiere una extensión a todo
P (R ), ¿cuál es la mayor σ-álgebra sobre la cual se puede extender µ preservando la aditividad
numerable y(o) la invarianza por traslación? Todos estos problemas presentan soluciones que, en
ciertos casos, son parciales. Todos ellos son, como lo considera Banach, esencialmente problemas
de la Teoría de Conjuntos en lugar de problemas geométricos. De hechos, los Grandes Cardinales
de la Teoría Moderna de Conjuntos cuyo análisis quedan fuera del alcance de los objetivos de
estas notas, son sus aliados imprescindibles. Sin embargo, ciertas informaciones son dadas al
lector interesado.
6.6.1. El Problema de la Medida de Lebesgue y El Axioma de Elección
Sea A una σ-álgebra de subconjuntos de R y m : A → [0, +∞] una función de conjuntos.
Diremos que m es una extensión de µ si cumple con las siguientes condiciones:
( a) Mµ (R ) ⊆ A.
(b) m( E) = µ( E) para todo E ∈ Mµ (R ).
Si m es una extensión de µ que es, además, numerablemente aditiva e invariante por traslación,
entonces diremos que m es una extensión continua de µ. Si, más aun, A = P (R ), entonces a
Sec. 6.6 Notas Breves sobre El Problema de la Medida
345
m la llamaremos una extensión universal de µ.
Ahora analizaremos brevemente dos puntos de vistas del problema de la extensión universal
de la medida de Lebesgue ambos relacionados con el Axioma de Elección.
(1o ). Si se acepta el Axioma de Elección, entonces la demostración de Vitali de la existencia
de conjuntos no-medibles no sólo muestra que Mµ (R ) 6= P (R ), sino, además, que no puede
existir ninguna extensión universal m : P (R ) → [0, +∞] de la medida de Lebesgue. En efecto, el
lector atento habrá observado que la construcción del conjunto V de Vitali no depende sobre la
definición específica de la medida de Lebesgue sino sobre las tres últimas propiedades enunciadas
en el Problema de la Medida, es decir,
(α2 ) µ( I ) = ℓ( I ) para cualquier intervalo I ⊆ R,
(α3 ) µ es invariante por traslación y
(α4 ) µ es numerablemente aditiva,
de modo que si se asume la existencia de una extensión universal m : P (R ) → [0, +∞] de µ,
entonces se puede construir, de modo idéntico al conjunto de Vitali, un conjunto V ⊆ R tal que
V 6∈ P (R ). Este disparate confirma que la aceptación del Axioma de Elección nos conduce al
siguiente hecho:
Corolario 6.6.1. No existe ninguna extensión universal m : P (R ) → [0, +∞] de µ.
Este resultado nos conduce a la siguiente interrogante:
¿Qué tan lejos podemos extender la medida de Lebesgue y qué propiedades puede preservar, si
existe, una tal extensión?
Es problema fue examinado en profundidad bajo suposiciones diferentes:
( a) ¿Podemos extender a µ a una medida continua m : A → [0, +∞] tal que Mµ (R ) $ A $
P (R )? Una vieja técnica de J. Łoś y E. Marczewski [96] garantiza que siempre se puede extender
la medida de Lebesgue a una σ-álgebra A que capture cualquier colección finita de subconjuntos
no-medibles, es decir, si A es la σ-álgebra generada por Mµ (R ) ∪ C, donde C una colección finita, pero arbitraria, de subconjuntos no-medibles según Lebesgue. Sin embargo, si la colección C
es infinita numerable entonces el problema no se puede decidir en ZFC. De hecho, T. Carlson demostró en [30] que es consistente con ZFC admitir que para cualquier colección numerable C de
subconjuntos no-medibles, existe una extensión m : A → [0, +∞] de µ con A = σ(Mµ (R ) ∪ C).
(b) Si se insiste en obtener una extensión m a todo P (R ), podemos, en principio, exigir que m
sea numerablemente aditiva o invariante por traslación, pero no ambas cosas. Si la exigencia es
que no sea numerablemente aditiva, entonces el problema se bifurca en dos ramas: que m que
sea finitamente aditiva o que ella sea no-numerablemente aditiva. ¿Cuáles son las consecuencias
de asumir cada una de esas condiciones? Estos dos aspectos serán tratados brevemente un poco
más abajo.
(2o ). Si no se acepta el Axioma de Elección, la prueba de la existencia de un conjunto nomedible al estilo Vitali no trabaja. Podemos, en consecuencia, formularnos esta otra pregunta: ¿es
indispensable el uso de dicho axioma para garantizar la existencia de conjuntos no medibles según Lebesgue?
La investigación de este problema permitió un avance espectacular de la Teoría Moderna de
Conjuntos pues se tuvo que postular la existencia de ciertos cardinales, los así llamados cardinales
inaccesibles, lográndose demostrar que: si existe un cardinal inaccesible, entonces se puede probar que
la respuesta es sí. En efecto, en 1970, Robert Solovay [122] demostró que:
346
Cap. 6 La Medida de Lebesgue en R
Teorema 6.6.2 (Solovay). Si el modelo ZFC + existe un cardinal inaccesible es consistente, entonces
también es consistente el modelo ZF + DC + cualquier conjunto de números reales es medible
según Lebesgue.
Solovay sugirió, en su artículo, que tal vez el uso de un cardinal inaccesible pudiera ser no
necesario. Sin embargo, unos años más tarde, en 1984, S. Shelah [120] probó que tal condición si
es necesaria; en otras palabras, si ZF + DC + todos los subconjuntos de R son medibles según
Lebesgue es consistente, entonces también lo es ZFC + existe un cardinal inaccesible. Como
consecuencia de esos resultados se tiene que: no se puede probar que Mµ (R ) 6= P (R ) sin la ayuda
del Axioma de Elección.
6.6.2. El Problema de la Medida de Lebesgue y la Hipótesis del Continuo
¿Cómo entra la Hipótesis del Continuo en la escena del Problema de la Medida? Recordemos
que la existencia de conjuntos no-medibles según Lebesgue (por la aceptación del Axioma de
Elección) nos indica que la medida de Lebesgue no puede extenderse a todo P (R ), esto significa
que no existe ninguna función de conjuntos m definida sobre P (R ) que sea numerablemente
aditiva, invariante por traslación y tal que m( E) = µ( E) para todo conjunto E ∈ Mµ (R ). En
vista de éste resultado, podemos intentar investigar, sin prescindir del Axioma de Elección, un
problema más general, abandonando una de las dos condiciones que impiden tal extensión: la
numerabilidad aditiva o la invarianza por traslación. Nos preguntamos entonces: ¿Qué ocurre si
se omite, por ejemplo, el requerimiento de que la medida m : P (R ) → [0, +∞] sea invariante
por traslación pero se mantiene la numerabilidad aditiva? Banach propone sustituir la condición
geométrica de la invarianza por traslación por esta esta otra condición: m({ x}) = 0 para todo
x ∈ R, ya que no sabríamos cómo demostrar que los conjuntos finitos y los numerables tienen
medida cero, una condición que debería cumplir cualquier medida que intente extender la medida
de Lebesgue. En [7], S. Banach propone esta nueva generalización del problema:
El Problema de la Medida Generalizada. ¿Existe una función de conjuntos m : P (R ) → [0, +∞)
numerablemente aditiva tal que m({ x}) = 0 para todo x ∈ R?.
En [8] Banach y Kuratowski demostraron que la bajo la Hipótesis del Continuo la única solución
al Problema de la Medida Generalizada es la medida nula. Para la prueba necesitaremos algunos
hechos.
Definición 6.6.3. Sea X un conjunto no vacío. Una medida continua sobre X es una función de
conjuntos m : P (R ) → [0, +∞) tal que:
( a) m({ x}) = 0 para cualquier x ∈ X, y
(b) m es numerablemente aditiva.
Observe que si m es una medida continua sobre X, entonces ella es finita, es decir, m( X ) <
+∞ y, además, finitamente aditiva. Más aun, las propiedades ( a) y (b) implican que si A es
cualquier conjunto numerable incluido en X, entonces m( A) = 0. Además,
(c) m( A) ≤ m( B) siempre que A ⊆ B ⊆ X.
De esto último se observa que si A ⊆ B ⊆ X y m( B) = 0, entonces m( A) = 0. Por supuesto,
ninguna medida de conteo sobre P (R ) es continua.
Si existe una medida continua sobre X con m( X ) > 0, entonces las condiciones ( a) y (b)
nos indican que X es no-numerable y, en consecuencia, la existencia de medidas continuas sobre X
Sec. 6.6 Notas Breves sobre El Problema de la Medida
347
dependen únicamente de la cardinalidad de X. Nótese también que, si X y Y son conjuntos con
la misma cardinalidad y si existe una medida continua m sobre X, entonces existe una medida
continua m′ sobre Y y viceversa. En efecto, el hecho de X y Y poseen la misma cardinalidad,
significa que existe una biyección f : X → Y. Defina m′ : P (Y ) → [0, 1] por m′ ( A) = m( f −1 ( A))
para todo A ∈ P (Y ). En particular, como R y ω1 poseen la misma cardinalidad, resulta de la
observación anterior que la existencia de una medida continua sobre R da origen a una medida
continua sobre ω1 y recíprocamente.
En el siguiente resultado se establece que el ideal de los conjuntos nulos es estable bajo uniones
numerables.
Lema 6.6.4. Si m : P ( X ) → [0, +∞) es una medida continua sobre X y si definimos
J = { A ⊆ X : m ( A ) = 0} ,
entonces J es cerrada bajo uniones numerables, es decir, si
S
∞
n =1 A n ∈ J.
Prueba. Sea An
∞
n =1
An
∞
n =1
es una sucesión en J, entonces
una sucesión en J. Definiendo la sucesión Bn
y
B1 = A1
Bn = A n \
n[
−1
j=1
Aj
∞
n =1
en X por
para todo entero n ≥ 2,
S
S∞
resulta que ella es disjunta y ∞
n =1 A n =
n =1 Bn . Puesto que Bn ⊆ A n para todo n ≥ 1, se tiene
que m( Bn ) = 0 para todo n ≥ 1 y, entonces, por la propiedad (c) se concluye que
m
[
∞
n =1
y termina la prueba.
An
= m
[
∞
n =1
Bn
=
∞
X
m ( Bn ) = 0
n =1
Lema 6.6.5. Si existe una medida continua m sobre un conjunto X, entonces cualquier subcolección
disjunta
L ⊆ m( A) : A 6∈ J
es a lo más numerable. En otras palabras, no existe ninguna colección no-numerable y disjunta de
conjuntos en X donde todos sus elementos poseen medida estrictamente positiva.
Prueba. Puesto que m( X ) < +∞, la familia {m( A) : m( A) ∈ L} es sumable (véase la Definición 2.1.52, página 114). Se sigue del Corolario 2.1.56 que L es a lo más numerable.
He aquí la conección del Problema de la Medida Generalizada con la Hipótesis del Continuo.
Este resultado fue demostrado en el año 1929 por los matemáticos Stefan Banach (1892-1945) y
Kazimierz Kuratowski (1896-1980) [8].
Teorema 6.6.6 (Banach-Kuratowski). Si existe una medida continua sobre R, entonces la Hipótesis
del Continuo es falsa.
348
Cap. 6 La Medida de Lebesgue en R
Prueba. Suponga que existe una medida continua m sobre R. Por la observación anterior, podemos admitir que m está definida sobre P (ω1 ). Para generar una contradicción, vamos a
consentir que la Hipótesis del Continuo es verdadera, es decir, 2ℵ0 = ℵ1 . Considere la siguiente
familia de subconjuntos de ω1 :
I = X ⊆ ω1 : m ( X ) = 0 .
Esta familia satisface las siguientes propiedades:
( a1 ) {α} ∈ I para cualquier α ∈ ω1 . (Sigue de la definición de m).
∞
S
( a2 ) ∞
n =1 Xn ∈ I para cualquier sucesión Xn n =1 con Xn ∈ I para todo n ∈ N. (Por el Lema 6.6.4).
( a3 ) Ic = P (ω1 ) \ I = { A ⊆ X : m( A) > 0} es a lo más numerable. (Es consecuencia del Lema 6.6.5). Por consiguiente, no existe ninguna colección no-numerable y disjunta de subconjuntos
de ω1 de medida positiva.
Ahora construiremos una matriz infinita ( Aαn )ω1 ×N0 donde cada Aαn ⊆ ω1 del modo siguiente: para cada ξ < ω1 , existe una función f ξ : ω0 → ω1 tal que ξ ⊆ Rang( f ξ ). Seleccionemos una tal función f ξ por cada ξ < ω1 y defina
Aαn = ξ < ω1 : f ξ (n) = α
para todo α < ω1 , n < ω0 .
La matriz infinita ( Aαn )ω1 ×N0 goza de las siguientes propiedades:
(b1 ) Aαn ∩ A βn = ∅ para todo α 6= β en ω1 y cualquier n ∈ N0 .
S
(b2 ) ω1 \ ∞
n =0 A αn es a lo más numerable para cualquier α < ω1 .
La veracidad de (b1 ) sigue inmediatamente. En efecto, si ξ ∈ Aαn ∩ A β n , entonces f ξ (n) = α
y f ξ (n) = β, de donde se tiene que α = β. Para ver que (b2 ) también se cumple, observe que si
ξ 6∈ Aα n para todo n, entonces α 6∈ Rang( f ξ ) y, por lo tanto, ξ < α. Esto nos dice que (b2 ) es
verdadero.
Fijemos un α < ω1 . Afirmamos que existe algún nα ∈ N0 tal que Aαnα 6∈ I. En efecto,
suponga, para generar una contradicción, que Aαn ∈ I para todo n ∈ N0 . Como
[
∞
∞
[
ω1 = ω1 \
Aαn ∪
Aαn ,
n =0
n =0
resulta de (b1 ), (b2 ), ( a1 ) y ( a2 ) que
[
∞
∞
[
1 = m ( ω1 ) = m ω1 \
Aαn + m
Aαn
n =0
= m
[
∞
n =0
Aαn
n =0
=
∞
X
m( Aαn )
n =0
= 0.
Esta contradicción confirma nuestra afirmación. Ahora bien, como ω0 es numerable y ω1 no lo
es, resulta del Principio del Palomar c-Infinito, página 16, que debe existe algún k ∈ N0 de modo
que el conjunto {α ∈ ω1 : nα = k} es no-numerable. Sea entonces
L = Aαk : nα = k .
Sec. 6.6 Notas Breves sobre El Problema de la Medida
349
Esta familia es, por lo que acabamos de ver, no-numerable. También, gracias a (b1 ) ella es disjunta
y se cumple, por nuestra afirmación, que Aαk 6∈ I para cada Aαk ∈ L. Esto, por supuesto,
contradice la propiedad ( a3 ). La conclusión ahora es inequívoca: suponer que la Hipótesis del
Continuo es verdadera conduce a una contradicción. Fin de la prueba.
En la misma dirección del resultado probado por Banach y Kuratowski, S. Ulam obtuvo la
siguiente generalización:
Teorema 6.6.7 (Ulam). Sea X un conjunto con card( X ) = ℵ1 . Si m : P ( X ) → [0, +∞) es numerablemente aditiva y m({ x}) = 0 para todo x ∈ X, entonces m es idénticamente cero.
Prueba. Como card(ω1 ) = ℵ1 , el Principio del Buen-Orden y el Teorema 1.3.35, página 66, nos
garantizan que X puede ser bien-ordenado de tal modo que, para cada y ∈ X, el conjunto
Seg(y) = { x ∈ X : x ≺ y} es a lo más numerable. Seleccione, por cada y ∈ X, una aplicación
inyectiva T (·, y) : Seg(y) → N y observe que, para cada par ( x, y) ∈ X × X con x ≺ y, T ( x, y)
es un número natural. Consideremos ahora, para cada x ∈ X y cada n ∈ N, el conjunto
Anx =
y ∈ X : x ≺ y, T ( x, y) = n .
Afirmamos que, para cada n ∈ N, la familia ( Anx ) x ∈ X es disjunta. En efecto, suponga que
x, z ∈ X con x 6= z y que Anx ∩ Anz 6= ∅. Sea y ∈ Anx ∩ Anz . Esto significa que
x ≺ y,
y
z≺y
T ( x, y) = n = T (y, z).
( 1)
Como es un orden total, se tiene que x ≺ z o z ≺ x. Si se asume que x ≺ z, tendremos, por
la inyectividad de T (·, y), que T ( x, y) 6= T (z, y) lo cual, gracias a (1), es imposible. El mismo
razonamiento se aplica si z ≺ x. Esto prueba nuestra afirmación. Ahora bien, como m es finita
y numerablemente aditiva, resulta que la familia (m( Anx )) x ∈ X es sumable para cada n ∈ N, de
donde se obtiene, invocando al Corolario 2.1.56, página 116, que el conjunto
Xn =
x ∈ X : m( Anx ) > 0
S
es a lo más numerable. Por esto, el conjunto X∗ = ∞
n =1 Xn es numerable y como X es nox ∈ X tal que x 6∈ X∗ , lo cual
numerable, resulta que X 6= X∗ , esto es, existe al menos un S
n
significa que m( Anx ) = 0 para todo n ∈ N. Definiendo A = ∞
n =1 A x , vemos que m ( A ) = 0.
Para finalizar la prueba sólo nos resta demostrar que X \ A está contenido en Seg( x). En
efecto, como Seg( x) es a lo más numerable, entonces X \ A también sería a lo más numerable
y, en consecuencia, teniendo en cuenta que m({ x}) = 0 para todo x ∈ X, tendríamos que
m( X \ A) = 0 y concluiría la prueba. Veamos entonces que X \ A ⊆ Seg( x). Suponga, por
contradicción, que algún y ∈ X \ A se encuentra fuera de Seg( x). Entonces y ≻ x y, por lo
tanto, y ∈ Anx donde n = T ( x, y), es decir, y ∈ A lo cual es absurdo. La prueba es completa. En particular, si la Hipótesis del Continuo es verdadera, entonces card([0, 1]) = ℵ1 y se
obtiene el resultado de Banach-Kuratowski.
Corolario 6.6.8 (Banach-Kuratowski). Bajo la Hipótesis del Continuo, si m : P ([0, 1]) → [0, 1] es
es numerablemente aditiva y m({ x}) = 0 para todo x ∈ X, entonces m([0, 1]) = 0.
350
Cap. 6 La Medida de Lebesgue en R
6.6.3. El Problema de la Medida de Lebesgue y la Aditividad Finita
El Problema de la Medida de Lebesgue se puede formular, casi sin ningún cambio, en R n
para cualquier n. En efecto, la única modificación que consideraremos es la ampliación de la
noción de invarianza por traslación que se traduce, en este caso, a la invarianza por isometrías,
es decir, una medida m : P (R ) → [0, +∞] es invariante por isometrías si m( A) = m( ϕ( A))
para cualquier isometría ϕ : R n → R n . Recordemos que el grupo de la isometrías en R n está
compuesto por todas las transformaciones geométricas formadas por traslaciones, rotaciones y
reflexiones que no alteran las distancias de un conjunto. Hemos visto que la numerabilidad
aditiva, así como la invarianza por traslación de la medida de Lebesgue µ son los responsables,
con la colaboración del Axioma de Elección, de la no existencia de una extensión universal de µ.
También, en la sección anterior descubrimos que si se abandona el requerimiento de la invarianza
por traslación, entonces la única extensión continua que se obtiene sobre R es la nula siempre que
la Hipótesis del Continuo esté presente. Ahora veremos qué ocurre si se omite la numerabilidad
aditiva pero se mantiene la invarianza por isometrías. Estas consideraciones nos conducen a
analizar las siguientes dos posibilidades: suponer, o bien la aditividad finita, o la κ-aditividad o
aditividad no-numerable. Veamos el primer caso, es decir, intentaremos encontrar, en lugar de
una medida numerablemente aditiva, una “medida finitamente aditiva” definida sobre P (R ) que
extienda a µ, con el requerimiento adicional de ser invariante por isometrías, en otras palabras,
¿existe una extensión universal finitamente aditiva e invariante por isometrías de la medida de Lebesgue
en R n , es decir, ¿se puede determinar la existencia una función de conjuntos m que cumpla:
( β1 ) 0 ≤ m( A) ≤ +∞ para todo A ⊆ R n .
( β2 ) m( Q) = µ( Q) para cualquier paralelepípedo Q ⊆ R n .
( β3 ) ma es invariante por isometrías.
( β4 ) ma es finitamente aditiva?
Este problema es conocido como El Problema de la Medida de Hausdorff y posee dos respuestas
que son realmente sorprendentes pues depende de la dimensión n del espacio. En efecto, en
1914, Felix Hausdorff (1869-1942), un astrónomo Judío-Alemán a quien no le incomodaba usar el
Axioma de Elección, estudió en gran profundidad dicho problema demostrando que si n ≥ 3,
entonces no existía ninguna extensión universal finitamente aditiva e invariante por isometrías de
la medida de Lebesgue en R n . De hecho, Hausdorff, con la complicidad del Axioma de Elección,
demuestra que existe una descomposición de la superficie de una esfera de radio 1 (en R3 ) en
cuatro conjuntos A, B, C y D con las siguientes propiedades: D es numerable, A ≡ B ≡ C y
A ≡ ( B ∪ C ) (≡ significa que los conjuntos son congruentes entre sí, es decir, existe una biyección
isométrica entre ellos). Por consiguiente, si existiese una función de conjuntos λ que satisfaga
las condiciones (α1 ), (α2 ), (α3 ) y (α4 )′ se tendría que la medida de D sería λ-nula y que
m( A) = m( B) = m(C ) =
1
3
y
m( A) = m( B ∪ C ) =
1
2
lo que conduciría a una contradicción. Esta descomposición será conocida posteriormente, gracias
a Borel, como la Paradoja de Hausdorff. Sin embargo, a Hausdorff le fue imposible resolver dicho
problema para n = 1 y n = 2.
La investigación de Hausdorff fue continuada por el joven matemático polaco Stefan Banach
quien también era, al igual que la mayoría de los matemáticos polacos, partidario de usar el
Axioma de Elección sin limitaciones. Banach demostró, en 1923, con la ayuda del Principio del
Sec. 6.6 Notas Breves sobre El Problema de la Medida
351
Buen-Orden, equivalente al Axioma de Elección, que El Problema de la Medida de Hausdorff
posee solución positiva en los espacios R y R2 . Esto significa que en R y R2 la medida
de Lebesgue no es la única medida que es finitamente aditiva, normalizada e invariante por
isometrías. Este hermoso resultado de Banach parece ser el único mejoramiento razonable de la
medida de Lebesgue. Sin embargo, como afirma K. Cielsielski en [34]: “si queremos mantener la
Teoría de la Medida de Lebesgue uniforme para todas las dimensiones, no podemos aceptar la
solución de Banach sobre R2 como la mejor solución al Problema de la Me