Introducción a los tensores Andrés Macho Ortiz Agosto 2015 Introducción a las herramientas matemáticas para la formulación de ecuaciones generalmente covariantes (v1) Este documento es una introducción con carácter divulgativo a los fundamentos matemáticos básicos empleados por Albert Einstein para la formulación de la teoría de relatividad general. La mayoría de ellos se pueden emplear en otros campos como la óptica no lineal o la teoría de cuerdas, donde muchas expresiones deben tener el carácter de covarianza general, es decir, sus expresiones no deben depender del sistema de referencia escogido. Las herramientas matemáticas que permiten enunciar ecuaciones y leyes físicas comunes a todos los sistemas de referencia son los TENSORES CONTRAVARIANTES y COVARIANTES, respectivamente. No obstante, el concepto de tensor en matemáticas es mucho más profundo ya que permite unificar bajo un mismo objeto multidimensional los conceptos de escalar, vector y matriz. El orden de un tensor será el número de subíndices (tensores covariantes) y superíndices (tensores contravariantes) necesarios para especificar sin ambigüedad una componente del mismo. Así un escalar será considerado un tensor de orden 0, un vector N-dimensional un tensor de orden 1 y una matriz N×N un tensor de orden 2. No obstante, la definición rigurosa de tensor implica determinar previamente un espacio vectorial normado a partir del cual se construirán los tensores de cualquier tipo y rango. Dotar de una norma o distancia al espacio vectorial base implica trabajar con una geometría o variedad diferenciable que en la mayoría de los casos no tiene por qué ser euclídea. En mecánica clásica y óptica no lineal (con susceptibilidad eléctrica temporalmente homogénea) el espacio vectorial es ℝ3 y se construye sobre un espacio, geometría o variedad euclídea. En la teoría de la relatividad especial, el espacio vectorial es isomorfo a ℝ4 y en la teoría general de la relatividad el espacio es tangente a una variedad lorentziana de cuatro dimensiones. En este último caso se trabaja con una geometría no euclídea y el álgebra tensorial se construye sobre una variedad riemanniana de cuatro dimensiones. La rama matemática que explica la construcción formal del álgebra de tensores sobre geometrías no euclídeas es el álgebra multilineal, desarrollada por Levi-Civita a finales del siglo XIX. Espacio, geometría o variedad euclídea La geometría euclídea (o parabólica) es el estudio de las propiedades geométricas de los espacios que cumplen los cinco postulados introducidos por Euclides: 1. 2. 3. 4. 5. Dados dos puntos se puede trazar una recta que los une Cualquier segmento puede prolongarse de manera continua en cualquier sentido Se puede trazar una circunferencia con centro en cualquier punto y de cualquier radio Todos los ángulos rectos son congruentes Postulado de las paralelas: por un punto exterior a una recta, se puede trazar una única paralela a la recta dada También es común (abusando del lenguaje mediante redundancia) decir que una geometría es euclídea si no es no euclídea, es decir, si en dicha geometría se verifica el quinto postulado de Euclides. Ello se debe a que las geometrías y espacios no euclídeos cumplen todos los postulados excepto el quinto. Evidentemente el quinto postulado solo se cumple en espacios planos, por lo que los matemáticos usan la expresión de geometría euclídea como sinónimo de geometría plana o de geometría clásica. Así pues, podemos definir un espacio euclídeo como un espacio vectorial finitamente generado dotado de un producto interno. Por lo tanto, un espacio euclídeo es considerado un espacio normado y métrico donde la aplicación distancia viene dada a través de dicho producto interno: d: n x, y n def d x, y x y, x y N x y i 1 denominada distancia euclídea. i i 2 Introducción a los tensores Andrés Macho Ortiz Agosto 2015 Espacios y geometrías no euclídeas Euclides asumió que todos sus postulados o axiomas eran autoevidentes y por tanto no requerían demostración. Sin embargo, resultó que el quinto postulado, siendo compatible con los otro cuatro, es independiente de estos. Es decir, tanto el quinto postulado como la negación del quinto postulado, son compatibles con los otros cuatro postulados. Por lo tanto, es posible construir nuevas geometrías donde los cuatro primeros postulados sean válidos y el quinto postulado no se cumpla. Son las denominadas geometrías no euclídeas. Para Euclides y los geómetras anteriores al siglo XIX pasó inadvertida la posibilidad de geometrías no euclídeas. Sin embargo, Nikolái Ivánovich Lobachevski, Johann Carl Friedrich Gauss y Georg Friedrich Bernhard Riemann, al intentar demostrar que el quinto postulado se podía deducir de los cuatro primeros, se encontraron con nuevas geometrías construidas sobre un bloque axiomático formado por los cuatro primeros postulados y la negación del quinto. Durante las siguientes décadas del siglo XIX se consideró a las geometrías no euclídeas una herramienta matemáticamente de interés teórico pero de utilidad práctica cuestionable. Se tenía la concepción equivocada de que la geometría que describía el universo era intrínsecamente euclídea y, por tanto, las geometrías no euclídeas no eran descripciones realistas del universo. Sin embargo, el trabajo de Albert Einstein hizo ver que entre las necesidades de la física moderna están las geometrías no euclídeas. Einstein demostró la necesidad de una geometría no euclídea para describir el tejido espacio-temporal intrínsecamente curvo del universo. Posteriormente, a partir de 1960 las geometrías no euclídeas jugaron un papel fundamental durante el estudio de la teoría de cuerdas. Como definición formal, se denomina geometría no euclídea, a cualquier forma de geometría cuyos postulados y propiedades difieren en alguno o varios puntos de los establecidos por Euclides. La mayoría de las geometrías no euclídeas se consideran casos particulares de una geometría riemanniana general, en la cual se asume que en regiones infinitesimales dicha geometría es euclídea. La mayoría de geometrías no euclídeas derivadas de la geometría riemanniana general resultan ser no homogéneas: algunas de las propiedades del espacio (como por ejemplo el valor de su curvatura) pueden diferir de un punto a otro. Para el estudio de estas geometrías, Riemann introdujo el formalismo del tensor de curvatura y demostró que la geometría euclídea, la geometría hiperbólica y la geometría elíptica son casos particulares de geometrías riemannianas con valores constantes del tensor de curvatura. Mientras que en la geometría euclídea se satisfacen los cinco postulados de Euclides con curvatura cero, en la geometría hiperbólica y elíptica se satisfacen solo los cuatro primeros postulados y se niega el quinto, siendo la curvatura negativa en el primer caso y positiva en el segundo, tal y como muestra la Fig. 1. Un ejemplo claro de geometría elíptica sería la superficie terrestre. En ella, el equivalente de la recta euclídea (distancia mínima entre dos puntos) sería la geodésica (arco contenido en la circunferencia de radio máximo). Se hace evidente pues que el quinto postulado no se cumple en esta geometría, dado que por un punto exterior a una geodésica no se puede trazar otra geodésica que no corte a la primera. Fig. 1. Tres tipos de geometrías homogéneas posibles con tensor de curvatura constante: la geometría hiperbólica de curvatura negativa, la geometría euclídea de curvatura nula y la geometría elíptica de curvatura positiva. A diferencia que en las geometrías hiperbólica y elíptica, en una geometría riemanniana general el tensor de curvatura puede tomar valores variables a lo largo de diferentes puntos de dicha geometría. Eso hace que la geometría sea considerada no homogénea en el espacio permitiendo distinguir unos puntos de otros. Esta propiedad es fundamental en la teoría de la relatividad general, ya que en principio es posible establecer mediciones de distancias y ángulos que permitan distinguir unos puntos de otros en el universo. En la geometría de Riemann general se estudian variedades diferenciales con la métrica de Riemann, considerando a ésta como una aplicación que a cada punto de la variedad le asigna una forma cuadrática definida positiva en su espacio tangente, aplicación que varía suavemente de un punto a otro, tal y como se Introducción a los tensores Andrés Macho Ortiz Agosto 2015 muestra en el ejemplo de la Fig. 2. La métrica de Riemann permite definir los conceptos locales de ángulo, longitud de curvas y volumen entre otros. A partir de la definición de estos conceptos geométricos, pueden obtenerse otras magnitudes indirectas por integración de las magnitudes locales básicas, como el gradiente de funciones y divergencia y rotacional de campos vectoriales. Fig. 2. Ejemplo de variedad de Riemann bidimensional con un sistema de coordenadas ortogonales definido sobre ella, y varias subvariedades curvas de la misma. Definición informal de tensor y relación con los espacios no euclídeos Sin intentar realizar una definición formal, sino meramente intuitiva, un tensor [B] de rango M es una matriz M-dimensional que se construye a partir de M vectores N-dimensionales (tensores de rango 1): i M k 1 j i 1 B1i12......Mi A k A j ; 1 ,..., M 1, 2,..., N M Cada vector N-dimensional Aαk o Aαj requiere ser construido a partir de un E 𝕂-e.v. finitamente generado con dim (E) = N, dotado de una aplicación distancia a través de un producto interno (producto escalar) que lo constituya como un espacio métrico completo (es decir, donde toda sucesión de Cauchy converja). Sea el espacio vectorial base euclídeo o no, debe tener asociada una métrica con la que poder definir conceptos como distancia entre dos puntos, curvatura, ángulos, áreas y volúmenes en el espacio vectorial final al que pertenece el tensor [B], construido a través del producto tensorial de M espacios vectoriales normados. Por lo tanto, podemos definir a los tensores como aplicaciones MULTILINEALES. Conceptos de coordenadas y bases vectoriales covariantes y contravariantes: ejemplo con un espacio vectorial de 2 dimensiones Supongamos que tenemos dos escenarios diferentes tal y como se aprecia en la Fig. 3. En la Fig. 3(a) tenemos dos bases ortonormales diferentes mientras que en la Fig. 3(b) tenemos también dos bases diferentes pero no ortonormales. Mientras que en el escenario (a) dos observadores diferentes, cada uno usando una base vectorial ortonormal distinta como referencia, perciben el vector v con el mismo módulo; en el escenario (b) los dos observadores discreparían en el valor del módulo del vector v si usan bases vectoriales no ortonormales diferentes al cambiar la métrica de sus proyecciones. v y y y (a) v y x x (b) x x Fig. 3. Bases vectoriales (a) ortonormales frente a (b) no ortonormales. Necesidad de coordenadas y vectores covariantes y contravariantes para la unificación de criterios en las observaciones del módulo del vector v en el caso (b) debido a que la métrica de las proyecciones es diferente para el observador usando el sistema de referencia rojo y el observador usando el sistema de referencia morado. Ante la necesidad de unificar el criterio de observación del módulo del vector v para ambos observadores (lo que en física podría ser la necesidad de unificar el criterio de observación de una ley determinada, por Introducción a los tensores Andrés Macho Ortiz Agosto 2015 ejemplo las ecuaciones de Maxwell), surgen los conceptos de bases vectoriales y coordenadas covariantes y contravariantes. Éstas permiten extender las herramientas de producto escalar (o producto interno) y proyecciones (coordenadas) a bases no ortonormales de manera que observadores con sistemas de referencia diferentes puedan coincidir en el valor del módulo del vector v . Veámoslo analíticamente para el caso 3D. Si partimos de una base vectorial de ℝ3 ℝ-e.v. cualquiera, que no tiene por qué ser ortonormal, la cual denominaremos base contravariante, y la denotamos como: BContrav BC eˆ1 , eˆ 2 , eˆ3 La base vectorial dual covariante se construye así: BCov eˆ 2 eˆ3 eˆ3 eˆ1 eˆ1 eˆ 2 BC eˆ1 1 2 3 , eˆ2 1 2 3 , eˆ3 1 2 3 eˆ , eˆ eˆ eˆ , eˆ eˆ eˆ , eˆ eˆ cumpliendo que: 1 i j eˆi , eˆ j i j 0 i j donde δi j es la delta de Kronecker. Así pues, las coordenadas contravariantes y covariantes del vector v vendrían dadas de la forma habitual por el producto escalar: v i vi proyL eˆi v proyLeˆi v métrica definida por producto escalar métrica definida por producto escalar v , eˆi eˆi , eˆi v , eˆi eˆi , eˆi siendo L{·} el operador de variedad lineal. Por lo tanto, podemos expresar de forma dual el vector v como (convenio de suma de Einstein): v vi eˆi v vi eˆi con i =1,2,3. Así el módulo del vector v será percibido de la misma manera para ambos observadores: v v, v vi eˆi , v j eˆ j vi v j eˆi , eˆ j vi v j i j En el caso en que los sistemas de referencia de los observadores se construyan a partir de bases vectoriales ortonormales en un espacio euclídeo, no será necesario usar los criterios de bases y coordenadas covariantes y contravariantes ya que ambas bases coincidirán. Usando las matrices de cambios de base (las cuales serán en ese caso ortogonales) se puede llegar a un criterio unificado en las observaciones de los observadores respecto al módulo del vector v . Tensores contravariantes Trabajando sobre un espacio vectorial base E 𝕂-e.v. completo de dimensión N, supongamos dos sistemas de referencia diferentes R y R' formados a partir de dos bases vectoriales no necesariamente ortonormales. R O; xˆ1 ,..., xˆ N R O; xˆ1,..., xˆN Si además suponemos el espacio vectorial E dotado con una aplicación métrica dada por un producto interno, siendo la geometría asociada una variedad riemanniana general diferenciable, podemos relacionar los diferenciales espaciales (en cada dirección) entre R y R' usando la regla de la cadena: Introducción a los tensores Andrés Macho Ortiz Agosto 2015 x1 x1 x1 dx1 x dx1 x dx2 ... x dxN 1 2 N x x x dxN N dx1 N dx2 ... N dxN x1 x2 xN x1 dx1 x1 dxN xN x1 x1 x2 x1 xN dx1 xN dxN xN xN x2 o en notación compacta: dx x 2 dx ; , 1,..., N x (1) Es decir, el cambio de sistema de referencia lo realizamos a través de un conjunto de N ecuaciones lineales. La matriz de cambio de base no tiene por qué ser ortogonal en este caso dado que no hemos supuesto condición de ortonormalidad en las bases R y R'. N-vectores o tensores de rango 1 contravariantes Definimos como N-vector contravariante o tensor de rango 1 contravariante a cualquier vector N-dimensional que siga la misma ley de transformación de Ec. (1) entre los sistemas de referencia R y R': A M RR A ; , 1,..., N 2 o en notación compacta: A x 2 A ; , 1,..., N x (2) notando el carácter contravariante del tensor en el super-índice por convenio. Tensores de rango M contravariantes Dados dos tensores de rango 1 contravariantes, denotados de forma matricial [Aμ] y [Bυ] o mediante sus coordenadas respecto la base R, Aμ y Bυ siendo (μ,υ) ∈{1,…,N}2, podemos construir el tensor contravariante de rango 2: C A B T o bien: C A B (3) si usamos notación compacta. De esta manera, podemos extrapolar la ley de construcción de la Ec. (3) a un tensor contravariante de rango M usando M tensores contravariantes de rango unidad: A1 M A1 M A M Ak ; k 1, , N (4) k 1 La ley de transformación de los tensores contravariantes entre los dos sistemas de referencia considerados R y R' es de fácil deducción usando la Ec. (2). Siendo el tensor contravariante de rango M, con coordenadas A´β1…βM respecto R', lo podemos relacionar con su tensor contravariante equivalente en el sistema R como: A1 M M M x k k 1 k 1 x k Ak M x A k k k 1 x k M M x k A s s 1 k 1 x k cumpliéndose Ec. (5): 1 , , M , 1 , , M 1, , N 2M A 1 M (5) Introducción a los tensores Andrés Macho Ortiz Agosto 2015 Tensores covariantes N-vectores o tensores de rango 1 covariantes Decimos que un N-vector o tensor de rango 1 [Aυ] tiene carácter covariante sii para cualquier N-vector contravariante [Bυ] que escojamos se cumple: i) [Aυ]· [Bυ] = invariante (escalar) ii) Aυ· Bυ = invariante (escalar) siendo ii) el equivalente de i) usando notación indicial compacta. El carácter covariante de un tensor lo denotaremos describiendo sus coordenadas con sub-índices. Es decir, como definición estricta podemos establecer: def A covariante A B invariante, B , E 1, , N A partir de la definición de tensor covariante podemos sacar su ley de transformación entre los sistemas de referencia R y R'. Considerando la dupla de N-vectores covariantes: A , A L R L R siendo L el operador de variedad lineal y denotando así que el primer N-vector escribe sus coordenadas respecto al sistema de referencia R y el segundo respecto al sistema de referencia R'. Por definición de covarianza se cumple entonces que: B A B A , B , B , , L R L R 1, , N 2 (6) Usando la inversa de la ley de transformación dada por Ec. (2) podemos escribir Bυ como: B x B x Luego Ec. (6) se convierte en: x x B A B A B A B A x x (7) y finalmente obtenemos la ley de transformación para los tensores covariantes de rango 1: A x A x (8) Observe el lector que la derivación de esta ley de transformación se ha realizado en notación compacta. Esto implica que en dicha demostración se ha realizado un intercambio de sumatorios en las variables mudas υ y σ que ha quedado embebido en la propia notación en la Ec. (7): N N N N x B A B A B A B A 1 1 1 1 1 x N N N x B A B A 1 1 1 x N N x B A 1 1 x N N B A 1 N N N x B A B A 1 1 1 x N x A A 1 x Introducción a los tensores Andrés Macho Ortiz Agosto 2015 La notación indicial permite ahorrar tiempo razonando operaciones que son triviales: la propiedad distributiva del producto de 𝕂 respecto de la suma de 𝕂 y la propiedad conmutativa de la suma de 𝕂. No obstante, si en alguna derivación se abre la posibilidad de crear confusión con la notación indicial, se puede volver a usar la notación clásica de sumatorios siempre que se indique previamente. Tensores de rango M covariantes Dados dos tensores covariantes de rango 1 respecto el sistema de referencia R, denotados de forma matricial [Aμ] y [Bυ] o mediante notación compacta Aμ y Bυ siendo (μ,υ) ∈ {1,…,N}2, podemos construir el tensor covariante de rango 2: C A B T o bien: C A B (9) si usamos notación compacta. Adicionalmente, podemos extrapolar la ley de construcción de la Ec. (9) a un tensor covariante de rango M usando M tensores covariantes de rango unidad: A1 A1 M M A M Ak ; k 1, , N (10) k 1 La ley de transformación de los tensores covariantes entre los dos sistemas de referencia considerados R y R' es de fácil deducción usando la Ec. (8). Siendo el tensor covariante de rango M con coordenadas A'β1…βM respecto a R', lo podemos relacionar con su tensor covariante equivalente en el sistema R como: A1 M M M k 1 k 1 A k M x A k k k 1 x x k k x k M M x A s k s 1 k 1 x k A1 M (11) cumpliéndose Ec. (11): 1 , , M , 1 , , M 1, , N 2M Tensores mixtos Dado un tensor covariante [Aμ] y otro tensor contravariante [Bυ] de un espacio vectorial E, ambos de rango 1 y siendo (μ,υ) ∈{1,…,N}2, podemos construir el tensor mixto de rango 2: C A B T usando el producto tensorial externo, el cual puede ser reescrito con notación compacta como: C A B (12) Se dice entonces que el tensor mixto Cμυ es covariante respecto a μ y contravariante respecto a υ. Así pues, haciendo uso de Ec. (12) podemos construir tensores mixtos de rango M+P con M índices de carácter covariante y P índices de carácter contravariante procedentes de M N-vectores covariantes y P N-vectores contravariantes: C11 P M A1 A M B 1 M P i 1 j 1 B P Ai B j (13) La ley de transformación de tensores mixtos entre los sistemas de referencia R y R' es de fácil deducción usando las Ecs. (2) y (8). Siendo [C] y [C'] tensores mixtos duales en R y R', con rango M+P, ambos quedan relacionados mediante la ley de transformación: M P M x P x j j C11 MP Ai B j i Ai B j 1 x i 1 j 1 i 1 xi j Introducción a los tensores Andrés Macho Ortiz Agosto 2015 Usando la propiedad conmutativa del producto de escalares (recordemos que las coordenadas son escalares del cuerpo 𝕂 sobre el que se construye el espacio vectorial base E): M P x x j j M P xi x j C11 MP i Ai B Ai B j x x i 1 j 1 xi x j i 1 j 1 i j M P xi x j i 1 j 1 xi x j j i C M x i i 1 x i P x j j 1 x j C11 (14) P M Transformaciones Transformaciones covariantes contravariantes cumpliéndose Ec. (14): 1 , , M , 1 , , P 1, , N M P Simetría y antisimetría Simetría Dado un tensor covariante o contravariante de rango M, se dice que dicho tensor es simétrico respecto a los índices αk−1 y αk si las componentes del tensor no cambian al intercambiar de orden dichos índices: A1 , , k 1 , k , k 1 , , M B1 , , k 1 , k , k 1 , , M A1 , , k , k 1 , k 1 , , M B1 , , k , k 1 , k 1 , , M Un tensor mixto es simétrico respecto a dos subíndices si el tensor covariante que aporta dichos subíndices es simétrico respecto a ellos. De forma similar, podemos definir que un tensor mixto es simétrico respecto a dos superíndices si el tensor contravariante que aporta dichos superíndices es simétrico respecto a ellos. Y finalmente, decimos que un tensor mixto es simétrico respecto a un subíndice y un superíndice si al intercambiarlos la nueva componente tensorial coincide con la inicial. Por otro lado, dado un tensor covariante, contravariante o mixto de rango M¸ se dice que dicho tensor es simétrico si el intercambio de orden de dos índices cualesquiera no altera el valor de su componente. Por (3) ejemplo, la susceptibilidad eléctrica de tercer orden 𝜒𝑖𝑗𝑘𝑙 es simétrica respecto a j,k,l en medios dieléctricos isótropos: 3 3 3 3 3 3 ijkl ijlk iljk ilkj iklj ikjl y es simétrica respecto a todos sus subíndices exclusivamente en los medios dieléctricos isótropos no dispersivos: 3 3 ijkl ijlk jilk 3 La simetría de un tensor (covariante, contravariante o mixto), tal y como la hemos definido, es independiente del sistema de referencia en el que trabajemos. Si se cumple en R se cumple en R'. Para demostrar esta proposición a la vez en tensores covariantes, contravariantes y mixtos de cualquier rango, podemos plantear un tensor mixto de rango M+P con simetría en dos subíndices (γi−1 y γi) y dos superíndices (δj−1 y δj) cualesquiera. Supongamos que se cumple en el sistema de referencia R la condición: , , j 1 , j , j 1 , , P , i 1 , i , i 1 , , M C11, , , j , j 1 , j 1 , , P , i , i 1 , i 1 , , M C11, Entonces según la ley de transformación de tensores mixtos Ec. (14) se cumple en R' que: , , j 1 , j , j 1 , , P , i 1 , i , i 1 , , M C1 ,1 Usando Ec. (15): M x k k 1 x k P x n n 1 x n 1 , C1 , , j 1 , j , j 1 , , P , i 1 , i , i 1 , , M (15) Introducción a los tensores , , j 1 , j , j 1 , , P , i 1 , i , i 1 , , M C1 ,1 x 1 x 1 M x k k 1 x k Andrés Macho Ortiz Agosto 2015 P x n n 1 x n x i x i1 x i1 x i x i1 x i1 1 , C1 , , j , j 1 , j 1 , , P , i , i 1 , i 1 , , M x M x 1 x M x1 x j x j1 x j1 x j x j1 x j1 x P 1 , C , x P 1 , j , j 1 , j 1 , , P , i , i 1 , i 1 , , M , , j , j 1 , j 1 , , P , i , i 1 , i 1 , , M C1 ,1 Luego podemos ver que la simetría también se cumple en R' para tensores covariantes, contravariantes y mixtos. Antisimetría Dado un tensor covariante o contravariante de rango M, se dice que dicho tensor es antisimétrico respecto a los índices αk−1 y αk si las componentes del tensor son iguales y de signo opuesto (inversas respecto de la suma del cuerpo 𝕂) al intercambiar de orden dichos índices: A1 , , k 1 , k , k 1 , , M B1 , , k 1 , k , k 1 , , M A1 , B1 , , k , k 1 , k 1 , , M , k , k 1 , k 1 , , M Un tensor mixto es antisimétrico respecto a dos subíndices si el tensor covariante que aporta dichos subíndices es antisimétrico respecto a ellos. De forma similar, podemos definir que un tensor mixto es antisimétrico respecto a dos superíndices si el tensor contravariante que aporta dichos superíndices es antisimétrico respecto a ellos. Y finalmente, decimos que un tensor mixto es antisimétrico respecto a un subíndice y un superíndice si al intercambiarlos la nueva componente tensorial es la opuesta de la inicial (inversa respecto de la operación suma del cuerpo 𝕂). Por otro lado, dado un tensor covariante, contravariante o mixto de rango M¸ se dice que dicho tensor es antisimétrico si el intercambio de orden de dos índices cualesquiera altera solo el signo de la componente. A igual que la simetría, la antisimetría es una propiedad independiente del sistema de referencia. Si se cumple en R se cumple en R'. La demostración es similar a la de la simetría, por lo que no a repetiremos y la dejamos como ejercicio para el lector. Proposición: Siendo [A] ≠ [0] un tensor antisimétrico de rango M construido a partir de un espacio vectorial base E completo de dimensión N, se cumple que: i) Si M > N entonces [A] no puede ser antisimétrico ii) Si M ≤ N entonces habrá N!/(N−M)! componentes no nulas, siendo NM el número de componentes del tensor Demostración: La demostración de ambas afirmaciones es muy simple dado que debido a la definición de antisimetría solamente podemos formar componentes no nulas cuando los índices tienen todos diferentes valores. Luego: Si el número de índices M supera el número de posibles valores que pueden tomar {1,2,…,N} entonces siempre encontraremos en cualquier componente del tensor [A] al menos dos índices que repetirán valor, lo que convertirá a todas las componentes en nulas debido a la antisimetría, lo que nos lleva a un absurdo o contradicción con la hipótesis dado que [A] ≠ [0], de lo que se deduce (i). ii) Si M ≤ N entonces el número de componentes no nulas son aquellas cuyos índices toman todos valores diferentes. Así pues, el número de componentes tensoriales no nulas será igual al número de combinaciones posibles de N elementos diferentes tomados de M en M sin repetición y donde importa el orden. Luego por teoría combinatoria deducimos que el número de componentes no nulas será N!/(N−M)!. Adicionalmente, el número de componentes de un tensor es igual al número de combinaciones posibles que puedo formar con N elementos diferentes tomados de M en M donde importa el orden y se pueden repetir, es decir, por teoría combinatoria NM. i) Introducción a los tensores Andrés Macho Ortiz Agosto 2015 Ejercicio: Sea un tensor covariante [Aijk] antisimétrico de rango 3 construido a partir de un espacio vectorial base de dimensión 3. Determine cuáles y cuantas componentes tensoriales son nulas y proponga una expresión del tensor completo en función de un escalar β ≠ 0 para las no nulas. Efectivamente sabemos que N = 3 y M = 3, luego el número de componentes tensoriales que podemos formar del tipo Aijk será 33 = 27. Por la definición de antisimetría sabemos que: Aijk Aikj Akij Akji Ajki Ajik ; i, j , k 1, 2,3 Luego cumpliéndose que Aijk = − Aikj determinamos que si j = k entonces Aikk = − Aikk = 0, lo que nos lleva a que las siguientes componentes serán nulas: A111 , A122 , A133 ; A211 , A222 , A233 ; A311 , A322 , A333 Adicionalmente si Aijk = − Akji con i = k entonces Akjk = − Akjk = 0, lo que nos lleva a que las siguientes componentes serán nulas: A212 , A313 , A121 , A323 , A131 , A232 Y finalmente si Aijk = − Ajik con i = j entonces Aiik = − Aiik = 0, lo que nos lleva a que las siguientes componentes serán nulas: A112 , A113 , A221 , A223 , A331 , A332 Luego hemos encontrado 9+6+6 = 21 componentes nulas. Se verifica que las únicas componentes no nulas son aquellas que tienen índices de diferente valor, es decir: A231 , A321 ; A132 , A312 ; A123 , A213 Cumpliendo por antisimetría que: A231 A321 A123 A213 A312 A132 Por lo tanto, la expresión final del tensor covariante antisimétrico de rango 3 será siguiendo la representación multi-matriz tipo cubo de Levi-Civita: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Es decir, el tensor [A] es proporcional al tensor de Levi-Civita: Aijk ijk Tal y como hemos visto, descubrir propiedades de simetría o antisimetría en tensores de alto orden es muy útil para simplificar el estudio teórico de distintos fenómenos físicos ya que permite obtener diferentes relaciones entre las componentes de un tensor o anularlas directamente. Operaciones básicas: producto externo, contracción, producto interno y producto mixto Producto tensorial externo Sin ser conscientes de ello, el producto externo de tensores ya se ha utilizado para la construcción de tensores covariantes, contravariantes y mixtos a partir de tensores de rango unidad en las Ecs. (3), (4), (9), (10), (12) y (13). El producto externo de tensores se puede definir como una aplicación que transforma un tensor de rango N y un tensor de rango M en un tensor de rango N+M. La operación solo es válida si involucra tensores que comparten el mismo espacio vectorial base E. Así por ejemplo, los tensores T surgen a partir del producto tensorial externo de los tensores [A] y [B] de diferente tipo y orden: Introducción a los tensores Andrés Macho Ortiz Agosto 2015 T A B T A B T A B El producto tensorial externo goza de la propiedad conmutativa y distributiva respecto de la suma (siempre que esta última se realice entre tensores del mismo sistema de referencia) y goza de elemento neutro (tensor del mismo rango y tipo que el otro tensor involucrado en el producto tensorial y cuyas componentes toman el valor del elemento neutro del producto del cuerpo 𝕂). Contracción tensorial Se define la operación tensorial simple como la aplicación que coge un tensor mixto de rango M y forma un tensor de rango M − 2 igualando un índice de carácter covariante con otro de carácter contravariante y sumando respecto a dicho índice. El siguiente esquema muestra los pasos de operación de una contracción simple aplicada a un tensor de rango 4: T T convertimos índice en dummy N T T T T 1 1 1 2 2 3 3 TNN T Como podemos ver en el ejemplo anterior, hemos pasado de un tensor mixto de rango 4 a uno de rango 2. Si aplicamos una contracción simple adicional obtendremos un invariante (o escalar): N T T T T 1 Estos dos pasos se pueden agrupar en uno solo mediante una contracción doble: N N 11 T T T T T T11 1 1 T11NN T2121 T22NN TNN11 NN TNN Una de las múltiples utilidades de la contracción es poder escribir un invariante o escalar como un tensor mixto de rango par: A A A A A Esta posibilidad nos permite demostrar de forma directa que el producto de un escalar por un tensor de rango M se obtiene multiplicando dicho escalar por todas las componentes del tensor: A B1k 1 k M A B1k 1 k M T1 k 1 k M T1 k 1 k M Esto último resulta trivial si se razona que un escalar se puede clasificar como un tensor de rango cero, dado que así el producto de un escalar por un tensor se convierte en un caso particular de producto tensorial con rango final 0+M. Producto tensorial interno El producto tensorial interno es la extrapolación multidimensional del producto interno de vectores. Involucra un producto externo seguido de una contracción simple. Veamos dos ejemplos: D A B D D D A B D D Proposición: Si Bμ y Cυ son vectores cualesquiera (contravariantes o covariantes) y Aμυ· Bμ· Cυ es invariante, entonces Aμυ es un tensor covariante respecto ambos índices. Esta afirmación se puede extrapolar a tensores de rango M. Demostración: Evidentemente si Bμ y Cυ son vectores cualesquiera, entonces para cualquier dupla de vectores contravariantes (Bμ,Cυ) se cumple que Aμυ·Bμ·Cυ = invariante por hipótesis. Siendo Bμ·Cυ = Dμυ un Introducción a los tensores Andrés Macho Ortiz Agosto 2015 vector contravariante de rango 2, entonces Aμυ·Bμ·Cυ = Aμυ·Dμυ = invariante. Como Dμυ puede ser cualquier tensor contravariante construido a través de Bμ y Cυ (vectores que podemos elegir libremente), entonces por definición de covarianza determinamos que Aμυ tiene carácter covariante respecto a ambos índices. La extrapolación de la proposición anterior a tensores de rango M se puede demostrar por inducción a partir de la demostración realizada. Proposición: Si Bμ es un vector cualquiera y Aμυ·Bμ·Cυ es invariante siendo el tensor Aμυ simétrico, entonces Aμυ tiene carácter covariante respecto a ambos índices. Demostración: Si Aμυ·Bμ·Cυ = invariante, entonces (Aμυ·Cυ)·Bμ = invariante para cualquier vector Bμ por hipótesis. Luego el tensor del paréntesis (Aμυ·Cυ) es covariante respecto al índice μ. Como Aμυ·Cυ solo tiene dependencia de μ en el tensor Aμυ, entonces Aμυ debe ser covariante respecto a μ, el primer índice. Y como además es simétrico, podremos intercambiar índices de orden sin que afecte al valor de las componentes, luego Aμυ = Aυμ y por lo tanto la covarianza también estará implícita en el índice υ.