Electromecánica

Electromecánica Prof. Dr. Francisco Javier Gil Chica Octube de 2012 1 2 I Repaso de Cálculo 1 Integrales de camino 1.1 Formas de la integral de camino Una integral de camino en dos dimensiones tiene la forma: P (x, y)dx + Q(x, y)dy (1) P (x, y, z)dx + Q(x, y, z)dy + R(x, y, z)dz (2) y en tres dimensiones: Z Z Sin pérdida de generalidad y para aligerar notación, restringimos la discusión al caso bidimensional. En (1), x e y no son independientes, sino que existe una relación funcional entre ellas de la forma y(x). Si la curva y(x) está dada en forma paramétrica mediante un par de relaciones x = ϕ(t) y = ψ(t) (3) entonces la integral de camino se reduce a una integral ordinaria Z [P (ϕ(t), ψ(t))ϕ′ (t) + Q(ϕ(t), ψ(t))ψ ′ (t)]dt (4) Ejemplo: calcular α= Z (2,0) (0,2) xydx (5) a lo largo de la lı́nea que une el punto (2, 0) con el punto (0, 2). Solución: la ecuación de la recta es y = 2 − x, de manera que α= En forma paramétrica: Z x=0 x=2 x(2 − x)dx = − x = t y = 2−t 3 4 3 (6) (7) y 4 (8) 3 t=0 Parece que no hay ventaja alguna en la representación paramétrica, pero si elegimos para integrar el arco de circunferencia en el primer cuadrante que une el punto (2, 0) con el punto (0, 2), entonces la representación paramétrica se vuelve ventajosa, porque el arco viene dado por α= Z t=2 t(2 − t)dt = − x = 2 cos t y = 2 sin t (9) donde t varı́a entre 0 y π/2 y 8 (10) 3 t=0 Obsérvese, de entrada, que la integral de camino depende de la trayectoria elegida. Otra forma para las integrales de camino es α= Z t=π/2 2 cos t × 2 sin t × (−2) sin tdt = − α= Z B A g(x, y)ds (11) donde ds es un diferencial del camino que une A y B. Del teorema de Pitágoras: ds = con lo cual q q (dx)2 + (dy)2 = dx 1 + (y ′ )2 α= Z B A q g(x, y) 1 + (y ′ )2 dx (12) (13) Si el camino se da en forma parametrizada: x = ϕ(t) y = ψ(t) (14) entonces dx = ϕ′ dt, dy = ψ ′ dt y ds = con lo que α= Z B A q (ϕ′ )2 + (ψ ′ )2 dt (15) q (16) g(ϕ(t), ψ(t)) (ϕ′ )2 + (ψ ′ )2 dt 4 1.2 Trabajo El trabajo que una fuerza desarrolla al mover un punto a lo largo de una trayectoria viene dado por una integral de camino: T = Z B A F̄ .dr̄ (17) donde F̄ = Fx (x, y, z)î + Fy (x, y, z)ĵ + Fz (x, y, z)k̂ y dr̄ = dxî + dy ĵ + dz k̂. Ejemplo: calcular el trabajo de una fuerza aplicada a un punto que se mueve en el arco de circunferencia que une los puntos (0, 2) y (2, 0), cuya dirección apunta siempre a (2, 0) y cuyo módulo es proporcional a la distancia a (2, 0), con constante de proporcionalidad k. Solución: la fuerza se expresa como F̄ = kū, donde ū es el vector (2 − x)î − y ĵ. Entonces T =k Z (2,0) (0,2) (2 − x)dx − ydy (18) Usando la forma paramétrica para la trayectoria x = 2 sin t y = 2 cos t (19) tenemos T = 4k 1.3 "Z t=π/2 t=0 (1 − sin t) cos tdt + Z t=π/2 t=0 # cos t sin tdt = 4k (20) Independencia del camino Es importante el caso en que la integral de camino tiene el mismo valor independientemente de la trayectoria elegida. Es lo que ocurre en los llamados ”campos conservativos”. La integral de camino depende entonces sólo de los puntos inicial y final de la trayectoria. ¿En qué condiciones ocurre esto? Demostraremos que la condición necesaria y suficiente para que la integral de camino α= Z B A P (x, y)dx + Q(x, y)dy (21) dependa únicamente de A y B es que ∂P ∂Q = ∂y ∂x 5 (22) Necesidad: Si existiese una z(x, y) tal que dz = ∂z ∂z dx + dy = P (x, y)dx + Q(x, y)dy ∂x ∂y (23) es decir: ∂z = P (x, y) ∂x ∂z = Q(x, y) ∂y (24) entonces α= Z B A P (x, y)dx + Q(x, y)dy = Z B A dz = zB − zA (25) En resumen, si α es independiente del camino, significa que el integrando es un dz, lo que implica (24), lo que implica (22), ya que ∂ 2z ∂ 2z = ∂x∂y ∂y∂x (26) Z (27) Suficiencia: Llamamos f (x, y) = ası́ que, manteniendo y fija: P (x, y)dx ∂f = P (x, y) ∂x (28) ∂ 2f ∂P ∂Q = = ∂x∂y ∂y ∂x (29) de donde de donde ∂Q ∂ 2f ∂ ∂f 0= − = Q− ∂x ∂x∂y ∂x ∂y ! (30) y de aquı́ Q− ∂f = φ(y) ∂y Llamamos ahora 6 (31) z(x, y) = f (x, y) + Z φ(y)dy (32) ∂f ∂z = + φ(y) = Q(x, y) ∂y ∂y (33) de donde, de (31) y (32): y también, de (28) ∂f ∂z = ∂x ∂x P (x, y) = (34) es decir, que P (x, y)dx + Q(x, y)dy = ∂z ∂z dx + dy = dz ∂x ∂y (35) y por tanto α es independiente del camino elegido. 2 Integrales dobles Para introducir el concepto de integral doble, consideremos el problema de calcular el volumen de un prisma recto cuya base es una curva cerrada C en el plano xy. Las generatrices del prisma son paralelas al eje z. Para cada punto (x, y) del interior de C, la altura del prisma es z(x, y). El volumen del prisma es entonces la suma de los volúmenes de los prismas rectos de base cuadrangular, de lados dx y dy y alturas z(x, y), es decir: V = Z z(x, y)dxdy (36) Esta es una forma simbólica de expresar el volumen, pero no nos indica cómo efectuar el cálculo. Una forma es dividiendo el volumen en láminas de anchura dx. Entonces, para un x = constante, el area de la lámina es Z y=β y=α z(x, y)dy (37) donde los limites de integración α y β son funciones de x. De hecho, son los puntos en que la lı́nea x = constante corta a C. El volumen de la lámina es dx Z y=β y=α z(x, y)dy y el volumen total: 7 (38) Z x=η x=ξ dx Z y=β y=α z(x, y)dy (39) donde x = ξ y x = η son las tangentes a C paralelas al eje y. Es obvio también que obtenemos el mismo volumen si tomamos láminas paralelas del al eje x en lugar de láminas paralelas al eje y. En ese caso, el área de cada lámina se expresarı́a como una integral en x, con lı́mites de integración dependientes de y. Aunque hemos introducido la integral doble en relación R con un problema particular, es claro que f (x, y)dxdy es un ente matemático que no requiere de interpretación fı́sica, como tampoco la requiere la integral R f (y)dy. Ejemplo: Calcular Z 2xydxdy (40) √ sobre el recinto limitado por las curvas y = x2 , y = x, x = 0 y x = 1/2. Los pasos a seguir son: a) hacerse una representación del recinto de integración; b) obtener los lı́mites de la integral en y como función de x; c) integrar en y y d) integrar en x, que en este caso varı́a entre 0 y 1/2. Ası́, tenemos Z 2.1 x=1/2 x=0 dx "Z √ y= x y=x2 # 2xydy = Z x=1/2 x=0 dx(x2 − x5 ) = 5 128 (41) Cambio de variable Consideremos el cambio de variables x = f (u, v) e y = g(u, v). En el plano (u, v), el punto (u, v) se corresponde en el plano (x, y) con (f (u, v), g(u, v)). Por su parte, el punto (u + du, v) se transforma en ∂f ∂f du = x + du ∂u ∂u ∂g ∂g g(u + du, v) = g(u, v) + du = y + du ∂u ∂u f (u + du, v) = f (u, v) + (42) De igual forma, (u, v + dv) se transforma en ∂f ∂f dv = x + dv ∂v ∂v ∂g ∂g g(u, v + dv) = g(u, v) + dv = y + dv ∂v ∂v f (u, v + dv) = f (u, v) + 8 (43) Ası́, la región de área dudv en el plano (u, v) se transforma en un área en el plano (x, y). Este área se puede calcular como el módulo del producto vectorial de los vectores de origen (x, y) y extremos dados por las ecuaciones (42) y (43), ā y b̄ en la Figura 1, de tal manera que la relación entre las áreas elementales es ∂(f, g) dxdy = dudv ∂(u, v) (44) Figura 1 Por consiguiente, si la transformación lleva de la región S a la región D, tenemos que Z ∂(f, g) dudv z(x, y)dxdy = Z(u, v) ∂(u, v) S D Z (45) donde Z(u, v) = z(x(u, v), y(u, v)). 2.2 El teorema de Green El teorema de Green relaciona la integral de superficie con la circulación sobre el contorno de esa superficie. Establece que Z S ∂Q ∂P − ∂x ∂y ! dxdy = Z C (P dx + Qdy) (46) Demostración: Consideramos una curva γ convexa cerrada en el plano (x, y). Sea A el punto de la curva con la coordenada x = a mı́nima, B el 9 punto de la curva con la coordenada y = b mı́nima, C el de coordenada x = c máxima y D el de coordenada y = d máxima. Ası́, la curva está incrita en un rectángulo de lados c − a y d − b. Llamamos θ1 (x) a la curva ABC, y θ2 (x) a la curva ADC. Tenemos que Z γ P (x, y)dx = = Z Z x=c x=a x=c x=a P (x, θ1 (x))dx + Z x=a x=c P (x, θ2 (x))dx [P (x, θ1 (x)) − P (x, θ2 (x))]dx (47) Por otro lado Z S Z x=c Z y=θ2 (x) ∂P ∂P dxdy = dy dx ∂y x=a y=θ1 (x) ∂y = Z x=c x=a [P (x, θ2 (x)) − P (x, θ1 (x))] (48) de donde se sigue que Z γ P dx = − Z S ∂P dxdy ∂y (49) y por análogo razonamiento Z γ Qdy = Z S ∂Q dxdy ∂x (50) lo que demuestra el teorema. Ejemplo: Deseamos calcular Z C (2y 2 − x2 )dx + (3x2 − y 2 )dy (51) sobre la circunferencia y 2 + (x − a)2 = a2 , que tiene la forma paramétrica x = a(1 + cos t) y = a sin t (52) donde t varı́a entre 0 y 2π. Esta integral puede sustituirse por una de superficie, más sencilla de calcular, usando el teorema de Green. En efecto: Z 2 C 2 2 2 (2y − x )dx + (3x − y )dy = 10 Z S (6x − 4y)dxdy (53) La primera parte es Z S 6xdxdy = Z a dy −a Z x2 (y) x1 (y) 6xdx = 3 Z a h dy x2 −a ix2 (y) x1 (y) (54) √ √ con x1 (y) = a − a2 − y 2 y x2 (y) = a + a2 − y 2 , resultando finalmente 6πa3 . La integral que contiene 4y se puede comprobar que es nula. Por consiguiente, Z 3 C (2y 2 − x2 )dx + (3x2 − y 2 )dy = Z S (6x − 4y)dxdy = 6πa3 (55) Integral de superficie Se define Z F (x, y, z)dS (56) sobre una región A de la superficie z(x, y) como Z A q F (x, y, z(x, y)) 1 + zx2 + zy2 dxdy (57) Por tanto, la integral de superficie ası́ definida no es más que una integral doble, ya vista. Pero ilustremos el cálculo de este tipo de integrales con un ejemplo. Sea Z S (x2 + y 2 − 3z 2 )dS (58) sobre la superficie superior (z > 0) de la esfera x2 + y 2 + z 2 = 4. El elemento de superficie es dS = √ dxdy 4 − x2 − y 2 (59) La integral que buscamos es entonces: 8 Z y=2 y=−2 dy Z x2 (y) x1 (y) x2 + y 2 − 3 √ dx 4 − x2 − y 2 (60) Vemos que los lı́mites de integración para x dependen de y. Serı́a más sencillo si los lı́mites de cada integral fuesen independientes, lo que se consigue con el cambio a coordenadas polares (r, θ), que son ambas independientes. En polares: 11 x = r cos θ y = r sin θ (61) y el cambio de variables exige el cálculo del determinante del jacobiano, que es ∂(x, y) =r ∂(r, θ) (62) ası́ que, finalmente, calculamos Z 4 θ=2π θ=0 dθ Z r=2 r=0 8r(r2 − 3) 32 √ π = − 3 4 − r2 (63) Cálculo vectorial 4.1 Gradiente Dada una función f (x, y, z), se define el vector gradiente como grad(f ) = ∂f ∂f ∂f , , ∂x ∂y ∂z ! (64) Su interpretación es la siguiente: dada la familia de superficies f (x, y, z) = constante, el vector gradiente en el punto (x, y, z) es perpendicular a la superficie f (x, y, z) = constante a la que pertenece el punto y apunta hacia valores crecientes de c. En efecto, entre dos puntos próximos pertenecientes a la misma superficie: df = ∂f ∂f ∂f dx + dy + dz = 0 ∂x ∂y ∂z (65) es decir, que los vectores grad(f ) = ∂f ∂f ∂f k̂ î + ĵ + ∂x ∂y ∂z (66) y dr̄ = dxî + dy ĵ + dz k̂ (67) son perpendiculares, ya que su producto escalar es nulo. Pero como dr̄ se encuentra sobre la superficie, grad(f ) es perpendicular a ella. Por otro 12 lado, si P (x, y, z) es un punto que se encuentra sobre la superficie c y R(x + dx, y + dy, z + dz) un punto que se encuentra sobre la superficie c′ , en la perpendicular a c por P , entonces, si llamamos dr̄ = P R, será dr̄ paralelo al gradiente, de donde dx dy dz = = = fx fy fz q (dx)2 + (dy)2 + (dz)2 q fx2 + fy2 + fz2 =q dn fx2 + fy2 + fz2 (68) donde dn es la distancia entre las superficies c y c′ ; entonces, al pasar de q ′ 2 c a c por la perpendicular a P , sustituyendo dx = fx dn/ fx + fy2 + fz2 y análogamente para dy y dz: df = q ∂f ∂f ∂f ∂f dx + dy + dz = fx2 + fy2 + fz2 dn = dn ∂x ∂y ∂z ∂n (69) de donde se sigue que ∂f (70) ∂n Al pasar de c a c′ no a lo largo de la perpendicular, sino en una dirección que forma un ángulo θ con la perpendicular y a lo largo de un ds, entonces |grad(f )| = q fx2 + fy2 + fz2 = ∂f dn ∂f ∂f = = cos θ ∂s ∂n ds ∂n Si ŝ es la dirección de ds y n̂ la normal, ∂f ∂f ∂f = (ŝ · n̂) = ŝ · n̂ = ŝ · grad(f ) ∂s ∂n ∂n Se introduce el operador vectorial ∇ como ∇= ∂ ∂ ∂ î + ĵ + k̂ ∂x ∂y ∂z (71) (72) (73) de forma que se puede escribir grad(f ) = ∇f (74) Ejemplo: Dada la función r2 = x2 + y 2 + z 2 , calcular su gradiente. Se ve que ∂r2 = 2x ∂x y análogamente para las otras dos coordenadas, de donde 13 (75) ∇r2 = 2r̄ (76) Ejemplo: si f (r) es una función arbitraria de r = su gradiente. Se ve que √ x2 + y 2 + z 2 , calcular ∂f (r) ∂f (r) ∂r x = = f ′ (r) ∂x ∂r ∂x r y análogamente para las otras coordenadas, de donde, finalmente (77) f ′ (r) r̄ = f ′ (r)r̂ (78) r Si f1 (x, y, z) y f2 (x, y, z) son dos funciones escalares, continuas y derivables, de las reglas elementales de derivación se sigue que ∇f (r) = ∇(f1 + f2 ) = ∇f1 + ∇f2 ∇(f1 f2 ) = f2 ∇f1 + f1 ∇f2 4.2 (79) Campos vectoriales irrotacionales Un campo vectorial V̄ (x, y, z) es una función que a cada punto (x, y, z) del espacio asigna un vector de componentes (V1 (x, y, z), V2 (x, y, z), V3 (x, y, z)). La circulación de un campo vectorial sobre una curva ya la definimos implı́citamente en 1.2, ecuación (17). El trabajo es entonces la circulación de la fuerza a lo largo de la trayectoria. Para un campo vectorial cualquiera V̄ (x, y, z) a lo largo de una trayectoria C, la circulación es Z C V̄ · dr̄ (80) y si la trayectoria viene dada en la forma paramétrica (x(t), y(t), z(t)), entonces la circulación es Z β α ! dx dy dz V1 + V2 + V3 dt dt dt dt (81) donde α y β son los valores de t en los extremos de la trayectoria. Si la trayectoria es cerrada, se suele usar el sı́mbolo I 14 (82) En (1.3) demostramos la condición que debe cumplir un campo vectorial para que su circulación sea independiente del camino, aunque allı́ no habı́amos todavı́a introducido el término ”campo vectorial”. La extensión obvia al caso tridimensional de aquella condición es que sea ∂V1 ∂V2 = ; ∂y ∂x ∂V1 ∂V3 = ; ∂z ∂x ∂V2 ∂V3 = ∂z ∂y (83) Un campo vectorial se llama irrotacional si su circulación a lo largo de cualquier trayectoria cerrada es nula. Ahora demostraremos dos resultados importantes: a) si un campo V̄ es irrotacional, existe una función escalar f tal que V̄ = ∇f . b) Si f es una función escalar, su gradiente es irrotacional. Demostración de a): Elegimos como trayectoria cerrada una que va desde el punto A al punto B pasando por P y vuelve de B a A pasando por Q, de forma que I V̄ · dr̄ = Z AP B V̄ · dr̄ + Z BQA V̄ · dr̄ = 0 (84) lo que implica que Z AP B =− Z BQA = Z AQB (85) y por tanto la integral es independiente de la trayectoria. Si fijamos A, Z AB (86) es una función sólo de B, pero como dicha integral es un escalar, entonces Z AB V̄ · dr̄ = f (B) (87) Si B ′ es un punto próximo de B: de manera que Z AB ′ V̄ · dr̄ = f (B ′ ) f (B ′ ) − f (B) = df = V̄ · dr̄ (88) (89) pero sabemos que el incremento df de una función escalar entre dos puntos separados por dr̄ es ∇f · dr̄, de donde (V̄ − ∇f ) · dr̄ = 0 15 (90) y finalmente V̄ = ∇f , ya que dr̄ es arbitrario. Demostración de b): Si f es una función escalar, la circulación de su gradiente en un circuito cerrado es I ∇f · dr̄ = I df = 0 (91) Ejemplo: Dado el campo vectorial V̄ = (3x2 y + zy 2 )î + (x3 + 2xyz)ĵ + y 2 xk̂ (92) a) demostrar que es irrotacional; b) encontrar la función escalar f de la cual deriva y c) calcular su circulación entre los puntos A = (1, 2, 3) y B = (2, 4, 12) a lo largo de la curva x(t) = t y(t) = 2t z(t) = 3t2 (93) a) Para demostrar que es irrotacional, basta con derivar y comprobar que se cumplen las condiciones: ∂V1 ∂V2 = ; ∂y ∂x ∂V1 ∂V3 = ; ∂z ∂x ∂V2 ∂V3 = ∂z ∂y (94) b) de V1 = 3x2 y + zy 2 = fx se sigue que ha de ser f (x, y, z) = x3 y + zxy 2 + g(y, z) (95) Derivando respecto a y e igualando a V2 : x3 + 2xyz + ∂g = x3 + 2xyz ∂y (96) de donde se sigue que ∂g =0 ∂y (97) o g = h(z) salvo constante. Luego f (x, y, z) = x3 y +zxy 2 +h(z). Derivando respecto a z e igualando a V3 vemos que ha de ser h(z) = c, y como V̄ se obtiene de f por derivación, esa constante no tiene importancia, ası́ que, finalmente 16 f (x, y, z) = x3 y + zxy 2 (98) c) En representación paramétrica, el punto A corresponde a t = 1 y el punto B a t = 2. Entonces Z AB V̄ · dr̄ = Z ! dy dz dx + V2 + V3 dt V1 dt dt dt t=2 t=1 (99) Sustituyendo y efectuando las integrales, se obtiene el resultado Z 4.3 V̄ · dr̄ = 402 AB (100) Integral de superficie Se puede reformular ligeramente y adaptar al formato vectorial el concepto de integral de superficie presentado en la sección 4. Si un elemento de superficie lo representamos no mediante un escalar sino mediante un vector cuyo módulo es dS y cuya dirección es normal a la superficie (si la superficie es cerrada, la normal se tomará hacia afuera): dS̄ = n̂dS (101) Entonces redefinimos la integral de superficie como Z S V̄ · dS̄ = Z V̄ · n̂dS = S Z S (V̄ · n̂)dS (102) y como el producto escalar es un escalar, la integral anterior es del tipo escalar considerado antes, en (56) 4.4 Flujo y divergencia Dado un elemento de superficie dS̄ que contiene un punto P en el cual el campo vectorial toma un valor V̄ , se define el flujo del campo a través del elemento de superficie como dφ = V̄ · dS̄ (103) A partir de aquı́, dada una superficie cerrada que encierra un cierto volumen y un punto P interior a ese volumen, se define la divergencia del campo vectorial en el punto P como el ∆φ ∆v→0 ∆v lim 17 (104) es decir, la relación entre el flujo que atraviesa la superficie y el volumen contenido en la misma, cuando éste tiende a cero. Para dar con una forma operativa de calcular la divergencia, consideramos un pequeño cubo de lados dx, dy, dz paralelos a los ejes coordenados. Consideremos las caras perpendiculares al eje x, una en x y otra en x + dx. La normal a la primera cara es (−1, 0, 0), y la normal a la segunda cara es (1, 0, 0). El módulo de la superficie de ambas caras en dydz. El campo en la primera cara es V̄ , y el campo en la segunda: ∂ V̄ dx (105) ∂x El flujo total a través de ambas caras (flujo a través de la primera más flujo a través de la segunda) es V̄ + ∂V1 dxdydz (106) ∂x y análogamente para las caras paralelas a los ejes y y z, de tal forma que el flujo total a través del cubo es dφx = dφ = dφx + dφy + dφz = ! ∂V1 ∂V2 ∂V3 + + dxdydz ∂x ∂y ∂z (107) y de la definición de divergencia, vemos que div(V̄ ) = ∂V1 ∂V2 ∂V3 + + ∂x ∂y ∂z (108) que se puede escribir simbólicamente usando el operador nabla: div(V̄ ) = ∇ · V̄ (109) ∇ · (f Ū ) = ∇f · Ū + f ∇ · Ū (110) Ejemplo: si V̄ = x3 y î + y 3 z ĵ + z 2 k̂, entonces ∇ · V̄ = 3x2 y + 3y 2 z + 2z. Obsérvese que la divergencia es un escalar. Cuando el campo vectorial es de la forma f Ū , siendo f una función escalar, se comprueba por simple derivación que Ejemplo: Si V̄ = f (r)r̄, calcular la divergencia. Sabemos que el gradiente de la parte escalar es (segundo ejemplo, 4.1) ∇f = f ′ (r)r̂ y que 18 (111) ∇ · r̄ = 3 ası́ que (112) ∇ · (f (r)r̄) = rf ′ (r) + 3f (r) (113) 2 2 Como caso particular de este caso particular: ∇ · (r r̄) = 5r . 4.5 Campos solenoidales Un campo es solenoidal si su divergencia es nula en todo punto. Por ejemplo, el campo V̄ = rn r̄ es solenoidal sólo para n = −3. En efecto: ∇ · V̄ = nrn + 3rn = (n + 3)rn (114) que es cero sólo para n = −3. ¿Qué implica que un campo sea solenoidal? que el flujo a través de cualquier superficie cerrada es nulo, lo que significa, a su vez, que las lı́neas de campo no tienen ni fuentes ni sumideros. Esto se cumple para el campo eléctrico en regiones libres de cargas, y para el campo magnético siempre. Ejemplo: el campo V̄ = yz î + zxĵ + xy k̂ es a la vez irrotacional y solenoidal. En efecto, por cálculo directo se ve que es irrotacional; por ejemplo: ∂ ∂ (yz) = (zx) ∂y ∂x etc. Que es solenoidal se ve calculando la divergencia: ∇ · V̄ = 4.6 ∂ ∂ ∂ (yz) + (zx) + (xy) = 0 ∂x ∂y ∂z (115) (116) Teorema de la divergencia El teorema de la divergencia afirma que si S es una superficie que encierra un volumen V en el que está definido un campo vectorial Ū , entonces Z V ∇ · Ū dV = Z S Ū · dS̄ (117) Se puede dar de este teorema una demostración cualitativa. A tal efecto, divı́dase mentalmente el volumen V en un número muy grande de pequeños volúmenes adyacentes. El flujo a través de un elemento de superficie que separa dos volúmenes adyacentes es nulo, porque, sea cual sea en este elemento 19 el valor del campo, aparecerá una vez Ū · dS̄ y otra −Ū · dS̄ al considerar las normales hacia el exterior de los dos pequeños volúmenes que comparten la misma frontera dS̄. Por tanto, el flujo total interior al volumen es nulo, ya que cualquier pequeño elemento es adyacente a otro, con el que comparte una superficie de separación. Ası́ que sólo quedan sin compensar los elementos de volumen limitados parcialmente por la superficie exterior S. De la definición de la divergencia, vemos que la suma para el conjunto de todos los elementos de volumen ha de ser igual al flujo neto total que atraviesa S. Ejemplo: Calcular Z S r̄ · dS̄ (118) sobre una superficie cerrada. Solución: como Z S r̄ · dS̄ = Z V ∇ · r̄dV (119) y ∇ · r̄ = 3, se sigue que la integral buscada es 3V . Ejemplo: calcular, Z S Ā · dS̄ (120) donde S es la esfera centrada en el origen de radio R y Ā = x3 î+y 3 ĵ +z 3 k̂. Solución: como ∇ · Ā = 3(x2 + y 2 + z 2 ): Z S Ā · dS̄ = 3 Z V (x2 + y 2 + z 2 )dxdydz (121) Para calcular esta integral pasamos a coordenadas polares esféricas. El jacobiano de la transformación es r2 sin θ, ası́ que la integral es 3 4.7 Z 2π 0 dφ Z π 0 dθ sin θ Z r 0 r4 dr = 12 5 πR 5 (122) Identidades de Green Hemos visto que, dado un campo vectorial de la forma V̄ = f Ū , su divergencia es ∇ · V̄ = (∇f ) · Ū + f ∇ · Ū Cuando Ū es a su vez el gradiente de un campo escalar g: 20 (123) ∇ · V̄ = (∇f ) · (∇g) + f (∇ · ∇g) (124) Se escribe abreviadamente ∇ · ∇ = ∇2 , y se le llama operador laplaciano: ∇2 = ∂2 ∂2 ∂2 + + ∂x2 ∂y 2 ∂z 2 (125) ası́ que ∇ · V̄ = (∇f ) · (∇g) + f ∇2 g (126) y aplicando el teorema de la divergencia: Z V ∇ · V̄ dV = Z V [(∇f ) · (∇g) + f ∇2 g]dV = Z S f (∇g) · dS̄ (127) que es la primera identidad de Green. Intercambiando f y g y restando se obtiene la segunda identidad de Green: Z 4.8 V (f ∇2 g − g∇2 f )dV = Z S [f (∇g) − g(∇f )] · dS̄ (128) El rotacional De forma similar a la divergencia, que se define como el lı́mite entre el flujo que atraviesa una superficie cerrada y el volumen encerrado por la misma, cuando éste tiende a cero, se define el rotacional en un punto P como un vector en la dirección normal a una superficie dS que contiene a P cuyo módulo es el lı́mite cuando dS → 0 entre la circulación sobre el contorno γ de dS y la misma dS: ∆C (129) ∆S→0 ∆S Y al igual que con la divergencia, necesitamos aquı́ un procedimiento de cálculo que no da la propia definición. Para ver cómo se expresan las componentes del rotacional, vamos a considerar la componente k̂, para lo cual consideramos un pequeño circuito en el plano xy que contiene el punto P de coordenadas (x, y, 0). Las coordenadas de un punto del contorno se expresan como r̄ = (x + x′ , y + y ′ , 0). En cuanto al campo en los puntos del contorno, se puede desarrollar en serie de Taylor alrededor del punto P , y escribir: rot(Ū ) = lim U1 (x + x′ , y + y ′ , 0) = U1 (x, y, 0) + 21 ∂U1 ′ ∂U1 ′ x + y ∂x ∂y (130) y de la misma forma U2 (x + x′ , y + y ′ , 0) = U2 (x, y, 0) + ∂U2 ′ ∂U2 ′ x + y ∂x ∂y (131) La circulación que buscamos es Z γ Ū · dr̄ = Z γ U1 (x + x′ , y + y ′ , 0)dx′ + U2 (x + x′ , y + y ′ , 0)dy ′ (132) Insertando los desarrollos en serie de Taylor, y como las componentes del campo y las derivadas pueden salir de las integrales, ya que se evalúan en P , quedan las integrales curvilı́neas siguientes: Z γ Z Z γ dx′ = 0 (133) dy ′ = 0 (134) 1 x′ dx′ = x′2 |γ = 0 2 γ (135) 1 y ′ dy ′ = y ′2 |γ = 0 2 γ (136) Z y usando (49) y (50) que fueron encontradas en la demostración del teorema de Green, Z Z γ x′ dy ′ = ∆S (137) y ′ dx′ = −∆S (138) γ Se tiene finalmente que ∆C ∂U1 ∂U2 = − (139) ∆S ∂y ∂x Como el segundo miembro es una función de sólo las coordenadas del punto P , al hacer el lı́mite ∆S → 0 se tiene el rotacional que es precisamente ese segundo miembro. Análogamente para el resto de componentes, lo que nos darı́a: rot(Ū ) = ! ! ! ∂U2 ∂U3 ∂U3 ∂U1 ∂U1 ∂U2 − − − k̂ î + ĵ + ∂z ∂y ∂x ∂z ∂y ∂x 22 (140) y recordando la definición del operador ∇, vemos que se puede poner rot(Ū ) = ∇ × Ū (141) Se demuestran sin dificultad, de la definición del rotacional y las propiedades de la derivación, los resultados siguientes: a) Si Ū y V̄ son dos campos vectoriales, entonces el rotacional de Ū + V̄ es la suma de los rotacionales. b) Si Ū es un campo vectorial y f una función escalar, entonces ∇ × (f Ū ) = (∇f ) × Ū + f ∇ × Ū (142) c) Para cualquier función escalar f , ∇ × (∇f ) = 0̄ (143) d) Para cualquier función vectorial Ū ∇ · (∇ × Ū ) = 0 4.9 (144) Campos vectoriales irrotacionales Si la circulación de un campo a lo largo de una trayectoria entre dos puntos depende sólo de los extremos, entonces la circulación en cualquier trayectoria cerrada es nula, y por la definición, el rotacional de ese campo será nulo. Falta la demostración en el otro sentido: que cuando ∇ × Ū = 0̄, entonces la circulación a lo largo de cualquier camino cerrado es cero. En efecto, si ∇ × Ū = 0̄, entonces ∂U1 ∂U2 = ; ∂y ∂x ∂U1 ∂U3 = ; ∂z ∂x ∂U2 ∂U3 = ∂z ∂y (145) La trayectoria desde un punto (x0 , y0 , z0 ) a un punto (x, y, z) se puede implementar de una infinidad de formas mediante segmentos paralelos a los ejes de coordenadas. Sea una de estas trayectorias que transcurre en tres tramos, el primero paralelo al eje x, desde (x0 , y0 , z0 ) hasta (x, y0 , z0 ). El siguiente tramo será paralelo al eje y, desde (x, y0 , z0 ) a (x, y, z0 ). El último paralelo al eje z, desde (x, y, z0 ) a (x, y, z). La circulación es entonces Z C Ū · dr̄ = Z x x0 U1 (x, y0 , z0 )dx + Z y y0 U2 (x, y, z0 )dy + Z z z0 U3 (x, y, z)dz (146) Esta integral será una función de (x, y, z), que llamaremos f (x, y, z): 23 Z De aquı́: C Ū · dr̄ = f (x, y, z) (147) ∂f = U3 (x, y, z) ∂z Como z0 es constante en las otras dos integrales, tenemos: ∂f ∂y Z z ∂U3 ∂U2 dz = U2 (x, y, z0 ) + dz z0 ∂y z0 ∂z = U2 (x, y, z0 ) + U2 (x, y, z)|zz0 = U2 (x, y, z) = U2 (x, y, z0 ) + Z (148) z (149) Y de la misma forma Z y Z z ∂f ∂U2 = U1 (x, y0 , z0 ) + dy + ∂x y0 ∂x z0 Z y Z z ∂U1 = U1 (x, y0 , z0 ) + dy + y0 ∂y z0 = U1 (x, y, z) ∂U3 dz ∂x ∂U1 dz ∂z (150) En definitiva, ∂f = U1 (x, y, z); ∂x ∂f = U2 (x, y, z); ∂y ∂f = U3 (x, y, z) ∂z (151) y por tanto Ū = ∇f . Resumiendo: definimos anteriormente los campos irrotacionales como aquellos en que la circulación a lo largo de una trayectoria depende sólo de los extremos. Demostramos que si un campo Ū es irrotacional, existe una función escalar f tal que Ū = ∇f , y también que dada una función escalar f , la circulación de su gradiente a lo largo de una trayectoria cerrada es nula. A continuación hemos definido el rotacional de un campo vectorial, y hemos encontrado la forma de calcularlo haciendo ∇ × Ū . Lo que acabamos ahora de demostrar es que si ∇ × Ū = 0̄, entonces existe una función escalar tal que Ū = ∇f , luego su circulación por cualquier trayectoria cerrada es nula, luego Ū es irrotacional. Ejemplo: Dado Ū = rα r̄, demostrar que es irrotacional. Será irrotacional si su circulación a lo largo de una trayectoria depende sólo de los extremos, y eso sucederá si existe un f tal que Ū = ∇f . Busquemos esa f . De entrada 24 ∂f = rα x; ∂x ∂f = rα y; ∂y ∂f = rα z ∂z (152) Por otro lado x ∂r = ; ∂x r ∂r y = ; ∂y r ∂r z = ∂z r (153) y sustituyendo la última en la anterior: ∂f ∂r = rα+1 ; ∂x ∂x ∂f ∂r = rα+1 ; ∂y ∂y ∂f ∂r = rα+1 ∂z ∂z (154) A la vista de las ecuaciones anteriores, está claro que puede tomarse 1 α+2 r α+2 siempre que sea α 6= −2. Pero si α = −2 f= x ∂f = 2 ∂x x + y2 + z2 (155) (156) y análogamente para las otras coordenadas. Se ve entonces que puede tomarse f = log q x2 + y 2 + z 2 (157) Obsérvese lo siguiente: si hubiésemos fallado en la búsqueda de la función f , eso no demostrarı́a que el campo no es irrotacional. Por eso, desde el punto de vista lógico, parece mejor demostrar la irrotacionalidad simplemente calculando el rotacional y comprobando que es nulo, ya que, como hemos demostrado, el rotacional nulo implica campo irrotacional. 4.10 El teorema de Stokes Daremos aquı́ una demostración cualitativa. Sea una superficie cualquiera S que se apoya sobre una curva C. Si dividimos la superficie S en una multitud de pequeños circuitos adyacentes, veremos que la cada segmento de circuito compartido aparece dos veces, una con un signo y otra con otro, y que por tanto la circulación total sobre todos los circuitos se reduce a la circulación sobre C. Ahora, de la definición de rotacional, la circulación sobre cada pequeño circuito es el producto del rotacional de Ū en cada circuito (suponemos que los circuitos son muy pequeños y que podemos tomar el rotacional como el rotacional en un punto interior al circuito) por el área del 25 circuito. Al sumar para todos los circuitos, tenemos la integral de superficie del rotacional. Y esto es lo que afirma el teorema de Stokes: Z 5 C Ū · dr̄ = Z S (∇ × Ū )dS̄ (158) Bibliografı́a Estas notas han seguido grosso modo el excelente texto de Kathleen M. Urwin, ”Cálculo Superior y Teorı́a del Vector Campo”, en traducción de Elena Martı́n Peinador. También recomendamos ”Cálculo diferencial e integral”, de N. Piskunov, ed. Montaner y Simón. Ambos contienen multitud de ejemplos ilustrativos, de los que hemos tomado unos pocos. 6 Resumen conceptual 1. Integrales de camino. La integral de camino en forma paramétrica. Trabajo 2. Condición para que la integral de camino sea independiente de la trayectoria elegida. 3. Integrales dobles y cambio de variable. 4. El teorema de Green. 5. Campo escalar. Gradiente. 6. Campo vectorial. Definición de campo irrotacional. Si un campo Ū es irrotacional, entonces existe una función escalar f tal que Ū = ∇ · f . Si f es una función escalar, entonces ∇ · f es irrotacional. 7. Flujo y divergencia. Campos solenoidales. 8. Teorema de la divergencia e identidades de Green. 9. El rotacional. Si ∇ × Ū = 0̄, entonces el campo es irrotacional, y a la inversa. 10. Teorema de Stokes. 26 7 Ejercicios 1. Calcular Z (x2 + y)dx + xydy (159) a lo largo del camino AD formado por las rectas AB, BC y CD, con A = (0, 0), B = (2, 2), C = (2, 6), D = (3, 9). (Solución: 661/6) 2. Demostrar que la integral Z (y 2 + 4)dx + (2xy + 3)dy (160) es independiente del camino de integración, y calcular su valor entre A = (1, 2) y B = (3, 4). (Solución: 58) 3. Calcular ∇(f (r) + g(1/r)) (161) donde f y g son funciones arbitrarias y r2 = x2 + y 2 + z 2 . 4. Calcular la divergencia del campo vectorial f¯ = rn g(1/r)r̄ (162) 5. Si ā es un vector constante, demostrar que ∇ × (ā × r̄) = 2ā 27 (163) II Leyes básicas del electromagnetismo 1 Campos Es un hecho experimental que la materia puede modificar el espacio circundante, incluso a largas distancias, confiriéndole alguna propiedad que se manifiesta por la aparición de fuerzas. Por ejemplo, una masa crea unas condiciones tales que aparecen fuerzas sobre otras masas cercanas, o incluso muy lejanas. Como la forma de manifiestarse esta propiedad que la materia confiere al espacio es mediante fuerzas, que son vectoriales, podemos representar la alteración introducida mediante un campo vectorial Ē(x, y, z). Es también un hecho experimental que hay campos de distintas clases. Tenemos la gravedad, el campo eléctrico y el magnético, y otros campos que se manifiestan a cortas distancias. Cada campo está asociado a una propiedad distinta de la materia. Ası́, el campo de gravedad a la masa y el campo eléctrico a la carga. Nos centraremos desde este momento en el campo eléctrico. 2 Campo eléctrico Una carga q, que colocamos en el origen de un sistema de referencia, crea en la posición r̄ un campo, de forma que una carga q ′ influida por ese campo experimenta una fuerza F̄ = q ′ Ē. Se comprueba experimentalmente que el campo creado por la carga q es proporcional a la misma, inversamente proporcional al cuadrado de la distancia al punto considerado y dirigido según la recta que la une con el punto. Cuantitativamente: Ē = q r̄ 4πε0 r3 (1) En el S.I. de unidades: 1 N m2 = 9 × 109 2 4πε0 C (2) La fuerza que experimenta una carga q ′ situada en r̄ respecto a q es F̄ = qq ′ r̄ 4πε0 r3 (3) Vemos que cuando qq ′ > 0 la fuerza es repulsiva, y que cuando qq ′ < 0 es atractiva. 28 Otro hecho experimental es que los campos debidos a varias cargas se suman vectorialmente, de modo que, dada una serie de cargas qi en posiciones r̄i , el campo creado en un punto r̄ viene dado por Ē(r̄) = qi (r̄ − r̄i ) 4πε0 |r̄ − r̄i |3 X i (4) Si en lugar de un conjunto de cargas puntuales tenemos una distribución continua, entonces calcularemos el campo como una integral sobre la distribución continua, descrita por la densidad lineal, superficial o volúmica de carga. Ejemplo: Dada una distribución lineal continua de longitud infinita a lo largo del eje z y densidad lineal λ, calcular el campo en un punto del eje x a distancia d del eje z. Solución: un elemento de carga situado en la coordenada z y de longitud dz contiene una carga λdz, y crea un campo dĒ = λdzr̄ 4πε0 r3 (5) con r3 = (d2 + z 2 )3/2 y r̄ = (d, 0, −z). Por tanto, no hay campo en la dirección y. En la dirección x: dEx = λd dz 2 4πε0 (d + z 2 )3/2 (6) y λ dz λd Z ∞ = Ex = 4πε0 −∞ (d2 + z 2 )3/2 2πε0 d (7) Por simetrı́a, ya se ve que Ez = 0, pero se puede comprobar por integración. 2.1 Propiedades del campo eléctrico El campo creado por una carga q en r̄ (tomándola como origen) es: q r̄ (8) 4πε0 r3 Este campo es irrotacional. Para verlo podemos aplicar I.153 y siguientes, o bien calcular directamente: Ē = ∇ × Ē = 1 ∇(r−3 ) × r̄ + r−3 ∇ × r̄ 4πε0 29 (9) Pero ∇ × r̄ = 0 y ∇r−3 = −3r−5 r̄, de donde se sigue ∇ × Ē = 0̄. Demostramos en I.4.9 que si ∇ × Ū = 0̄ entonces Ū es irrotacional, es decir, existe una función escalar f tal que Ū = ∇f . En nuestro caso, tomando I.156 con α = −3: f =− q 1 4πε0 r (10) Por otra parte, en I.114 vimos que para Ū = f (r)r̄, la divergencia es ∇ · Ū = rf ′ (r) + 3f (r) (11) ∇2 f = 0 (12) que en nuestro caso da ∇ · Ē = 0. Pero como E = ∇f , se sigue que el potencial satisface la ecuación de Laplace: Nota: aunque no hay razón matemática para ello, en Fı́sica se suele tomar el potencial de forma que el campo sea no el gradiente del potencial, sino menos dicho gradiente: Ū = −∇f . De acuerdo con ello, y para no introducir divergencias que hagan molesta la comparación de estas notas con los textos habituales, adoptamos aquı́ también esa convención, y en consecuencia el potencial lo tomamos no como fue definido en (10), sino como f= 2.2 1 q 4πε0 r (13) Regiones que contienen cargas Los razonamientos anteriores presuponen que el campo se puede calcular en todo punto, pero precisamente en r = 0 existe una singularidad, de manera que los resultados anteriores serán válidos para regiones libres de cargas, en que el campo se puede calcular y por tanto su divergencia y rotacional, pero no para regiones que contienen cargas, pues en los puntos ocupados por esas cargas el campo es singular. Consideremos una carga q situada en el origen, y una esfera de radio a centrada en el mismo. Calculamos el flujo a través de la esfera: 1 q q Z q ā · d S̄ = (14) r̂ · r̂dS = 3 2 4πε0 a S ε0 S 4πε0 a Esto significa que una carga positiva se comporta como una fuente de lı́neas de campo, y una carga negativa como un sumidero. Si ahora consideramos que tenemos no una carga puntual sino una distribución continua de densidad ρ en un pequeño volumen ∆v, entonces Z 30 ρ 1 Z (15) Ē · dS̄ = ∆v S ε0 pero la parte de la izquierda es precisamente la definición de la divergencia, luego ∇ · Ē = ρ ε0 (16) Además, como Ē = ∇f , ρ ε0 que es conocida como ecuación de Poisson. La expresión ∇2 f = (17) Z (18) S Ē · dS̄ es útil en algunos casos en que se dan simetrı́as evidentes. Por ejemplo, calculamos el campo a una distancia d de un hilo infinito de densidad lineal de carga λ. Por simetrı́a, el campo ha de ser radial y valer lo mismo en todo punto de un cilindro de radio d cuyo eje coincida con la distribución de carga. Tomando la superficie de un cilindro de altura h y radio d cuyo eje coincida con el de la distribución, al ser el campo radial no existe flujo más que a través de la superficie curva del cilindro, de manera que Z S Ē · dS̄ = 2πdhE = λh ε0 (19) y de aquı́ λ (20) 2πε0 d que coincide con (7), pero que hemos obtenido de forma mucho más directa. E= 2.3 El campo eléctrico en la materia Es un hecho experimental que la materia está constituida por partı́culas cargadas, de carga positiva y negativa (y también de partı́culas sin carga, que no juegan papel en nuestra discusión). Cuando una substancia se expone a un campo, las partı́culas cargadas de la substancia experimentan fuerzas que son de un sentido u otro según la carga positiva o negativa, y como consecuencia aparece una cierta separación de carga: las cargas positivas tienden a desplazarse en un sentido y las negativas en otro opuesto. Aparece 31 entonces un campo interno debido a esta separación que se superpone con el campo exterior aplicado, dando lugar a un campo neto: Ē = Ēext + Ēint (21) La magnitud y dirección del campo interno depende de cada substancia en particular, ası́ como de su forma geométrica. Hay dos situaciones que pueden presentarse, según que las partı́culas cargadas en el interior de la substancia se encuentren libres o no. A las substancias del primer tipo se las llama ”conductores”; a las del segundo, ”dieléctricos”. A) Conductores. Puesto que en los conductores las cargas se pueden mover libremente, una situación de equilibrio implica la no existencia de corrientes, luego el campo en el interior es nulo, luego, aplicado un campo externo, las cargas libres se reorganizan sobre la superficie del conductor, dando lugar a un campo Ēint que superpuesto al campo aplicado dan un campo total nulo. Otra forma de expresar esto es diciendo que en el interior del conductor el potencial es constante. Es posible usar el mismo razonamiento que conduce a (20) para encontrar el campo en puntos próximos a la superficie del conductor. Para ello consideramos un cilindro cerrado cuya base es paralela a la superficie y se encuentran justo bajo la misma. El otro extremo del cilindro se encuentra justo sobre la superficie. La altura del cilindro es muy pequeña. Ahora bien, el campo ha de ser perpendicular a la superficie. Si no lo fuera, existirı́a una componente tangencial y habrı́a corrientes superficiales, en contra de la hipótesis de equilibrio. Por tanto, el flujo que atraviese el cilindro ha de pasar a través de las dos circunferencias. Pero el flujo a través de la base es nulo, porque el campo en el interior el conductor es nulo, ası́ que sólo queda el flujo a través de la parte superior. Por tanto: E∆S = σ∆S ε0 (22) es decir: Ē = σ n̂ ε0 (23) Puede dar la impresión de que Ē es debido sólo a la densidad σ, pero esto no es ası́: Ē es debido al sistema total de cargas, a consecuencia del cual hay en el punto considerado una densidad superficial; de hecho, en nuestro razonamiento hemos considerado que el flujo en la cara inferior es nulo, aunque el debido sólo a la carga superficial no lo es. Entonces, hemos 32 considerado el campo total. Y sin embargo, este campo total se expresa en función sólo de la carga superficial. Esta es una propiedad muy notable. Al considerar ahora el campo externo Ēext , un elemento ∆S de superficie se verá sometido a una fuerza F̄S = σ∆S Ēext (24) ¿Cuánto vale Ēext ? En el razonamiento anterior calculamos el campo total. Pero si calculamos el campo debido sólo a la densidad superficial σ, entonces hemos de considerar el flujo a través de las dos caras del cilindro, y obtenemos un campo que es exactamente la mitad. Por tanto, si conocemos el campo debido a la carga superficial y el campo total, y el primero es la mitad del segundo, está claro que el campo exterior serı́a la otra mitad del campo total: 1σ n̂ (25) 2 ε0 y la fuerza sobre la unidad de superficie se calcula entonces fácilmente como Ēext = 1 σ2 1 F̄S = n̂ = ε0 E 2 n̂ f¯S = ∆S 2 ε0 2 (26) B) Dieléctricos. En los dieléctricos, la movilidad de las cargas es limitada, y por tanto la separación inducida por un campo externo también lo es. Aunque en lo posible queremos mantenernos en el campo macroscópico, consideraremos en relación con los dieléctricos en primer lugar un modelo de dipolo. Un dipolo es un conjunto de dos cargas de signo opuesto y valor q separadas por una distancia l. Colocamos la carga negativa en el origen del sistema de referencia, y la carga positiva sobre el eje y, a distancia l del origen. Como el problema tiene simetrı́a axial nos podemos limitar a calcular el campo creado por el dipolo en un punto P = (x, y) del plano. El potencial creado por el conjunto de las dos cargas es f= 1 q(r− − r+ ) 4πε0 r− r+ (27) donde r̄− = (x, y) y r̄+ = (x, y − l). Es una pura cuestión algebraica escribir los módulo de ambos vectores, sustituirlos en la ecuación del potencial y obtener ası́ f (x, y), y a partir de ahı́ el campo eléctrico creado por el dipolo Ē(x, y). En el proceso, que vamos a omitir aquı́, se puede suponer que P es un punto muy alejado del dipolo, de tal forma que r+ , r− >> l. También, 33 dada la simetrı́a del problema, se puede introducir el ángulo θ que forma la dirección desde el origen del punto P con el eje y. El resultado de los cálculos es que 1 p cos θ 1 p̄ · r̄ = (28) 2 4πε0 r 4πε0 r3 donde p̄ es un vector de módulo ql y que va desde la carga negativa a la positiva. Las proyecciones del campo eléctrico Ē = −∇f sobre la dirección radial y la dirección perpendicular a la misma son f= 1 2p cos θ 4πε0 r3 1 p sin θ = 4πε0 r3 Er = Eθ (29) Se ve que cuando un dipolo se introduce en un campo uniforme, la fuerza que actúa sobre él es F̄ = q Ē − q Ē = 0̄ (30) F̄ = q(Ē+ − Ē− ) (31) Sólo cuando el dipolo está sometido a un campo no uniforme, de manera que la fuerza sobre cada carga es distinta, existe una fuerza neta sobre el dipolo: Por otro lado, el trabajo realizado por el campo para llevar a una carga q desde la posición 1 a la posición 2 es Z 2 1 q Ē · dr̄ = −q Z 1 2 (∇f ) · dr̄ = q(f1 − f2 ) (32) Si se toma convencionalmente el punto final como ∞, al trabajo realizado se le llama ”energı́a potencial”. Véase que f (r = ∞) = 0, ası́ que la energı́a potencial de una carga en un punto r es W = qf (r). La energı́a potencial del dipolo es entonces W = q(f+ − f− ) (33) W = q(∇f )l · ˆl = −qlˆl · Ē = −p̄ · Ē (34) pero f+ − f− es la variación de f al movernos en la dirección del vector p̄ una distancia l. El cambio en una función escalar al movernos en una dirección dada quedó establecido en la fórmula I.75, de forma que: 34 La idea subyacente a la discusión anterior es que en un dieléctrico sometido a un campo, las cargas positivas y negativas de las moléculas se separan un poco (no mucho, porque las cargas no son libres y porque el campo interno de las moléculas es mucho más intenso que el campo externo) y se comportan como dipolos. Si las distribuciones de densidad de cargas positivas y negativas, ρ+ y ρ− son constantes, la separación conducirá a cargas sin compensar sólo en la superficie del dieléctrico. Si las densidades no son constantes, entonces aparecerán cargas sin compensar en todo el volumen. Estas separaciones microscópicas nos permiten definir un vector polarización por unidad de volumen de la siguiente forma: aislamos mentalmente un pequeño volumen ∆v, calculamos la suma vectorial de todos los momentos dipolares p̄i de cada molécula y dividimos por el volumen. Ası́, se define el momento dipolar por unidad de volumen como P̄ = 1 X p̄i ∆v i (35) Se ha comprobado experimentalmente para un gran número de dieléctricos que la polarización varı́a linealmente con el campo aplicado. Se escribe: P̄ = χε0 Ē (36) donde a χ se le llama ”susceptibilidad dieléctrica”, y es siempre mayor que cero. 2.4 Propiedad del vector P̄ Como hemos dicho, en un dieléctrico existen densidades de cargas positivas y negativas, ρ+ y ρ− , y cuando se aplica un campo externo, se produce una separación entre ambas. Si estas densidades no son constantes, en cada punto resultará un exceso de densidad de carga ρ′ = ρ+ − ρ− . Pues bien, el vector P̄ cumple la siguiente importante propiedad: ∇ · P̄ = −ρ′ (37) Demostración: Sea un elemento de volumen del dieléctrico limitado por una superficie S, y sea dS un elemento de dicha superficie. Al aplicar el campo, que suponemos dirigido en una dirección cualquiera hacia el exterior del volumen, la carga positiva experimenta un desplazamiento l+ y la negativa un desplazamiento l− . Si α es el ángulo que forma el campo aplicado y por tanto el desplazamiento con la normal a la superficie, en dirección saliente atraviesa ésta una cantidad de carga ρ′+ l+ cos αdS, y en dirección entrante ρ′− l− cos αdS. Pero el movimiento de una cantidad de carga negativa hacia el 35 interior del volumen equivale a un desplazamiento de una igual cantidad de carga positiva en sentido contrario, ası́ que se puede poner como flujo total: ρ′+ (l+ + l− ) cos αdS y esto se puede poner como P̄ · dS̄. La cantidad de carga que abandona S se obtiene integrando a todo el volumen, y debe ser igual al exceso de carga en el interior del volumen, con signo contrario, de manera que Z S P̄ · dS̄ = − Z V ρ′ dV = −q ′ (38) y aplicando el teorema de la divergencia, se tiene en forma diferencial ∇ · P̄ = −ρ′ (39) Todavı́a hay una relación entre el exceso de carga ρ′ inducida por el campo aplicado y la densidad de carga ρ de otro tipo que pueda estar presente. En efecto, para dieléctricos homogéneos se cumple (36), es decir χ Z S ε0 Ē · dS̄ = −q ′ (40) pero la integral es justamente la carga total contenida en el volumen encerrado por S, como muestra (16), luego χ(q + q ′ ) = −q ′ ; 2.5 q′ = − χ q 1+χ (41) El vector D̄ De vuelta a (16), pero distinguiendo la carga total entre carga de exceso por polarización y ”otras cargas”, escribimos: Z S ε0 Ē · dS̄ = q + q ′ (42) El problema con esta expresión es que q ′ depende de Ē pero a su vez Ē depende de q ′ . Sin embargo, como q ′ se puede escribir en función de P̄ : Z S (ε0 Ē + P̄ )dS̄ = q (43) Introducimos el vector auxiliar D̄ y escribimos, en forma diferencial, ∇ · D̄ = ρ (44) Para un dieléctrico homogéneo: D̄ = ε0 Ē + P̄ = ε0 Ē + χε0 Ē = ε0 εĒ 36 (45) con ε = 1 + χ. Un comentario pertinente a propósito de (44) es que dicha ecuación nos indica que las fuentes de D̄ son sólo las cargas distintas de las de polarización. Luego las lı́neas del campo D̄ tienen sus fuentes y sumideros en las cargas distintas de las de polarización. Ahora bien, esto no significa que el campo D̄ esté determinado sólo por este tipo de cargas: está determinado por todas las cargas, al igual que Ē, con el que está relacionado por (45). (44) expresa una propiedad de D̄, pero no dice cómo calcularlo. 2.6 Condiciones de contorno Supongamos dos dieléctricos 1 y 2 separados por una interfaz donde, para mayor generalidad, admitimos la existencia de una densidad de cargas libres σ. Las propiedades de Ē y D̄: Z Z C Ē · d¯l = 0 (46) S D̄ · dS̄ = q (47) nos permiten encontrar condiciones que cumplen ambos al pasar del medio 1 al 2. Apliquemos la primera considerando un pequeño circuito rectangular que comienza con un primer tramo d¯l1 en el medio 1, paralelo a la superficie; después, cruza la superficie y hace el camino de vuelta por el otro lado, recorriendo un d¯l2 = −d¯l1 . Finalmente, cruza de nuevo la superficie de separación y vuelve al punto de partida. Si los tramos donde se cruza la interfaz son despreciables frente a los que van paralelos a ella, y si estos son a su vez tan pequeños que a lo largo de los mismos el campo se puede considerar constante, es claro que la circulación de Ē en ese circuito se puede escribir: Ē1 · d¯l1 + Ē2 · d¯l2 = 0 (48) (Ē1 − Ē2 ) · d¯l1 = 0 (49) o Es decir, que las proyecciones de Ē tangenciales a la superficie de separación son iguales a ambos lados: E1t = E2t (50) En general, las componentes normales no serán iguales, ya que el mismo campo aplicado crea polarizaciones distintas en 1 y 2 y por tanto campos de 37 polarización distintos que se superponen al campo aplicado para dar campos totales distintos. En cuando a D̄, tomando un cilindro de altura despreciables y caras paralelas a la interfaz, con una a cada lado, la ecuación (47) nos dice que ¯ 1 + D̄2 · ∆S ¯ 2 = σ∆S D̄1 · ∆S (51) (D̄1 − D̄2 ) · n̂∆S = σ∆S (52) ¯ 2 = −∆S ¯ 1: o, como ∆S y se sigue que las componentes normales de D̄ cumplen: D1n − D2n = σ (53) Una consecuencia de esto es que las lı́neas del campo eléctrico Ē sufren una refracción al pasar de un dieléctrico a otro. En efecto, si α1 es el ángulo que forma Ē con la normal a la superficie por el lado del dieléctrico 1 y α2 el ángulo por el lado del dieléctrico 2, teniendo en cuenta que D̄ = ε0 εĒ, poniendo D̄1 = ε1 Ē1 y D̄2 = ε2 Ē2 , y teniendo en cuenta también que en ausencia de cargas libres D1n = D2n : E1t E1n con expresión similar para α2 , de donde tan α1 = (54) ε1 tan α1 = (55) tan α2 ε2 Por otro lado, si la interfaz separa un conductor de un dieléctrico, sabemos que el campo Ē en el interior del conductor es nulo, y por tanto también lo es D̄. Si el medio 2 es el conductor, la ecuación (53) nos dice que Dn = σ. Finalmente, consideremos el caso en que se ponen en contacto un conductor cargado con una carga superficial σ con un dieléctrico. Si el dieléctrico es homogéneo, aparecerá una carga de polarización superficial σ ′ . De q (56) ε0 S tomando un pequeño cilindro de altura despreciable y caras paralelas a la interfaz, una a cada lado, se sigue: Z Ē · dS̄ = En = σ + σ′ ε0 y como al mismo tiempo 38 (57) En = Dn εε0 (58) combinando ambas: ε−1 σ (59) ε y esto nos dice que hay una relación definida entre la densidad de cargas de polarización y la densidad de cargas libres. Este resultado tiene más importancia de la que parece. Veamos por qué. Hemos dicho que el campo total Ē en el interior de un dieléctrico es difı́cil de calcular, porque depende de las cargas de polarización, que a su vez dependen del campo que hay que calcular. También hemos dicho que cuando las densidades de carga ρ+ y ρ− en un dieléctrico son constantes, entonces el exceso de carga de polarización aparece sólo en la superficie del dieléctrico. Pues bien: consideremos la situación en que tenemos una serie de conductores cargados en el espacio vacı́o que crean un campo Ē0 . Cuando ese espacio se rellena completamente con un dieléctrico homogéneo, en las superficies de contacto entre conductores y dieléctrico aparecen cargas superficiales σ ′ , de tal forma que la densidad superficial en cada punto pasa de σ a σ + σ ′ = σ/ε. Como esta relación es válida en cada punto de cada superficie, quiere decir que no se altera la configuración de Ē0 , sino sólo su magnitud: σ′ = − 1 Ē = Ē0 (60) ε Multiplicando por εε0 ambos lados, se sigue que D̄ = D̄0 . Además, podemos calcular el campo de polarización. Combinando Ē = Ē ′ + Ē0 , que P̄ = χε0 Ē y que Ē0 = εĒ, se sigue que Ē ′ = 1−ε 1 P̄ = − P̄ χε0 ε0 (61) Además, como el campo se reduce por la introducción del dieléctrico (Ē = Ē0 /ε), y dicho campo deriva de un potencial f , se sigue también que f = f0 /ε, e igualmente para las diferencias de potencial. 2.7 Energı́a del campo eléctrico Consideremos dos cargas iguales aisladas interaccionando sólo entre ellas. Como consecuencia de las fuerzas mutuas que ejercen la una sobre la otra sufren desplazamientos dr̄1 y dr̄2 , luego se realiza un trabajo 39 δA = F̄1 · dr̄1 + F̄2 · dr̄2 = F̄1 dr̄ (62) donde r̄ = r̄1 − r̄2 es la posición relativa de la carga 1 en un sistema fijo en la carga 2. Por tanto: el trabajo realizado por las dos fuerzas de interacción entre dos cargas es igual al realizado por la fuerza que actúa sobre una de las cargas en un sistema de referencia fijo en la otra. Como la fuerza eléctrica deriva de un potencial f : δA12 = −dW12 (63) donde W12 depende sólo de la distancia entre las cargas 1 y 2. Este resultado se puede generalizar a un conjunto arbitrario de cargas. Por ejemplo, para tres cargas: W = W12 + W13 + W23 (64) que se puede poner como 1 1 1 W = (W12 + W21 ) + (W13 + W31 ) + (W23 + W32 ) 2 2 2 que se puede reorganizar ası́: 1 1 1 W = (W12 + W13 ) + (W21 + W23 ) + (W31 + W32 ) 2 2 2 y finalmente escribir como W = 1X Wi 2 i (65) (66) (67) donde Wi es la energı́a de interacción de la carga i con el resto de cargas. Es obvio que este razonamiento no depende de que sea i = 3 y por tanto es válido para cualquier número de cargas. Como, además, Wi = qi fi , ecuación (32), queda finalmente W = 1X qi f i 2 i (68) donde fi es el potencial creado en la posición de qi por el resto de cargas. Ejemplo: encontrar la energı́a de interacción de un sistema de cuatro cargas iguales q situadas en los vértices de un tetraedro regular de lado a. Solución: sobre cada carga actúan las otras tres, creando un potencial conjunto que es tres veces el que crearı́a una sola, ya que están las tres a la misma distancia de la cuarta. Este potencial conjunto es 40 1 3q 4πε0 a La energı́a total de interacción será (69) 1 3q 2 1 6q 2 ×4× = 2 4πε0 a 4πε0 a En el caso de una distribución continua de carga, la energı́a es (70) 1Z W = ρf dV (71) 2 V Sin embargo, se ha de tener presente que esta expresión difiere cualitativamente de la expresión para el caso discreto. Y es que, dados dos cuerpos continuos cargados, W no es simplemente la energı́a de interacción entre ellos, porque para cada carga elemental ρdV de un cuerpo es preciso considerar el potencial de todos los elementos del otro cuerpo, pero también el potencial de todos los elementos del mismo cuerpo. Es decir, que para un cuerpo cargado aislado, todavı́a será W 6= 0 debido a la interacción entre sus propias partes. La ecuación (71) puede ponerse en una forma interesante. En efecto 1Z 1Z ρf dV = (∇ · D̄)f dV (72) W = 2 V 2 V pero (∇ · D̄)f = ∇ · (f D̄) + Ē · D̄. Transformamos ahora la integral de volumen del primer término del segundo miembro: Z V ∇ · (f D̄)dV = Z S f D̄ · dS̄ (73) S puede ser cualquier superficie arbitraria con tal de que encierre al sistema de cargas. Si hacemos esa superficie más y más grande, ella crece como r2 , pero f D decrece como r−3 , ası́ que la primera integral tiende a cero y sólo queda la segunda, pudiendo escribirse 1Z Ē · D̄dV 2 V que es una expresión que contiene sólo los campos, no las cargas. W = 2.8 (74) Corriente Cuando se aplica un campo a un conductor, se produce movimiento en las cargas. La carga puede ser transportada por electrones o iones, en conductores metálicos, electrolitos, etc. Aquı́ nos restringimos al movimiento de electrones en conductores metálicos. Si S es una superficie cualquiera en el 41 interior de un conductor al que se aplica un campo, se define la intensidad a través de esa superficie como la carga que la atraviesa por unidad de tiempo: dq (75) dt Esta carga que atraviesa S en la unidad de tiempo depende de dos factores: de la densidad de carga ρ y de la velocidad media ū a la que se muevan las cargas. Se define entonces el vector densidad de corriente como i= j̄ = ρū (76) El flujo a través de S en términos de j̄ se puede poner entonces como dq (77) dt S donde el signo ’-’ proviene de que la normal a S, si es una superficie cerrada, se toma convencionalmente hacia afuera. Entonces, el flujo de j̄ es la carga que abandona el volumen encerrado por S. Aplicando el teorema de la divergencia podemos escribir la ley diferencial para la densidad de corriente: i= Z j̄ · dS̄ = − ∂ρ (78) ∂t que se conoce como ”ecuación de continuidad”. La ley de Ohm es un resultado experimental que afirma que, cuando se establece una diferencia de potencial U entre los extremos de un conductor, la intensidad que circula es ∇ · j̄ = − i = U/R (79) donde R es una constante que depende tanto del material conductor como de su geometrı́a. Por ejemplo, cuando el conductor tiene forma de cable de longitud l y sección s: l (80) s A la constante ρ se le llama resistividad, y depende del material conductor y de su temperatura 1 . R=ρ 1 Usamos la misma letra, ρ con la que nos hemos referido a la densidad de carga, primero porque la resistividad se ha designado tradicionalmente con esta letra, y segundo porque con este significado sólo la empleamos en esta parte y en un contexto en que no hay peligro de confusión con otras partes del texto en que representa una densidad de carga. 42 Si aislamos mentalmente un cilindro de sección dS y longitud d¯l cuyo eje es paralelo a j̄ y a Ē, combinando las dos ecuaciones anteriores: dl (81) dS y simplificando queda j = σE, donde a σ = 1/ρ se le llama ”conductividad” 2 . En forma vectorial: jdS = Edl/ρ j̄ = σ Ē (82) Esta es conocida como ”forma diferencial” de la ley de Ohm, no porque contenga diferenciales, sino porque es local: válida para cada punto del conductor. Ahora bien, es evidente que las fuerzas electrostáticas por sı́ mismas sólo pueden dar lugar a una corriente transitoria, ya que la energı́a de cualquier sistema de cargas es una cantidad limitada al valor dado por (68). Por tanto, es preciso que existan otras fuerzas de naturaleza distinta que llamaremos Ē ⋆ . Entonces, reescribimos (82) como j̄ = σ(Ē + Ē ⋆ ) (83) Podemos integrar esta expresión entre dos puntos de un conductor rectilı́neo. Si el conductor es delgado, podemos considerar a j̄ paralelo a d¯l: Z 2 j̄ ¯ Z 2 · dl = Ē · d¯l + Ē ⋆ · d¯l (84) 1 σ 1 1 Pero la primera integral es Ri mientras que el primer término del segundo miembro es f2 − f1 . Al segundo término del segundo miembro le llamamos ”fuerza electro-motriz”, o abreviadamente ”fem”, designándola mediante E: Z 2 E12 = Z 2 1 Ē ⋆ · d¯l (85) Ası́ que tenemos la generalización de la ley de Ohm: Ri = f1 − f2 + E12 (86) Esta es la ecuación básica que permite resolver circuitos de corriente continua. En particular, las reglas de Kirchoff permiten plantear un sistema de ecuaciones en las intensidades que circulan por las diferentes ramas de un circuito. No entraremos en esta materia. 2 Vale la misma observación para σ que hemos hecho en la nota anterior para ρ. 43 3 Campo magnético Desde antiguo son conocidos los imanes y las substancias magnéticas, y el hecho de que aparecen fuerzas entre ellas o entre ellas y algunos metales. Más recientemente se descubrió la interacción entre los imanes y las corrientes eléctricas, o entre corrientes eléctricas. Todos estos experimentos permitieron formular la existencia de un tipo de interacción distinta a la electrostática y que actúa también sobre las cargas. Aunque la razón profunda de estas interacciones es relativista, las propiedades del campo magnético son conocidas con anterioridad a la formulación de la teorı́a de la relatividad, a partir de experimentos, ası́ que podemos partir de estos experimentos en la exposición que sigue. 3.1 Fuerza de Lorentz Se comprueba que existe una fuerza que afecta a las cargas en movimiento, de forma que la fuerza total sobre una carga podrá descomponerse en una parte eléctrica y una parte magnética. Esta ley de fuerza es F̄ = q[Ē + v̄ × B̄] (87) y como puede verse: a) depende de la velocidad y b) es perpendicular a la misma, lo cual significa que el campo magnético, que representaremos por B̄, no realiza trabajo sobre la carga. Pero la velocidad v̄ dependerá del sistema de referencia en que se mida, ası́ que distintos sistemas de referencia medirán distintos valores de la fuerza magnética. La otra parte de la cuestión es que cargas en movimiento crean campos magnéticos. Es decir: una carga en movimiento crea un campo magnético, que ella misma no experimenta, y a su vez una carga que se mueve en un campo magnético, creado por otras cargas en movimiento, experimenta una fuerza. El campo magnético creado por una carga en un punto r̄ es µ0 q v̄ × r̄ (88) 4π r3 Esto significa que el campo magnético decrece con el cuadrado de la distancia, y que es siempre perpendicular al plano en que se mueve la carga. En el S.I. de unidades: B̄ = µ0 = 10−7 H/m (89) 4π A B̄ se le llama ”inducción magnética” y se mide en Teslas. Recordando la ley de Coulomb (1): 44 B̄ = µ0 ε0 [v̄ × Ē] (90) y como µ0 ε0 es una cantidad muy pequeña, se ve que a velocidades ordinarias B << E. La razón por la cual el campo magnético se hace evidente es porque en general la materia es eléctricamente neutra, de forma que, aunque pequeña, la fuerza magnética es la única relevante en muchas situaciones. 3.2 Ley de Biot-Savart Al igual que el campo eléctrico, el campo magnético obedece al principio de superposición: la inducción magnética B̄ creada por un conjunto de cargas en un punto es igual a la suma vectorial de las inducciones creadas por cada una de ellas: B̄ = X B̄i (91) i y como una corriente es un conjunto de cargas que se pueden suponer moviéndose a la misma velocidad y en la misma dirección 3 , esto permite encontrar el campo creado por elementos de corriente, y, por integración, la inducción creada por corrientes finitas. A partir de la ley fundamental (88), si consideramos un elemento de volumen dV que contiene una carga dq = ρdV , la cual se mueve a velocidad v̄: µ0 j̄ × r̄ dV (92) 4π r3 donde j̄ es la densidad de corriente. Particularizando a un hilo delgado de sección dS cuyo vector tangente d¯l tiene la misma dirección que la velocidad de las cargas, tenemos que j̄dV = id¯l, de manera que también: B̄ = µ0 i d¯l × r̄ (93) 4π r3 Ejemplo: un hilo de longitud infinita que coincide con el eje z transporta una intensidad i. Calcular la inducción magnética a una distancia b sobre el eje x. Solución: el vector de posición que va desde un elemento de corriente situado en z al punto del eje x de coordenada b es r̄ = (b, 0, −z), con r3 = (b2 + z 2 )3/2 . El elemento de corriente es d¯l = (0, 0, dz), de forma que d¯l × r̄ = (0, bdz, 0). Quiere decir que la inducción magnética tiene la dirección del eje y, y valor: B̄ = 3 Más bien, a las que se puede atribuir una velocidad media, pero no queremos entrar en estos detalles del transporte. 45 µ0 i bdz 2 4π (b + z 2 )3/2 dBy = (94) El campo total se encuentra integrando para z desde −∞ a ∞: µ0 i (95) 2πb Ejemplo: una espira circular de radio a se encuentra sobre el plano xy, con su centro en el origen de coordenadas. Encontrar la inducción magnética en un punto del eje z situado a distancia b. Solución: sea un pequeño elemento genérico de la espira, y sea θ el ángulo que forma su vector posición con el eje x. Entonces, el vector que va desde este elemento de corriente al punto b del eje z es r̄ = (−a cos θ, −a sin θ, b). Por otro lado, d¯l = adθ(− sin θ, cos θ, 0), de forma que d¯l × r̄ = adθ(b cos θ, b sin θ, a). Al integrar para z desde 0 a 2π, las componentes en x e y se anulan, y sólo queda componente z. La inducción total se encuentra integrando en θ, y resulta: By = µ0 i a2 2 (a2 + b2 )3/2 Bz = 3.3 (96) Propiedades de la inducción magnética Al calcular la divergencia de B̄, tenemos 1 1 v̄ × r̄ = ∇ 3 · (v̄ × r̄) + 3 ∇ · (v̄ × r̄) ∇· (97) 3 r r r pero por cálculo directo se ve que el resultado es nulo, de manera que ∇ · B̄ = 0 (98) Integrando esta expresión para un volumen V limitado por una superficie cerrada S y aplicando el teorema de la divergencia: Z S B̄ · dS̄ = 0 (99) Esto quiere decir que el flujo que atraviesa cualquier superficie cerrada es nulo, lo cual quiere decir que el flujo entrante es igual siempre al flujo saliente, lo cual quiere decir que no existen ni sumideros ni fuentes de lı́neas de campo magnético; finalmente, eso quiere decir que no existen cargas magnéticas. La otra propiedad importante de la inducción magnética es conocida como Ley de Ampere, y establece que la circulación de B̄ en un circuito sobre el que se apoya una superficie a través de la que existe un flujo de corriente, es: 46 Z C B̄ · d¯l = µ0 X Ii (100) i donde las Ii son las intensidades que atraviesan la superficie, tomadas como cantidades algebraicas, es decir, positivas si la dirección de la corriente es congruente con la regla de la mano derecha (el sentido de giro es el de la circulación) y negativas en caso contrario. Para la deducción, algo farragosa, de esta ley, remitimos a la bibliografı́a, y aquı́ la podemos tomar como la generalización de resultados experimentales. Este resultado es especialmente útil en algunos casos en que se presentan fuertes simetrı́as. Ejemplo: inducción magnética a una distancia b de un hilo infinito. Solución: por simetrı́a, sabemos que las lı́neas de campo son tangentes a circunferencias centradas en el hilo. Tomando como circuito una circunferencia de radio b: 2πbB = µ0 i (101) de donde B= µ0 i 2πb (102) de acuerdo con (95). Ejemplo: inducción magnética en el eje de una bobina. Solución: la simetrı́a del problema nos indica que B̄ será paralelo al eje. Tomando un circuito rectangular uno de cuyos lados de longitud l se encuentre sobre el eje, y tomando el paralelo a éste fuera de la bobina y muy alejado, para que allı́ el campo se pueda considerar nulo, como la circulación en los tramos perpendiculares es nula: Bl = µ0 N i (103) donde N es el número de vueltas de espira en la longitud l. Por tanto N i = µ0 ni (104) l donde n es el número de vueltas por unidad de longitud. No obstante ser útil, la aplicación de este resultado está limitada a unos pocos casos, aunque éstos sean de interés. Véase cómo no es útil en un caso tan simétrico como el de la espira simple. B = µ0 47 La ley de Ampére puede ponerse en forma diferencial recordando que de donde Z B̄ · d¯l = Z S (∇ × B̄) · dS̄ = µ0 Z S j̄ · dS̄ ∇ × B̄ = µ0 j̄ 3.4 (105) (106) Fuerza y pares sobre conductores A partir de la fuerza de Lorentz, podemos encontrar la fuerza sobre un elemento de corriente, y a partir de ahı́, por integración, la fuerza y el par sobre un elemento finito. En efecto, aislando un elemento de volumen dV que contiene una densidad de carga ρ que se mueve con velocidad v̄: dF̄ = ρ(v̄ × B̄)dV = (j̄ × B̄)dV (107) dF̄ = i(d¯l × B̄) (108) Pero para un elemento lineal de corriente, j̄dV = id¯l, de manera que Ejemplo: fuerza por unidad de longitud entre dos hilos paralelos separados una distancia b, por los que circulan intensidades ii e i2 . Solución: calculamos la fuerza sobre el hilo que conduce i2 . El campo creado por i1 sobre un elemento en el hilo 2 situado a distancia b es el que da (95): B= µ 0 i1 2πb (109) Entonces dF µ 0 i1 i2 = (110) dl 2πb donde hemos tenido en cuenta que B̄ es perpendicular al hilo. En cuanto al momento: M̄ = Z C (r̄ × dF̄ ) (111) El desarrollo de esta expresión es algo farragoso, y lo omitimos, pero damos el resultado: M̄ = p̄m × B̄ donde p̄m es el momento magnético del elemento, definido como 48 (112) p̄m = i 3.5 Z dS̄ (113) Magnetismo en la materia Al igual que las moléculas tienen momento dipolar eléctrico intrı́nseco, también tienen momento magnético intrı́nseco (se puede pensar en los electrones como pequeñas espiras de corriente alrededor del núcleo). En cada punto del material, se define un vector magnetización J¯ como el momento magnético por unidad de volumen: 1 X J¯ = p̄m,i ∆V i (114) Si no existe una dirección preferente, los momentos individuales se compensan unos con otros. Cuando existe una dirección preferente, el material muestra magnetización. Esta magnetización es la misma que producirı́a una distribución de corrientes. En un material homogéneo, perfectamente magnetizado en una dirección, el sistema de corrientes forma circuitos, todos girando en el mismo sentido, de forma que, en cualquier punto interior al material, cada circuito se compensa con los circuitos adyacentes. Queda sin compensar solamente una corriente superficial. En un material no homogéneo quedan sin compensar corrientes en el interior del material. Si implementásemos en el vacı́o estas corrientes, el resultado serı́a equivalente al producido por el momento magnético intrı́nseco. Lo que ocurre es que a su vez estas corrientes dependen del vector B̄, ası́ que el cálculo de B̄ en el interior del volumen no es directo: para conocer el campo necesitamos las corrientes, pero éstas dependen del campo, que es desconocido. Llamaremos j̄ ′ a estas corrientes equivalentes. 3.6 Circulación del vector J¯ Consideremos una superficie cualquiera S y su contorno C en el seno de un material magnético. Acudiremos a un razonamiento microscópico, y consideraremos a cada átomo o molécula del material como una pequeña espira de superficie sm por la que circula una corriente im , dando un momento magnético pm . Calculemos el flujo de las corrientes equivalentes a través de S. Cualquier circuito que corte la superficie sin incluir al contorno, lo hará en dos puntos, en dos direcciones opuestas, y por tanto dará como resultado un flujo nulo. Sólo quedan sin compensar las corrientes que atraviesan S una sola vez, y esas son las que abrazan al contorno C. Sea dl un segmento pequeño de ese contorno. Si en el material hay n moléculas por unidad de volumen, 49 la corriente que atraviesa S en la longitud dl del contorno es di′ = nim dV , con dV = sm dl cos α y siendo α el ángulo que forma la normal a los pequeños circuitos con d¯l. Entonces: di′ = nim sm dl cos α = npm dl cos α, pero esto es justamente J¯ · d¯l. Finalmente, si integramos a todo el contorno: Z C J¯ · d¯l = Z S j̄ ′ · dS̄ (115) pero la integral de circulación sabemos que es la integral de superficie del rotacional, luego: Z C Z J¯ · d¯l = y ası́ encontramos que S ¯ · dS̄ = (∇ × J) Z S ∇ × J¯ = j̄ ′ 3.7 j̄ ′ · dS̄ = i′ (116) (117) Vector H̄ Ası́ pues, la ley de Ampere aplicada a un material magnético ha de incorporar las corrientes equivalentes, y escribirse como Z B̄ · d¯l = µ0 (i + i′ ) C (118) Pero esta expresión no es útil, porque las i′ dependen de B̄, que a su vez depende de i′ . Por eso escribimos: Z ! B̄ − J¯ d¯l = i µ0 C (119) Introducimos el vector auxiliar H̄ = B̄/µ0 − J¯ y tenemos la versión para medios magnéticos de la ley de Ampere: o en formato diferencial: Z C H̄ · d¯l = i ∇ × H̄ = j̄ (120) (121) Si suponemos una dependencia lineal de J¯ con H̄, de la forma J¯ = χm H̄, entonces H̄ = B̄ − χm H̄ µ0 50 (122) de donde B̄ = µµ0 H̄ (123) con µ = 1 + χm . A χm se le llama ”susceptibilidad magnética”. Se puede ver ahora que en un medio homogéneo, si no hay corrientes de conducción j̄ tampoco hay corrientes equivalentes j̄ ′ . En efecto: ′ i = Z S ′ j̄ · dS̄ = Z C J¯ · d¯l = χm Z C H̄ · d¯l = i (124) de manera que i′ = χm i y j̄ ′ = χm j̄. De aquı́ se ve que j̄ ′ = 0̄ si j̄ = 0̄. 3.8 Condiciones de contorno De manera similar a como hicimos con el campo eléctrico, ahora partiremos de: y Z C Z C B̄ · dS̄ = 0 (125) H̄ · d¯l = i (126) para deducir condiciones de contorno. De la primera, tomando un pequeño cilindro de altura despreciable y caras paralelas a la superficie de separación de dos medios magnéticos, despreciando el flujo en la superficie lateral: B1n ∆S − B2n ∆S = 0 (127) de donde B1n = B2n . De la segunda, tomando un pequeño circuito rectangular de lados dl paralelos a la interfaz y lados perpendiculares a la misma de longitud despreciable, se sigue H1t − H2t = jn (128) donde jn es la componente de la corriente de conducción perpendicular al circuito considerado. Si esta densidad es nula, entonces H1t = H2t . Igual que en el caso de las lı́neas de campo eléctrico, se puede ver aquı́ que existe una refracción. 51 3.9 Campo en un medio magnético homogéneo Hemos dicho que el campo B̄ es debido tanto a las corrientes de conducción como a las corrientes equivalentes originadas en el momento intrı́nseco magnético de los materiales. El problema es que esas corrientes son a su vez función del campo. Hay un caso sin embargo en que se puede razonar sobre la configuración total del campo, y es cuando el medio está completamente ocupado por un material magnético homogéneo. Supongamos una zona del espacio que contiene sólo corrientes de conducción, que dan lugar a un campo B̄0 . Si rellenamos el espacio circundante a los conductores con un material magnético, no conductor, homogéneo e isótropo, aparecerá una magnetización en su superficie, inducida por B̄0 , que podemos atribuir a corrientes superficiales. Considerando un circuito que rodea a un conductor, que consideramos fino: Z C J¯ · d¯l = χm Z C H̄ · d¯l = i′ = χm i (129) Quiere decir que el campo de magnetización creado por i′ no difiere del campo B̄0 más que en una constante en cada punto. El campo total es entonces B̄ = B̄0 + B̄ ′ = (1 + χm )B̄0 = µB̄0 (130) ¯ y además hay una relación simple entre el campo de magnetización y J, ya que B̄ ′ = B̄ − B̄0 = (1 − 1 )B̄ µ (131) ¯ m , se sigue B̄ ′ = µ0 J. ¯ y como B̄ = µµ0 H̄ y H̄ = J/χ 3.10 Inducción magnética El fenómeno de la inducción, descubierto por Faraday en 1831, consiste en la aparición de una correinte en una espira cerrada cuando varı́a el flujo de campo magnético que la atraviesa. Esto delata la aparición de una fuerza electro-motriz. Esta fem no depende de la forma cómo se consiguió el cambio de flujo, sino sólo de la derivada: dΦ (132) dt Es decir, el resultado es el mismo cuando el cambio se consigue moviendo la espira, o alterando el campo B̄ que la atraviesa, o ambas cosas a la vez. E =− 52 Además, se cumple la ley de Lenz: la corriente inducida es tal que crea un campo cuyo flujo se opone al flujo que la causó. Esto explica el signo menos en la ecuación anterior. La unidad de flujo es el Weber. Si la variación en el flujo es 1 W b/s, entonces E = 1V . Si la espira no es simple, sino que contiene n vueltas, entonces el flujo es n veces el flujo que atraviesa una espira simple. El origen de E ası́ como su sentido se puede ver considerando un experimento en que un circuito rectangular tiene un lado deslizante. Cuando éste se mueve con velocidad v̄ aparece una fuerza de Lorentz sobre los electrones del conductor, que se ponen en circulación. Esta corriente crea a su vez un campo magnético, y se ve que el sentido de éste es contrario al del que originó el movimiento de los electrones. Aquı́, el Ē ⋆ de la ecuación (85) es v̄ × B̄, y se ve también que tiene sentido contrario al de la circulación que determina la normal a la superficie de la espira. Se ve que dΦ Ē ⋆ · d¯l = −vBl = − (133) dt C Un caso distinto ocurre cuando el área es fija y el cambio en el flujo viene por el cambio en B̄. Como las dos únicas fuerzas posibles son q Ē y q[v̄ × B̄] y la segunda no puede ser 4 , se concluye con que hay una fuerza eléctrica tal que E= de donde Z Z d Ē · d¯l = − dt C Z S B̄ · dS̄ = − Z S ∂ B̄ · dS̄ ∂t (134) ∂ B̄ (135) ∂t que está en aparente contradicción con (9), que nos indica que ∇× Ē = 0̄. La contradicción es sólo aparente, porque allı́ considerábamos un campo electrostático, y aquı́ no. El campo eléctrico total será la suma del electrostático y del variable. Como el rotacional del electrostático es nulo, la ecuación anterior es válida para el campo total. ∇ × Ē = − 3.11 Autoinducción e inducción mutua Como el origen del cambio en el flujo es irrelevante, puede darse y se da de hecho el fenómeno en una espira aislada por la que circula una corriente variable. Entonces, la variación de la corriente crea una variación en el flujo, que crea una E que se opone a la que crea la variación del flujo. Entonces, al 4 En el ejemplo del circuito con un lado deslizante, se ve que v̄ = 0. 53 cerrar una espira abierta se induce una E que se opone al establecimiento de la corriente. Al abrir el circuito, se induce una fem que tiende a hacer que continúe la corriente. Por otro lado, cuando se tienen dos espiras, el flujo que atraviesa una de ellas depende de la corriente que atraviesa a la otra, y viceversa: Φ1 = L12 i2 Φ2 = L21 i1 (136) Es un hecho experimental, y cálculos detallados lo pueden confirmar, que L12 = L21 . 4 Bibliografı́a De entre la gran cantidad de bibliografı́a, recomendamos aquı́ el excelente ”Basic laws of electromagnetism”, de I. E. Irodov. La virtud de este libro es que tiene una coherencia lógica perfecta y que no contiene innecesarias distracciones. De un nivel algo superior, puede consultarse ”Campos y ondas electromagnéticos”, de P. Lorrain y Dale R. Corson. 5 Resumen conceptual 1. Concepto de campo. 2. Campo eléctrico: de una carga y de una distribución, discreta y continua. 3. Rotacional y divergencia en una región libre de cargas. Ecuación de Laplace. 4. Divergencia en una región que contiene cargas. Ecuación de Poisson. 5. El campo eléctrico en la materia. Conductores y dieléctricos. 6. Campo y fuerza superficial en un conductor. 7. Dieléctricos. Dipolo y momento dipolar. 8. Vector P̄ . Propiedades. Vector D̄, propiedades. 9. Condiciones de contorno. 54 10. Energı́a del campo eléctrico. 11. Corriente. 12. Campo magnético. Fuerza de Lorentz. Ley de Biot-Savart. Campo creado por una distribución de corriente. 13. Divergencia de B̄. Circulación de B̄. Ley de Ampere. 14. Fuerzas y pares sobre conductores. ¯ Circulación de J. ¯ 15. Magnetismo en la materia. Vector J. 16. Vector H̄. Condiciones de contorno. 17. Inducción magnética y rotacional de Ē. Autoinducción e inducción mutua. 6 Ejercicios 1. Dada una distribución superficial uniforme de carga de densidad σ sobre el plano (x, y), calcular el campo eléctrico en el punto (0, 0, z). 2. Encontrar la energı́a de interacción de cinco cargas eléctricas q situadas en los vértices de un pentángono regular de lado a. 3. Encontrar el campo magnético creado por un hilo de longitud l a una distancia l medida por la perpendicular al hilo desde uno de sus extremos. Por el hilo circula una intensidad i. Usar el resultado para calcular el campo en el centro de una espira cuadrada de lado l. 4. Sean dos hilos paralelos y una espira rectangular, dos de cuyos lados, de longitud h, son paralelos a los hilos. Los otros dos lados tienen longitud w. ra es la distancia del hilo más cercano a la espira al lado de ésta más cercano a él. rb es la distancia del hilo más alejado al lado de la espira más cercano a él. Por los hilos circulan intensidades i, de sentidos contrarios, que cambian con velocidad di/dt. Calcular la fuerza electro-motriz inducida en la espira. 55 III Sistemas electromecánicos 1 Motivación Consideremos una masa m sometida a una fuerza u moviéndose en una dimensión. Llamemos q a su coordenada. Además de u, sobre la masa actúa un resorte elástico de constante k y un amortiguador de fricción de constante β. Aplicando la ecuación de Newton a esta masa tenemos que mq̈ = u − kq − β q̇ (1) u − mq̈ − β q̇ − kq = 0 (2) o Sea ahora un circuito RLC sencillo, de una sola malla, con una fuente de alimentación que establece una ddp de u. Por el circuito circula una carga q. La ecuación de este circuito es di q + Ri + dt C reordenando y teniendo en cuenta que i = dq/dt: u=L u − Lq̈ − Rq̇ − q/C = 0 (3) (4) La semejanza es evidente: la bobina de autoinducción L se corresponde con la inercia de la masa m. La resistencia se corresponde con el amortiguador, y el condensador con el resorte. Estas semajanzas permiten plantear la cuestión de si serı́a posible tener una teorı́a general que pudiese acomodar sistemas con partes mecánicas y eléctricas, de forma que pudiesen resolverse simultáneamente las partes eléctricas y mecánica, más la interacción entre ellas. Para ilustrar con un ejemplo lo que queremos decir, imagı́nese una circuito RLC sencillo de una sola malla, alimentado mediante una ddp u, donde el condensador de placas paralelas está construido de la siguiente forma: la distancia entre las placas no es fija, sino que una placa está fija y la otra puede acercarse o alejarse de la otra, mediante un muelle de constante k. Al circular la corriente, se polariza el condensador, y la fuerza entre las placas hace que éstas se acerquen. Esta variación en la capacidad influye en la corriente circulante y por tanto en la fuerza entre las placas del condensador, por lo que se altera su movimiento, lo cual altera a su vez su capacidad, que modifica la corriente circulante, etc. 56 2 Hacia una teorı́a unificada En principio, la unificación de la Mecánica con la Electricidad no parece posible, a pesar de las evidentes semejanzas que se ven en las ecuaciones (1) y (2). El problema es que la Mecánica newtoniana es una teorı́a vectorial, mientras que la teorı́a de circuitos es una teorı́a escalar. Ahora bien: la mecánica newtoniana tiene algunos serios inconvenientes, y debido a eso ya en el siglo XVIII se buscaron formulaciones alternativas. Una de estas alternativas es la formulación de Lagrange. La formulación de Lagrange es ya una formulación escalar, igual que la de circuitos. Una vez situados en una teorı́a mecánica escalar, es fácil sacar provecho de las semejanzas entre sistemas mecánicos y eléctricos, y extenderla para incluir a los últimos. Pero, ¿cuales son los inconvenientes de la teorı́a de Newton? 1) En primer lugar, es una teorı́a vectorial, y esto implica que los problemas se plantean en sistemas de referencia cartesianos, lo cual puede no ser adecuado. Por ejemplo, la posición de un péndulo simple viene dada de forma unı́voca por el ángulo que forma con la vertical. Pero en la formulación de Newton es imprescindible usar coordenadas cartesianas, que son dos si el movimiento es en el plano. 2) En segundo lugar, es una teorı́a que es sólo válida en un tipo particular de sistemas llamados ”inerciales”. Cuando los sistemas no son inerciales, es preciso incluir fuerzas ficticias que hacen artificiosa la solución. 3) En tercer lugar, en la ecuación de Newton, F̄ = mā, F̄ es la resultante de todas las fuerzas que actúan sobre la masa m. Algunas de esas fuerzas pueden ser desconocidas, y entran en el problema como incógnitas, complicando la solución. Por ejemplo, sobre la masa de un péndulo actúa la gravedad, pero también la tensión del hilo, que a su vez depende del movimiento de la masa. 4) Es una formulación adecuada para sistemas de partı́culas, pero poco adecuada para sólidos y sistemas continuos. En la formulación de Newton, cada uno de los cuerpos se aisla mentalmente, se hace recuento de todas las fuerzas que actúan sobre él y se escribe su ecuación del movimiento. Si hay n cuerpos este proceso se repite n veces para obtener un sistema de n ecuaciones. Pero un sólido continuo contiene una infinidad de partı́culas, y es evidente entonces que la solución no es factible a menos que se introduzcan hipótesis adicionales. Estas hipótesis fueron introducidas por Newton, y son el principio de acción y reacción y el que las fuerzas entre partı́culas sean centrales. La mecánica de Lagrange resuelve todos estos inconvenientes: 1) Pueden usarse aquellas coordenadas que mejor describan la configuración del sistema. En el caso del péndulo, basta usar el ángulo θ: el 57 procedimiento de Lagrange da entonces una sola ecuación en θ. 2) Es válida en cualquier sistema de referencia, inercial o no. No es preciso por tanto inventar fuerzas ficticias. 3) Las fuerzas desconocidas, como tensiones y, en general, las fuerzas que limitan el movimiento, quedan excluidas de la formulación del problema. No es preciso preocuparse por ellas. Al mismo tiempo, si se desea, pueden calcularse después. 4) El método de Lagrange se aplica a sistemas completos: no es preciso individualizar cada parte y razonar sobre ella. De hecho, las ecuaciones del movimiento se obtienen a partir de una cantidad escalar T que es función sólo de las coordenadas elegidas para representar la posición del sistema. En el caso del péndulo, no es preciso conocer la tensión de la cuerda y T es una función sólo de θ. 3 3.1 Mecánica de Lagrange Principio de D’Alembert La Mecánica lagrangiana es una formulación radicalmente diferente de la mecánica, y muy distinta de la Mecánica de Newton. No es entonces extraño que parta de un principio radicalmente diferente. Este principio es el de los trabajos virtuales de D’Alembert, que establece que, para un sistema de masas mi sometidas cada una de ellas a fuerzas resultantes F̄i , se cumple que X i (F̄i − mi āi ) · δr̄i = 0 (5) A primera vista, este principio no difiere de la ecuación de Newton, e incluso parece que se deduce de él, porque, si la ecuación de Newton nos dice que F̄i − mi āi = 0, sea lo que sea que signifique δr̄i , es claro que de la ecuación de Newton se deduce el principio de D’Alembert. Pero no es ası́. El motivo principal es que en la ecuación de Newton la fuerza F̄i es la resultante de todas las fuerza que actúan sobre mi , incluidas las fuerzas que, de alguna manera, restringen el movimiento de mi . Por ejemplo, la ecuación de Newton, en el caso del péndulo, incluye la tensión de la cuerda, responsable de que el movimiento transcurra de tal forma que la distancia de la masa del péndulo al punto de suspensión permanezca constante. O, por ejemplo, cuando una masa se mueve sobre una superficie plana, existe una fuerza que el plano ejerce sobre la masa, de manera que el movimiento de ésta queda restringido al plano. A estas fuerzas que restringen el movimiento se las llama ”fuerzas de ligadura”. Pero en el principio de D’Alembert F̄i es 58 la resultante de las fuerzas que actúan sobre mi , excluidas las fuerzas de ligadura. Por tanto, de la ecuación de Newton no puede deducirse el principio de D’Alembert o ”principio de los trabajos virtuales”, y debe considerarse un principio independiente. Una vez establecido qué es F̄i , es preciso ver qué es δr̄i . Son ”desplazamientos virtuales”. Un desplazamiento virtual es la diferencia entre dos movimientos reales posibles. Veámoslo con un ejemplo. Una masa m se mueve sobre una superficie. Desde un punto de esa superficie, m puede moverse en un plano tangente a la misma. La diferencia de dos vectores desplazamiento en el plano tangente es otro vector en el plano tangente. Por tanto, en este caso, los desplazamientos virtuales coinciden con desplazamientos reales. Imaginemos ahora que la superficie se mueve con una velocidad ū. El desplazamiento d¯1 de la masa es la composición de su desplazamiento sobre la superficie, dr̄1 más el desplazamiento de la superficie en el intervalo de tiempo dt que haya llevado dr̄1 , y vale ūdt, ası́ que d¯1 = dr̄1 + ūdt. De la misma forma, otro movimiento posible es d¯2 = dr̄2 + ūdt. El desplazamiento virtual es en este caso d¯1 − d¯2 = dr̄1 − dr̄2 . Coincide con el caso anterior, solo que ahora la superficie estaba en movimiento. Es como si el tiempo hubiese sido ”congelado”; como si el movimiento virtual se produjese a t = constante. 3.2 Coordenadas generalizadas El concepto de coordenada generalizada no entra directamente en la formulación vectorial de la Mecánica. Por contra, ocupa un lugar central en la Mecánica Analı́tica, que es una ciencia que reduce los problemas del movimiento de los cuerpos a la aplicación ordenada de procedimientos algebraicos. Lagrange (1736-1813) lo expresó ası́ en su Mechanique Analitique de 1788: Ya existen diversos tratados de Mecánica, pero el programa de éste es completamente nuevo. Me he planteado la tarea de reducir tanto la teorı́a como el arte de resolver los problemas concernientes a esta Ciencia a fórmulas generales cuya simple aplicación dé todas las ecuaciones necesarias para obtener la solución de cada problema. Más aún: No se encontrarán figuras en esta obra. Los métodos que aquı́ expongo no requieren ni imágenes ni razonamientos geométricos o mecánicos, sino tan sólo operaciones algebraicas sujetas a un proceso regular y uniforme. 59 Consideremos un sistema de N partı́culas, cada una de las cuales tiene, en el espacio euclı́deo tridimensional, coordenadas r̄i . Nuestro problema consiste en encontrar r̄i (t), es decir, encontrar 3N funciones del tiempo. Definiremos las coordenadas generalizadas qi como el mı́nimo conjunto de n variables en función de las cuales pueden escribirse los r̄i : r̄i = fi (q1 , · · · , qn , t) (6) q̈i = fi (q1 , · · · , qn , q̇1 , · · · , q̇n , t) (7) A este número mı́nimo le llamaremos grados de libertad del sistema. Por ejemplo, la posición de un péndulo ideal puede darse en función del ángulo que forma con la vertical: n = 1, q1 = θ. La posición de un punto material sobre una superficie f (x, y, z) puede especificarse mediante el par q1 = x, q2 = y, y en este caso n = 2. Ocasionalmente, el conjunto de coordenadas generalizadas adecuadas para un problema en concreto puede coincidir con las coordenadas cartesianas de una o varias de las partı́culas que constituyen el sistema, aunque esto no es lo habitual. En el movimiento de un planeta alrededor del Sol, pueden usarse coordenadas cartesianas, pero son más adecuadas las coordenadas polares. Como último ejemplo, consideremos un sólido rı́gido. Su posición en el espacio puede darse mediante las coordenadas de su centro de masas y tres ángulos que especifican su orientación: es un sistema con seis grados de libertad. Aplicando los principios de la Mecánica Analı́tica encontraremos el conjunto de ecuaciones diferenciales ordinarias: La solución de este conjunto de ecuaciones se considera como la solución del problema y normalmente no se requiere la obtención de las coordenadas cartesianas. 3.3 Ecuaciones de Lagrange Escribiremos el principio de D’Alembert en función de las coordenadas generalizadas qi . Veamos para ello que: δr̄i = X ∂r̄i ∂qj j δqj (8) y transformemos cada uno de los términos en la formulación original. En primer lugar: X i F̄i δr̄i = X i F̄i X ∂r̄i j ∂qj δqj = X X j 60 i ∂r̄i F̄i ∂qj ! δqj = X j Qj δqj (9) donde hemos introducido las fuerzas generalizadas Qj . Por otro lado: X mi āi δr̄i = i X mi i X d X dr̄˙i d δr̄i = (mi r̄˙i δr̄i ) − mi r̄˙i δr̄i dt dt i dt i (10) Para el primer término: X ∂r̄i d X d X δqj mi r̄˙i δr̄i = mi r̄˙i dt i dt i j ∂qj (11) ∂r̄i ∂ r̄˙i = ∂qj ∂ q˙j (12) ∂r̄i dr̄i X ∂r̄i = q˙j + dt ∂t j ∂qj (13) Ahora bien: En efecto: y de esta última se sigue la anterior. Por tanto, el primer término queda: ∂ r̄˙i d X X mi r̄˙i dt j ∂ q˙j i ! d X ∂ δqj = dt j ∂ q˙j X1 i 2 mi r̄˙i 2 ! δqj (14) Para el segundo: X i =  X mi r̄˙i X mi r̄˙i X mi r̄˙i i = = ∂qj mi r̄˙i i X ∂ j X ∂ r̄˙i j XX j ∂qj j i = k X ∂ ∂qj ! δqj ! ! X ∂r̄i k ∂r̄i δqj q˙k + ∂qk ∂t δqj ∂ r̄˙i δqj ∂qj X1 i ∂r̄i ∂qj ∂ 2 r̄i q˙k + δqj ∂qj ∂qk ∂qj ∂t X X ∂ 2 r̄i j i =  X X d d d X ∂r̄i  X mi r̄˙i δr̄i = mi r̄˙i  δqj = mi r̄˙i dt dt j ∂qj i i j dt 2 mi r̄˙i 2 ! δqj (15) Definamos el escalar T como 61 T = X1 i 2 mi r̄˙i 2 (16) al que llamaremos Energı́a Cinética. Si ahora reunimos todas las piezas, podemos escribir el principio de D’Alembert en función de las coordenadas generalizadas: X j " # d ∂T ∂T − − Qj δqj = 0 dt ∂ q˙j ∂qj (17) En esta versión del principio de D’Alembert, toda la información sobre el sistema se encuentra sintetizada en el escalar T , y todas las fuerzas aplicadas, en las fuerzas generalizadas Qj . Si las coordenadas qj son realmente coordenadas generalizadas, es decir, el mı́nimo número de parámetros en función de los cuales puede expresarse la posición de cualquier punto del sistema, no existirán relaciones funcionales entre ellas, y las δqj serán independientes, lo que conduce a las n ecuaciones del movimiento d ∂T ∂T − − Qj = 0 dt ∂ q˙j ∂qj (18) para j = 1, · · · , n. 3.4 Procedimiento y ejemplos El procedimiento para encontrar las ecuaciones del movimiento (18) se puede entonces resumir en los siguientes puntos: 1. Escribir T en función de las coordenadas cartesianas. 2. Transformar la expresión, escribiendo las coordenas cartesianas y sus derivadas en función de las coordenadas generalizadas elegidas. 3. Calcular las Qj . 4. Aplicar (18) para cada coordenada generalizada. Ejemplo: ecuaciones del movimiento de una partı́cula de masa m que se mueve en el plano xz bajo la acción de la gravedad. Solución: la energı́a cinética es 1 T = m(ẋ2 + ż 2 ) 2 62 (19) Como hay dos grados de libertad, necesitamos dos coordenadas generalizadas. Estas pueden ser las mismas coordenadas cartesianas, con lo cual nos ahorramos el paso 2). En cuanto a las fuerzas generalizadas, la única fuerza activa es la de la gravedad, de componentes ḡ = (0, −g). Las fuerzas generalizadas son entonces: y Qx = ḡ · ∂r̄ ∂x (20) Qy = ḡ · ∂r̄ ∂y (21) siendo r̄ = (x, y). Entonces ∂r̄/∂x = (1, 0) y ∂r̄/∂z = (0, 1). De aquı́ Qx = 0 y Qz = −g. Las dos ecuaciones del movimiento son: y ∂T d ∂T − − Qx = 0 dt ∂ ẋ ∂x (22) ∂T d ∂T − − Qz = 0 dt ∂ ż ∂z (23) mẍ = 0 mz̈ = −g (24) que se reducen a: Ejemplo: movimiento de un péndulo simple de longitud l y masa m sometido a la gravedad. Lo suponemos contenido en el plano xz, con el eje z dirigido verticalmente hacia abajo. Solución: es evidente que basta saber el ángulo θ que forma el hilo con el eje vertical para determinar la posición del péndulo, luego usaremos θ como única coordenada generalizada. La energı́a cinética es 1 T = m(ẋ2 + ż 2 ) 2 (25) y en función de θ: x = l sin θ z = l cos θ de donde 63 (26) ẋ = lθ̇ cos θ ż = −lθ̇ sin θ (27) con lo cual queda: 1 (28) T = ml2 θ̇2 2 Como sólo hay una coordenada generalizada, sólo hay una ecuación, y sólo una fuerza generalizada Qθ , que es ∂r̄ ∂θ con ḡ = (0, mg) y r̄ = (l sin θ, l cos θ). Derivando: Qθ = ḡ · (29) ∂r̄ = (l cos θ, −l sin θ) ∂θ (30) Qθ = −mlg sin θ (31) ∂T d ∂T − − Qθ = 0 dt ∂ θ̇ ∂θ (32) ml2 θ̈ + mgl sin θ = 0 (33) Finalmente La única ecuación del movimiento es es decir: Ejemplo: una barra rı́gida de longitud l y masa m se encuentra en el plano vertical, apoyada en el suelo y en una pared que forma ángulo recto con el suelo; se supone que no hay rozamiento. Si se abandona desde una posición cualquiera, la barra se desliza y cae. Encontrar la ecuación del movimiento. Solución: hay una sola ecuación del movimiento porque hay sólo una coordenada generalizada, que puede ser el ángulo θ que forma la barra con el suelo. Pero hay una infinidad de elementos de masa, ası́ que la energı́a cinética total se encuentra sumando las energı́as de todos los elementos. Sea uno de estos elementos, situado a una distancia s del extremo inferior de la barra. Las coordenadas de este elemento son xs = (l − s) cos θ zs = s sin θ 64 (34) Si la longitud del elemento es ds, su masa es λds, y su energı́a cinética 1 dTs = λds(ẋ2s + żs2 ) (35) 2 Derivando (34), sustituyendo en (35) e integrando desde s = 0 a s = l, tenemos la energı́a total: 1 T = ml2 θ̇2 (36) 6 La fuerza sobre el elemento λds es ḡ = (0, −λgds) y ∂r̄/∂θ = (−(l − s) sin θ, s cos θ). De aquı́, dQθ = −λg cos θsds. Integrando desde s = 0 a s = l, se tiene que Qθ = − 21 mgl cos θ. Aplicando (18) y tras simplificar un poco se encuentra la ecuación del movimiento de la barra: θ̈ + 3.5 3g cos θ = 0 2l (37) Sistemas con función potencial Puede suceder que las fuerzas aplicadas al sistema deriven de una función potencial, es decir, que exista una función U (q1 , · · · , qn ) tal que: ∂U ∂ r¯i En este caso, las fuerzas generalizadas adoptan la forma sencilla: F̄i = − Qj = X i F̄i X ∂U ∂ r¯i ∂ r¯i ∂U =− =− ∂qj ∂qj i ∂ r¯i ∂qj (38) (39) Las ecuaciones (18) pueden escribirse entonces en la forma: ∂L d ∂L − =0 dt ∂ q˙j ∂qj (40) donde hemos introducido la función L = T − U , conocida como función de Lagrange, o simplemente Lagrangiana. Esta función dependerá en general de las coordenadas y velocidades generalizadas, y posiblemente del tiempo: bien porque la energı́a potencial dependa del tiempo, bien porque las relaciones r¯i (q1 , · · · , qn , t) lo contengan, bien por ambas causas a la vez. Cuando las ecuaciones del movimiento pueden escribirse en esta última forma, que recordemos son ecuaciones diferenciales de segundo orden en las coordenadas generalizadas, es posible averiguar las circunstancias en que existen integrales primeras, que pueden usarse para resolver las ecuaciones del movimiento. 65 En primer lugar, veamos que cuando una coordenada qj no aparece explı́citamente en la Lagrangiana: d ∂L =0 dt ∂ q˙j (41) lo que implica que la cantidad pj = ∂L ∂ q˙j (42) es una constante. A pj se le llama momento generalizado. En segundo lugar, procedamos a calcular la derivada respecto al tiempo de la Lagrangiana: ! ∂L ∂L dL X ∂L = q˙j + q¨j + dt ∂qj ∂ q˙j ∂t j (43) Pero usando (41), dL X d ∂L q˙j = dt ∂ q˙j j dt ! + ∂L ∂t (44) Intercambiando en el segundo miembro derivada y sumatoria:   X d  ∂L L− pj q˙j  = dt ∂t j (45) De manera que cuando L no es función explı́cita del tiempo, resulta que la cantidad h=L− X pj q˙j (46) j es constante. De esta forma, una de las velocidades puede expresarse en función de las coordenadas y velocidades restantes. 3.6 Fuerzas disipativas En general, actuarán sobre los sistemas fuerzas que deriven de un potencial y fuerzas que no deriven de un potencial. Designando estas últimas por Q∗j , es evidente que: d ∂L ∂L − = Q∗j dt ∂ q˙j ∂qj 66 (47) Por otro lado, pueden existir fuerzas de rozamiento dependientes de la velocidad, de la forma F̄i = −k r¯˙i (48) Las fuerzas generalizadas se escriben entonces como: Qj = X i F̄i X X ∂ r¯i ∂F ∂ r¯i ∂ r¯˙i =− =− =− k r¯˙i k r¯˙i ∂qj ∂qj ∂ q˙j ∂ q˙j i i (49) donde hemos introducido la función de disipación de Rayleigh F: F= X1 i 2 k r¯˙i 2 (50) Para tales sistemas, donde parte de las fuerzas derivan de un potencial y otra parte son fuerzas disipativas, las ecuaciones del movimiento son: ∂L ∂F d ∂L − + =0 dt ∂ q˙j ∂qj ∂ q˙j 4 (51) Sistemas electromecánicos A continuación trazaremos el paralelismo entre los sistemas eléctricos y los sistemas mecánicos, veremos la forma de escribir la ”energı́a cinética” para los sistemas eléctricos, cómo calcular las ”fuerzas generalizadas” y consecuentemente cómo calcular las ”ecuaciones del movimiento”. Finalmente, ilustraremos el procedimiento con algunos ejemplos. 4.1 Coordenadas generalizadas En un circuito formado por una serie de ramas, las coordenadas generalizadas son las cargas qj que circulan por cada rama. Ahora bien, en el paso de (17) a (18) hemos supuesto que todas las coordenadas generalizadas son independientes. Usualmente, en los circuitos eléctricos esto no sucede ası́, porque en cada nudo, que son los puntos en que confluyen tres o más ramas, ha de suceder que la suma de las intensidades entrantes iguale a la suma de las intensidades salientes. Esta condición constituye una ecuación, que puede usarse para escribir una de las qj en función de las demás. Aplicando el mismo procedimiento a todos los nudos, se pueden eliminar las coordenadas superfluas. 67 4.2 Energı́a cinética La energı́a cinética de una masa que se mueve en una dimensión es 1 T = mq̇ 2 (52) 2 La energı́a cinética de una serie de masas mi con coordenadas r̄i es T = 1X 2 mi r̄˙ i 2 i (53) Cuando las r̄i son funciones de las coordenadas generalizadas (no consideramos el caso en que son funciones también del tiempo) tenemos que r̄˙ i = X ∂r̄i j y 2 r̄˙ i = X j,k ∂r̄i ∂qj ! (54) ∂qj ! X ∂r̄i Aij,k q̇j q̇k q̇j q̇k = ∂qk j,k (55) de forma que la energı́a cinética es T = XX 1 j,k i 2 mi Aij,k q̇j q̇k = 1X Mj,k q̇j q̇k 2 j,k (56) Ahora, el paralelo eléctrico: La energı́a magnética en una bobina de autoinducción L por la que circula una intensidad i = q̇ es 1 T = Lq̇ 2 (57) 2 (57) es el equivalente de (52). La energı́a magnética de una serie de bobinas con coeficientes de inducción Lj y de inducción mutua Mj,k (Mj,j = Lj ) por las que circulan intensidades ij = q̇j es T = 1X Mj,k q̇j q̇k 2 j,k (58) y (56) tienen exactamente la misma forma. 68 (58) 4.3 Energı́a potencial En un circuito eléctrico, la ”energı́a potencial” se encuentra en dos sitios: en las fuentes de voltaje y en los condensadores. En el campo de la gravedad, la energı́a potencial de un cuerpo situado a altura q (el eje q está dirigido hacia arriba) es u = mgq. La energı́a suministrada por una fuente de voltaje u es uq. Por otro lado, la energı́a almacenada en un resorte de constante k es 1 2 kq 2 y la energı́a almacenada en un condensador de capacidad C es (59) 1 q2 (60) 2C (59) y (60) tienen exactamente la misma forma. En general, la ”energı́a potencial” de una malla que contiene r condensadores y s fuentes de voltaje es U= X 1 qr2 r 4.4 2C − X us q s (61) s Fuerzas generalizadas Comparando (18) y (51), se ve que las fuerzas generalizadas Qj , cuando hay fuerzas aplicadas que derivan de un potencial y fuerzas disipativas, se pueden poner como Qj = − ∂F ∂U − ∂qj ∂ q̇j (62) En los sistemas eléctricos, U viene dada por (61) y se toma F= 1X Rp q̇p2 2 p (63) cuando se tiene un sistema de p resistencias Rp por las que circulan cargas qp . 4.5 Selección de ejemplos Mostramos a continuación una serie de ejemplos. Para hacerlos más ilustrativos, algunos los resolveremos por duplicado: una vez por los medios convencionales y otra usando el formalismo lagrangiano. Se verá que este formalismo no parece muy ventajoso: esto se debe a que los ejemplos que 69 elegimos son sencillos: no son difı́ciles de resolver ni por un medio ni por otro. Posteriormente, consideraremos algún ejemplo más complejo, y alguno en que el sistema contiene partes eléctricas y partes mecánicas. Ejemplo 1: Resolver el circuito de la Figura 1. Figura 1 a) Método convencional. Sólo hay una malla, por tanto una corriente. Recorriendo la malla u − iR = 0, de donde obtenemos la intensidad i = u/R. b) Método lagrangiano. La ”energı́a cinética” es nula, porque no hay autoinducciones. La ”energı́a potencial” es U = −uq y la función de Rayleigh F = (1/2)Rq̇ 2 . La única ecuación de Lagrange es 0=− ∂U ∂F − ∂q ∂ q̇ (64) de donde u = Rq̇ = Ri. Ejemplo 2: Resolver el circuito de la Figura 2. a) Método convencional. Igualando las subidas y bajadas de potencial a lo largo de la malla: di = Rq̇ + Lq̈ (65) dt b) Método lagrangiano. La energı́a cinética está asociada a la bobina, y u = Ri + L es 1 T = Lq̇ 2 2 70 (66) Figura 2 La ”energı́a potencial” a la fuente, y es U = −uq (67) y la función de Rayleigh es 1 F = Rq̇ 2 2 La única ecuación de Lagrange es ∂T ∂U ∂F d ∂T − =− − dt ∂ q̇ ∂q ∂q ∂ q̇ (68) (69) Efectuando las operaciones, encontramos u = Rq̇ + Lq̈, de acuerdo con el método convencional. Ejemplo 3: Resolver el circuito de la Figura 3. a) Método convencional. Igualando ganancias y pérdidas de potencial en un recorrido de la malla: u = Lq̈ + q/C (70) b) Método lagrangiano: T = (1/2)Lq̇ 2 , F = 0 y U = −uq + (1/2)q 2 /C. Hay una única ecuación. Efectuando las operaciones: u = Lq̈ + q/C. Ejemplo 4: Resolver el circuito de la Figura 4. La ”energı́a cinética” está asociada tanto a las autoinducciones como a la inducción mutua entre ambas bobinas: 71 Figura 3 Figura 4 1 1 T = L1 q̇12 + L2 q̇22 + L12 q̇1 q̇2 2 2 La ”energı́a potencial” es (71) U = −uq1 (72) 1 F = Rq̇22 2 (73) y la función de Rayleigh Las dos ecuaciones son 72 d ∂T ∂U ∂F =− − dt ∂ q̇1 ∂q1 ∂ q̇1 (74) d ∂T ∂U ∂F =− − dt ∂ q̇2 ∂q2 ∂ q̇2 (75) y Efectuando las operaciones: u = L1 q̈1 + L12 q̈2 0 = Rq̇2 + L2 q̈2 + L12 q̈1 (76) Ejemplo 5: Resolver el circuito de la Figura 5. Figura 5 La ”energı́a cinética”, ”energı́a potencial” y función de Rayleigh son T =0 y U = −u1 q1 + u2 q2 + (77) 1 q32 2C (78) 1 1 F = R1 (i1 − i2 )2 + R2 (i3 − i2 )2 (79) 2 2 Ahora hay dos ecuaciones como (74) y (75) y otra adicional para la tercera carga. Efectuando las operaciones: 73 u1 = R1 (q̇1 − q̇2 ) u2 = R1 (q̇1 − q̇2 ) + R2 (q̇3 − q̇2 ) 0 = −q3 /C − R2 (q̇3 − q̇2 ) 4.6 (80) Un sistema mixto El sistema de la Figura 6 contiene una parte mecánica y una eléctrica. Figura 6 El circuito está excitado por una señal senoidal u = u0 sin ωt y del mismo forma parte un condensador, una de cuyas placas está sostenida por un resorte de constante k. En la posición de equilibrio, la separación entre placas es s. La capacidad es una función de x, separación de la placa superior de la posición de equilibrio, de la forma: A (81) s−x La masa de la placa superior del condensador es m. Ahora, la energı́a cinética contiene dos términos, uno correspondiente a la bobina y otro al movimiento de m: C= 1 1 T = Lq̇ 2 + mẋ2 2 2 74 (82) La energı́a potencial contiene también dos términos. Una parte eléctrica, que incluye a la fuente y al condensador, y una parte mecánica, que incluye al resorte k: 1 q 2 (s − x) 1 2 + kx 2 A 2 La función de disipación es debida a la resistencia: U = −u0 q sin ωt + (83) 1 F = Rq̇ 2 (84) 2 Hay dos ecuaciones, una para la carga circulante y otra para la coordenada x de la parte mecánica. La obtención de las ecuaciones del sistema es inmediata y ya pone de manifiesto la potencia del método que hemos presentado: Lq̈ + Rq̇ + q(s − x)/A = u0 sin ωt mẍ + kx − q 2 /(2A) = 0 5 (85) Sistemas lineales La mayorı́a de los ejemplos que hemos ido encontrando dan como resultado ecuaciones o sistemas de ecuaciones lineales, donde aparecen ciertas incógnitas y sus derivadas respecto al tiempo, multiplicadas por constantes. Además, pueden aparecer funciones del tiempo en términos adicionales (no multiplicando a las incógnitas). Todos estos sistemas se pueden escribir de la misma forma: x̄˙ = Ax̄ + Bū (86) Por ejemplo, si consideramos la ecuación (1): k β q̇ + q = u m m e introducimos las variables de estado q̈ + x1 = q x2 = q̇ es claro que 75 (87) (88) ẋ1 = x2 ẋ2 = u − β k x1 − x2 m m (89) que en formato matricial se puede escribir: " ẋ1 ẋ2 # = " 0 1 −k/m −β/m #" x1 x2 # + " 0 1 # u (90) La técnica es general: una ecuación diferencial ordinaria lineal en coeficientes constantes de orden n puede sustituirse por un sistema de n ecuaciones de primer orden, introduciendo n variables de estado. Por ejemplo: d2 y dy d3 y + 6 − 8 + 2y = u(t) 3 2 dt dt dt se puede transformar introduciendo las tres variables de estado x1 = y x2 = ẏ x3 = ÿ (91) (92) con lo cual:        x1 0 ẋ1 0 1 0        x 0 0 1 ẋ + =   2   0  u(t)  2   x3 −2 8 −6 ẋ3 1 (93) Pues bien, encontraremos la solución general para este tipo de sistemas. Ciertamente, hay muchos sistemas que no son lineales, pero también es cierto que en muchos sistemas no lineales interesa el comportamiento en las cercanı́as de ciertos valores, y eso permite hacer aproximaciones lineales. La técnica que emplearemos para resolver estos sistemas consta de dos pasos: primero buscaremos la solución del sistema cuando ū = 0̄ y después modificaremos la solución encontrada para que sea válida para el caso general. a) Paso 1. Consideramos x̄˙ = Ax̄. Si en el segundo miembro tomamos aproximadamente x̄(t) ≈ x̄(0) podremos integrar fácilmente, y obtener x̄(t) = (I+At)x̄(0). Ahora, podemos usar esta aproximación para buscar una mejor, poniendo x̄˙ = (I + At)x̄(0), que se integra fácilmente de nuevo para dar x̄(t) = (I + At + (1/2)A2 t2 )x̄(0) El procedimiento se puede iterar, dado la serie: 76 x̄(t) = (I + At + (1/2)A2 t2 + (1/3!)A3 t3 + · · · + (1/n!)An tn + · · ·)x̄(0) (94) La serie entre paréntesis es formalmente idéntica a la de la exponencial de números reales, ex = 1 + x + x2 /2 + x3 /3! + · · · + xn /n! + · · ·, ası́ que escribimos en forma abreviada x̄(t) = eAt x̄(0) (95) b) Paso 2. Ahora vamos a la ecuación no homogénea: x̄˙ = Ax̄ + Bū y tratamos de adaptarle la solución encontrada. Para ello, la idea consiste en tomar no x̄(t) = eAt x̄(0), sino x̄ = eAt c̄(t), y elegir c̄(t) de forma adecuada para que se satisfaga la ecuación no homogénea. En efecto, derivando esta solución de prueba, y sustituyendo en la ecuación diferencial original: x̄˙ = AeAt c̄(t) + eAt c̄˙ (96) eAt c̄˙ (t) = Bū(t) (97) y Ahora, es fácil convencerse de que eAt −1 = e−At (98) por ejemplo, escribiendo las series correspondientes, efectuando las multiplicaciones y comprobando que en efecto el producto de ambas matrices es la identidad. Entonces, de (97) c̄˙ (t) = e−At Bū(t) (99) que se integra fácilmente: Z c̄(t) = c̄(0) I + t 0 (100) eA(t−τ ) Bū(τ )dτ (101) e −Aτ Bū(τ )dτ de donde ya, sin más Z At x̄(t) = e c̄(0) + t 0 a la vista de la cual, es obvio que c̄(0) = x̄(0), ası́ que At x̄(t) = e x̄(0) + Z t 0 77 eA(t−τ ) Bū(τ )dτ (102) Esta es una solución formal, que se basa en que sepamos calcular la matriz exponencial, que a su vez es una serie infinita. En realidad, no es preciso calcular la serie infinita. Si la matriz A tiene dimensiones de n×n, entonces la exponencial, o en general cualquier polinomio en A, del grado que sea, tiene como mucho n términos. Para demostrar este resultado, nos apoyaremos en un teorema trascendental, que es el teorema de Cayley-Hamilton, que pasamos a demostrar. 6 El teorema de Cayley-Hamilton Demostraremos el teorema de Cayley-Hamilton, a partir del cual veremos cómo es posible calcular una función analı́tica arbitraria f (A) de una matriz cuadrada, como por ejemplo la matriz exponencial. Dada una matriz cuadrada A, la ecuación caracterı́stica |A − λI| = 0 es un polinomio p(λ); si A es una matriz n×n, entonces p(λ) es un polinomio de grado n en λ. El teorema de Cayley-Hamilton afirma que si p(λ) = 0 es la ecuación caracterı́stica de una matriz A, entonces A satisface su propia ecuación caracterı́stica, es decir, que p(A) = 0. Por ejemplo, si   1 2 3  A =  5 7 11   13 17 19 entonces p(λ) = −λ3 + 27λ2 + 77λ + 24 (103) (104) y se comprueba que −A3 + 27A2 + 77A + 24I = 0 (105) Para demostrar el teorema, comenzamos con un resultado del álgebra: (A − λI)−1 = (m(A − λI))T |A − λI| (106) donde m(A − λI) es una matriz cuyo elemento mij es (−1)i+j κij (A), siendo κij (A) el determinante de la matriz resultante de eliminar de A la fila i y la columna j. Como |A − λI| = 0: p(λ)I = (m(A − λI))T (A − λI) 78 (107) Ahora bien, (m(A−λI))T es una matriz polinómica en λ de grando n−1, es decir, existen matrices Bi tales que (m(A − λI))T = Bn−1 λn−1 + Bn−2 λn−2 + · · · + B1 λ + B0 (108) En efecto, cada elemento de (m(A − λI))T es un polinomio en λ de grado n − 1, y es posible recolectar en una matriz todos los coeficientes correspondientes a una misma potencia de λ. Por ejemplo, si λ2 − 26λ − 54 2λ + 13 3λ + 1  5λ + 48 λ2 − 20λ − 20 11λ + 4  E(λ) =   13λ − 6 17λ + 9 λ2 − 8λ − 3   (109) es posible escribir       1 0 0 −26 2 3 −54 13 1      2 E(λ) =  48 −20 4  +  5 −20 11  λ +  0 1 0   λ (110) 0 0 1 13 17 −8 −6 9 −3 Ası́ pues: (m(A − λI))T (A − λI) = (Bn−1 λn−1 + Bn−2 λn−2 + · · · + B1 λ + B0 )(A − λI) = −Bn−1 λn + (Bn−1 A − Bn−2 )λn−1 + (Bn−2 A − Bn−3 )λn−2 + · · · · · · + (B2 A − B1 )λ2 + (B1 A − B0 )λ + B0 A (111) Pero al mismo tiempo sucede que o p(λ) = (−1)n λn + cn−1 λn−1 + · · · + c1 λ + c0 (112) p(λ)I = (−1)n Iλn + cn−1 Iλn−1 + · · · + c1 Iλ + c0 I (113) Si ahora igualamos coeficientes: −Bn−1 = (−1)n I Bn−1 A − Bn−2 = cn−1 I Bn−2 A − Bn−3 = cn−2 I 79 ··· B2 A − B1 B1 A − B0 B0 A = = = = ··· c2 I c1 I c0 I (114) Sustituyamos Bn−1 de la primera en la segunda, Bn−2 de la segunda en la tercera, y ası́ sucesivamente, y obtenemos: −Bn−1 −Bn−2 −Bn−3 −Bn−4 ··· −B2 −B1 = = = = = = = (−1)n I cn−1 I + (−1)n A cn−2 I + cn−1 A + (−1)n A2 cn−3 I + cn−2 A + cn−1 A2 + (−1)n A3 ··· c3 I + c4 A + c5 A2 + · · · + (−1)n An−3 c2 I + c3 A + c4 A2 + · · · + (−1)n An−2 (115) y finalmente −B0 = c1 I + c2 A + c3 A2 + · · · + (−1)n An−1 (116) −(c1 A + c2 A2 + c3 A3 + · · · + (−1)n An ) = c0 I (117) c0 I + c1 A + c2 A2 + · · · + (−1)n An = 0 (118) p(A) = 0 (119) que se obtiene de sustituir B1 en la penúltima ecuación. Entonces, sustituyendo B0 en la última: o es decir: como querı́amos demostrar. 7 Función de una matriz y matriz exponencial En primer lugar, vemos que cualquier potencia de una matriz n × n se puede escribir como una suma de potencias de, a lo sumo, grado n−1. Por ejemplo, 80 si A= " 1 2 3 4 # (120) tenemos que p(λ) = λ2 − 5λ − 2, luego, según el teorema de CayleyHamilton, A2 = 5A+2I; a partir de aquı́, A3 = 27A+10I, A4 = 145A+54I, y ası́ sucesivamente. Cualquier polinomio f (A) puede escribirse entonces como un polinomio de grado n − 1. Pero hay un procedimiento mejor. En efecto, considérese una matriz cuadrada A y un polinomio s(λ), y sea p(λ) el polinomio caracterı́stico de A. Escribimos s(λ) en la forma s(λ) = q(λ)p(λ) + r(λ) (121) donde q(λ) lo encontramos por división polinómica y r(λ) es a lo sumo de grado n − 1 si p(λ) es de grado n. Ahora bien, cuando λj es precisamente un valor propio, p(λj ) = 0 y queda s(λj ) = r(λj ) (122) s(A) = q(A)p(A) + r(A) (123) De la misma manera Pero por el teorema de Cayley-Hamilton p(A) = 0 y por tanto s(A) = r(A) (124) Como ejemplo, sea A= " 1 2 3 4 # (125) y supongamos que deseamos calcular s(A) = A4 + 3A3 + 2A2 + I. La ecuación caracterı́stica es λ2 − 5λ + 5 = 0 (126) Dividiendo: λ4 + 3λ3 + 2λ2 + 1 146λ − 184 = λ2 + 8λ + 37 + 2 2 λ − 5λ + 5 λ − 5λ + 5 El resto es por consiguiente r(λ) = 146λ − 184, ası́ que 81 (127) s(A) = 146A − 184I (128) Pero, ¿qué ocurre si el grado del polinomio s(A) es muy grande? En ese caso, puede ser sumamente tedioso, e incluso impracticable, efectuar la división polinómica. De nuevo, hay un camino rápido. Supongamos que deseamos calcular un polinomio de grado muy elevado, o incluso una serie infinita de potencias f (λ) = ∞ X α k λk (129) k=0 Sabemos que podemos escribir f (λ) = q(λ)p(λ) + r(λ) (130) Lo que hemos de ver aquı́ es que, para cada λ que sea valor propio, es irrelevante cual sea q(λ), ya que viene multiplicado por un p(λ) = 0. Y de la misma forma, es irrelevante cual sea r(λ), desde el momento en que sabemos que tiene grado, a lo sumo, n − 1; luego se podrá escribir f (λj ) = r(λj ) = n−1 X βk λkj (131) k=0 que constituye un sistema de n ecuaciones que nos permite encontrar los n coeficientes de r(λ). Y si f (A) se define por la misma serie de f (λ), entonces, aplicando nuevamente el teorema de Cayley-Hamilton, f (A) = Pn−1 q(A)p(A) + r(A) = r(A) = k=0 βk Ak , donde los βk se obtienen del sistema (131). Como ejemplo, calculemos sin(A), con A= " −3 1 0 −2 # (132) La ecuación caracterı́stica es p(λ) = (3 + λ)(2 + λ) = 0, y los valores propios λ1 = −3 y λ2 = −2. Como n = 2, a lo sumo r será un polinomio de primer grado. De aquı́: sin(λ1 ) = β0 + β1 λ1 sin(λ2 ) = β0 + β1 λ2 (133) Se sigue que β0 = 3 sin(−2) − 2 sin(−3) y β1 = sin(−2) − sin(−3). Entonces, simplemente, sin(A) = β0 + β1 A 82 (134) Por consiguiente, el cálculo de la función matriz exponencial es un caso particular a igual que lo es el cálculo de la función seno de una matriz. Por ejemplo, para la matriz A= " 0 1 −2 −3 # (135) la ecuación caracterı́stica es p(λ) = λ2 + 3λ + 2 = 0 y los valores propios λ1 = −1 y λ2 = −2. Sabemos que eAt = β0 I + β1 A (136) y obtenemos los coeficientes del sistema e−t = β0 − β1 e−2t = β0 − 2β1 (137) β0 = e−t β1 = e−t − e−2t (138) eAt = e−t I + (e−t − e−2t )A (139) f (λ) = q(λ)p(λ) + r(λ) (140) de donde con lo cual Queda por discutir el caso en que dos o más valores propios son iguales. En ese caso, algunas de las ecuaciones (131) serán iguales, y el sistema no será suficiente para determinar todos los coeficientes. Supongamos que un valor propio λi está repetido m veces. Eso significa que el polinomio caracterı́stico contendrá un factor (λ − λi )m . Si volvemos a y como las m − 1 derivadas primeras de (λ − λi )m son cero en λ = λi , se añaden a la ecuación anterior las m − 1 ecuaciones f ′ (λ) f ′′ (λ) ··· m−1 f (λ) = = = = 83 r′ (λ) r′′ (λ) ··· rm−1 (λ) (141) (evaluadas en λ = λi ). Estas ecuaciones, combinadas con el resto de f (λj ) = r(λj ) para j 6= i forman el conjunto requerido de n ecuaciones para las n incógnitas βk . Como ejemplo trivial, considérese la matriz A= " 2 3 0 2 # (142) de ecuación caracterı́stica p(λ) = (2 − λ)2 = 0. Los dos valores propios valen 2. La matriz exponencial es eAt = β0 I + β1 A (143) donde los coeficientes se siguen del sistema e2t = β0 + 2β1 te2t = β1 8 (144) Bibliografı́a Prácticamente, la única fuente en español para el estudio de los sistemas electro-mecánicos bajo el punto de vista de la mecánica de Lagrange es el excelente y en muchos aspectos no superado ”Dinámica de Lagrange”, de Dare A. Wells. 9 Resumen conceptual 1. Analogı́a entre sistemas mecánicos y eléctricos. 2. Necesidad de una formulación escalar de la mecánica. 3. Principio de D’Alembert y ecuaciones de Lagrange. 4. Energı́a cinética, potencial y función de Rayleigh para sistemas eléctricos. 5. Sistemas lineales. Teorema de Cayley-Hamilton y cálculo de la matriz exponencial. 84 10 Ejercicios 1. Escribir la energı́a cinética de una masa m que se mueve en el espacio tomando como coordenadas generalizadas las coordenadas polares de su posición. 2. Encontrar la energı́a cinética de una barra uniforme de longitud l y masa m que es lanzada al aire de forma arbitraria. 3. Escribir las funciones de Lagrange para los dos sistemas de la Figura 7. Figura 7 4. Un solenoide muy largo de sección circular, con N1 espiras por unidad de longitud, contiene en su interior otro solenoide circular, con N2 espiras por unidad de longitud, montado sobre apoyos lisos (sin rozamiento) que puede girar como se muestra en la Figura 8a. Al giro se opone un resorte espiral de constante k. Las bobinas se conectan a circuitos independientes, como se muestra en 8b. Si la inducción mutua entre bobinas es M12 = bπr2 N1 N2 sin θ = a sin θ siendo b y a ciertas constantes, demostrar que la Lagrangiana es 85 (145) Figura 8 L = 1 1 1 M11 q̇12 + M22 q̇22 + I θ̇2 2 2 2 1 +aq̇1 q̇2 sin θ + u1 q1 + u0 q2 sin ωt − kθ2 2 (146) y escribir las ecuaciones del movimiento. I es el momento de inercia del solenoide interior, y su energı́a cinética es (1/2)I θ̇2 . 5. Encontrar las ecuaciones del movimiento del sistema de la Figura 9, sabiendo que L(x) = N 2 µ0 siendo A el área transversal del núcleo. Figura 9 86 A x2 (147) IV La máquina simple 1 Motivación La máquina eléctrica más sencilla concebible consiste en un simple conductor en movimiento en un campo magnético. A pesar de su simplicidad, se muestran los elementos básicos que rigen el comportamiento de cualquier otra máquina, y de ahı́ el interés en estudiarla. 2 La máquina simple La máquina simple consiste en dos conductores paralelos entre los que puede establecerse una diferencia de potencial V. Un segmento conductor, que desliza sobre los anteriores y se dispone perpendicular a los mismos, cierra el circuito. El conjunto se considera sometido a la influencia de un campo magnético que en la Figura 1 hemos establecido como entrante al plano del dibujo. Figura 1 Veamos qué ocurre al establecer la diferencia de potencial V con el circuito cerrado, y para ello aislamos mentalmente un electrón. Al iniciarse la corriente, los electrones se mueve en sentido contrario al convencional de la intensidad, en nuestro caso de P a Q. Al hacerlo, el electrón experimenta una fuerza F̄1 = −e(ū × B̄). Como consecuencia, el segmento P Q inicia un movimiento hacia la derecha. Al moverse, adquire una velocidad v̄, y aparece la fuerza de Lorentz F̄2 = −e(v̄ × B̄) que está dirigida en sentido QP . Para el electrón del conductor, éste está en reposo, ası́ que interpreta la fuerza F̄2 87 como procedente de un campo Ēc en sentido P Q. Aparece en el conductor, de acuerdo con II.88, una fuerza electro-motriz E= Z Q P ĒC · d¯l (1) que se opone a V. Esta fuerza electro-motriz, que depende de Ēc , que depende de v̄, aumenta con v̄, hasta un punto en que ya no circulará corriente en el segmento P Q, al ser E = V e V −E (2) R Esta es una descripción semicualitativa, porque descansa en ū, que es la velocidad con que se mueve el electrón en el conductor al establecer V. Pero esa velocidad no se puede medir. También, porque el razonamiento se refiere a un único electrón, que puede aislarse mentalmente, pero no fı́sicamente. Lo que procede por tanto es pasar el razonamiento a un contexto macroscópico, con cantidades medibles. En primer lugar, para un pequeño segmento d¯l del conductor P Q, la fuerza que aparece al conectar V es i= dF̄1 = −ρdV (ū × B̄) (3) donde ρ es la densidad volúmica de electrones y el signo ’–’ indica carga negativa. Esto se puede poner dF̄1 = −dV (ρū × B̄) = −dSdl(j̄ × B̄) (4) dF̄1 = −jdS(d¯l × B̄) = −i(d¯l × B̄) (5) y como j̄ y d¯l son paralelos: e integrando desde P a Q, F̄1 = −i¯l × B̄ (6) Para nuestra geometrı́a, F1 = −ilB. Por otro lado Ēc , que es fuerza por unidad de carga, es una constante para toda la longitud del segmento P Q, ya que su valor es v̄ × B̄, ası́ que E= Z Q P Ēc · d¯l = lv̄ × B̄ (7) que para nuestra geometrı́a da E = lvB. Si al movimiento de P Q se opone una fuerza de naturaleza mecánica, F̄m , se alcanzará un cierto equilibrio cuando |F1 | = |Fm |: 88 |F̄1 | = |F̄m | = ilB = V −E lB R (8) y siendo E = lvB: VlB l2 B 2 − v R R La velocidad a la que se alcanza este equilibrio es |F̄1 | = |F̄m | = v0 = V R|Fm | − 2 2 lB l B (9) (10) A la velocidad de equilibrio ”en vacı́o”, es decir, cuando la máquina funciona sin resistencia mecánica, se le llama ”velocidad sincrónica”, y es V (11) lB En resumen: al suministrar corriente a la máquina mediante V, P Q comienza a moverse. El sistema funciona entonces como motor. El motor acelera su velocidad, y al hacerlo aumenta E. Si no hay resistencia, lo hace hasta el punto en que se compensa totalmente con V, y deja de circular corriente, puesto que vs = V −E (12) R se ha alcanzado entonces vs . Si hay fuerzas mecánicas que vencer, la velocidad que se alcanza es la dada por (10). Al representar F1 en función de la velocidad se obtiene una recta de ordenada en el origen VlB/R y pendiente −l2 B 2 /R, que será cortada en algún punto por la curva que represente a Fm . El punto de corte se produce precisamente a v0 . Como o bien Fm es una constante, o bien una función creciente de la velocidad, al aumentar V, que sólo afecta a la ordenada en el origen, se tiene una recta paralela a la original, pero desplazada hacia arriba. Entonces, el punto de corte con Fm se desplazará a la derecha, es decir, se incrementará la velocidad v0 . Por otro lado, cuando V = 0 y se usa una fuerza mecánica para desplazar al segmento P Q a una velocidad v, aparece una fuerza electromotriz inducida E y por tanto una corriente i= E R El sistema funciona entonces como generador. i= 89 (13) 3 Hacia el motor real En la sección anterior hemos tratado con el motor más sencillo que nos ha permitido ver la interrelación electro-magneto-mecánica. En esta nos acercamos más al funcionamiento de los motores reales, e introducimos nuevos conceptos. Sin embargo, seguiremos tratando con sistemas muy simples. El ”motor” más simple que puede concebirse es aún más simple que el de la sección anterior. Consiste en un imán que se mueve manualmente bajo la superficie de una mesa de madera o cristal. Sobre la misma se coloca otro imán. Se ve que al mover el imán bajo la mesa, éste arrastra al que está sobre ella. En terminologı́a de motores, la pieza que arrastra se llama estator, y la pieza arrastrada rotor. El estator se mueve algo por delante del rotor, pero ambos a la misma velocidad. A los motores en que ambas partes se mueven a la misma velocidad se les llama motores sı́ncronos. Es evidente también que se obtiene el mismo resultado si en el ejemplo anterior los imanes permanentes se sustituyen por electroimanes. Un sistema ası́, en el cual el estator se mueve linealmente se denomina motor sı́ncrono lineal, y se muestra en la Figura 2. Es importante el espacio de separación entre las dos piezas. A esta separación g se le llama con su nombre anglosajón, gap (Mind the gap!) y es un importante factor porque, como veremos, la mayor densidad de energı́a magnética se encuentra ahı́. La versión rotativa se muestra en la Figura 3. Los detalles constructivos de cómo se alimentan estator y rotor cuando no están fijos, sino girando, podemos omitirlos. Aquı́, la fuerza de arrastre del estator sobre el rotor depende del ángulo δ, en la forma Fm = Fmax sin δ (14) y es nula cuando δ = 0. En efecto, cuando ambas piezas están alineadas, la fuerza se dirige a lo largo del eje principal y el momento de giro que se ejerce sobre el rotor es nulo. Es máximo cuando δ = π/2. Desde un punto de vista general, entre la energı́a eléctrica que se suministra al motor y la energı́a mecánica que se obtiene, o al revés cuando se trata de un generador, lo que tenemos es el campo magnético. El campo magnético es el intermediario en la conversión energı́a mecánica ↔ energı́a eléctrica. 4 Energı́a del campo magnético Consideremos un sistema de dos partes, tal y como se muestra en la Figura 4. La parte que llamamos ”primaria” se alimenta con una corriente i1 , y 90 Figura 2 Figura 3 permanece fija. La parte que llamamos ”secundaria” es móvil, y se encuentra separada por una distancia g de la primaria. Supongamos que incrementamos en el primario la intensidad desde 0 a un valor i1 . Como consecuencia, el flujo magnético en el interior del primario aumenta desde 0 a Φ1 . Como Φ1 depende del número de vueltas del cable alrededor del primario, n, pongamos Φ1 = nΦ = λ. En un caso ideal λ es proporcional a i (véase por ejemplo II.99), con constante de proporcionalidad L. En un caso real la relación no es lineal, sino que se parece a la de la Figura 5. En el circuito del primario sabemos que u1 = Ri + L La potencia eléctrica suministrada es 91 di dt (15) Figura 4 Figura 5 92 Figura 6 dWe di = u1 i = Ri2 + Li (16) dt dt El incremento de energı́a eléctrica suministrada a la bobina que rodea al primario es Pe = di dt = Lidi = idλ (17) dt Este incremento se transforma en energı́a magnética, Wb , de forma que dWe = dWb . Volviendo a la Figura 5, dWe es la banda rayada en negro. La zona rayada en amarillo representa la energı́a suministrada a la bobina, que es dWe = Li We = Z λ1 0 idλ (18) Es útil visualizar el flujo magnético como una ”corriente” que circula enlazando primario y secundario. Y es evidente que esta corriente se interrumpe si g se hace muy grande. Si se incrementa un poco, habrá que incrementar i en el primario para mantener el mismo flujo, lo cual significa que la curva λ(i) se hace más plana, aproximándose a la lı́nea recta, como se muestra en la Figura 6. El gap es una especie de resistencia al flujo, que se vence aumentando la intensidad, de la misma forma que en un circuito eléctrico una resistencia R limita la corriente eléctrica, y ésta se puede mantener aumentando el voltaje. Ası́ que, llegados a este punto, se puede hacer un paralelismo entre los circuitos eléctricos y los circuitos magnéticos: 93 Figura 7 Circuito eléctrico Corriente i Voltaje u Resistencia R Ley de Ohm: i = u/R Circuito magnético Flujo Φ Fuerza magneto-motriz ni Reluctancia Rm Ley de Ohm: Φ = in/Rm El paralelismo se puede llevar más lejos aún, pues sabemos que la resistencia eléctrica (II.83) tiene la forma l (19) σA donde A es la sección del conductor, l su longitud y σ la inversa de la resistividad. En un circuito magnético, R= Rm = l µA (20) donde l es su longitud, A su sección y µ la permeabilidad magnética. Este planteamiento se puede considerar fenomenológico: se observa un efecto, que se relaciona con una causa, y, como es costumbre, se supone la relación más sencilla posible útil para explicar las observaciones. En nuestro caso, el efecto es el flujo magnético, y la causa es la intensidad que circula por el primario. La relación más sencilla es lineal, y la hemos escrito como Φ = ni/Rm . Con esto, el sistema de la Figura 4 lo podemos representar como un circuito magnético, tal como el de la Figura 7, donde Fb es la fuerza magnetomotriz, Rc y Rg las reluctancias del núcleo y del gap y Φ el flujo magnético. Sabemos que Φ = BA, donde A es la sección transversal del circuito y que 94 Figura 8 ni = Rm Φ = Hl (21) ası́ que, en relación con el circuito de la Figura 7, escribimos ni = Hc lc + Hg lg (22) y como λ = nΦ = nBA, tenemos (Hc lc + Hg lg ) nAdB n en el gap, Hg = B/µ0 , y efectuando la integración Wb = Wb = V c Z Z idλ = Z Hc dB + Vg B2 = wbc Vc + wbg Vg 2µ0 (23) (24) donde Vc y Vg son los volúmenes del núcleo y del gap y wbc y wbg son las densidades de energı́a respectivas. En el caso en que el núcleo sea lineal, Hc = Bc /µc . Volvamos a la Figura 4. Si el secundario se encuentra en la posición x1 y pasa a la posición x2 , reduciendo el gap, en igualdad de las demás condiciones la curva caracterı́stica pasa de λ(x1 ) a λ(x2 ). En el proceso, el incremento en la energı́a eléctrica ha sido dWe = i(λ2 − λ1 ) (25) que se corresponde con el área abcd de la Figura 8. El incremento en la energı́a del campo es la diferencia entre las áreas obc y oad. Como ha sido preciso ejercer una cierta fuerza para mover el secundario desde x1 a x2 , se ha realizado un trabajo mecánico también, ası́ que el incremento dWe se ha 95 invertido en dWb + dWm , donde Wm es el trabajo mecánico. En la Figura 8, llamemos a1 al área cbed, a2 a bae, a3 a deo y a4 a eao. Como dWe = a1 + a2 y dWb = a1 + a3 − a4 − a3 = a1 − a4 , se sigue de dWe = dWb + dWm que dWm = a2 + a4 , que es la zona rayada en la Figura. Es útil introducir aquı́ el concepto de co-energı́a. En la Figura 5, la co-energı́a es el área bajo la curva λ(i). La llamamos Wb′ , de forma que Wb + Wb′ = iλ. En términos de co-energı́a, vemos que dWm = dWb′ , y si dWm se ha producido por la acción de una fuerza f en el incremento dx, entonces f dx = dWb′ , lo cual quiere decir que ∂Wb′ (26) ∂x y este es el enlace entre la fuerza mecánica y el campo eléctrico, ya que Wb′ depende a través de la curva λ(i) de la energı́a eléctrica suministrada mediante i. Aquı́ se ve cuantitativamente lo que afirmábamos antes: que el campo magnético es el intermediario en la conversión de energı́a mecánica en eléctrica y viceversa. Una vez introducidos todos los elementos necesarios, volvemos al sistema lineal de la Figura 2. Despreciamos la reluctancia del núcleo y asumimos comportamiento lineal, con λ = Li; como además f= λ = nΦ = n ni n2 Aµ0 i = Rm g (27) n2 Aµ0 g (28) se sigue que L= es decir, que L depende del gap y es por tanto una función de x: λ = L(x)i, de donde calculamos la co-energı́a: 1 λdi = L(x)i2 2 0 Ahora podemos calcular la fuerza magnética sobre el secundario: Wb′ = Z i (29) 1 dL(x) ∂ 1 L(x)i2 = i2 (30) ∂x 2 2 dx Nótese que, si el sistema es lineal, entonces Wb = Wb′ : energı́a y co-energı́a son iguales. Podemos usar los resultados anteriores para calcular la fuerza de arrastre del estator sobre el rotor en el motor sı́ncrono lineal. Ahora g depende del retraso que lleve el rotor respecto al estator. Se comprende entonces que si fb = 96 el ”rotor” es infinitamente largo, no importa lo intenso que sea el campo del estator que no se generará ningún arrastre. 4.1 Corrientes en estator y rotor Ampliemos los razonamientos anteriores al caso en que circula corriente también por el secundario. Suponemos que ambas partes están en reposo y que la energı́a eléctrica suministrada se almacena en el campo magnético. Entonces dWb = dWe = e1 i1 dt + e2 i2 dt = i1 dλ1 + i2 dλ2 (31) Si el sistema es lineal: λ1 = L1 i1 + L12 i2 λ2 = L12 i1 + L2 i2 (32) y en estos sabemos que la energı́a es igual a la co-energı́a, luego 1 1 λ1 di1 + λ2 di2 = L1 i21 + L2 i22 + L12 i1 i2 (33) 2 2 0,0 Nótese cómo esta expresión es un caso particular de III.58. De aquı́ Wb = Wb′ = Z i1 ,i2 ∂Wb′ 1 dL1 1 2 dL2 dL12 = i21 + i2 + i1 i2 (34) ∂x 2 dx 2 dx dx Si reunimos las ecuaciones para la parte eléctrica y para la parte mecánica, teniendo en cuenta la presencia de las dos corrientes y la inducción mutua, tenemos, para la parte eléctrica: fb = dλ1 dt dλ2 = i2 R 2 + dt u1 = i 1 R 1 + u2 (35) donde ∂λ1,2 /∂t son las fuerzas electromotrices inducidas. Para la parte mecánica, si m es la masa que ha de moverse: d2 x dx − fr (36) = f − β m dt2 dt donde fm es la fuerza magnética, fr una resistencia a vencer (la máquina se construye precisamente para vencer la resistencia fr ) y el término βdx/dt m 97 la fricción que se opone al movimiento. En cuanto a las derivadas, si el sistema es lineal: dλ1 d d = e1 = (L1 (x)i1 ) + (L12 (x)i2 ) dt dt dt di1 dL1 dx di2 dL12 dx = L1 (x) + i1 + L12 + i2 dt dx dt dt dx dt (37) con una expresión similar para λ2 . Y en cuanto a fm , es la derivada de la co-energı́a, que es igual a la energı́a si el sistema es lineal. 5 Motores rotatorios sencillos Si vamos a la definición de fuerza generalizada en III.9: Qj = X j F̄i · ∂r̄i ∂qj (38) vemos que la fuerza generalizada que corresponde a una coordenada generalizada angular tiene dimensiones de fuerza por distancia, es decir, de par. Pero en III.17 vemos que Qj tiene a su vez las mismas dimensiones que ∂T /∂qj . Luego la derivada de una energı́a respecto a una variable angular es un par. Como la energı́a y la co-energı́a tienen las mismas dimensiones, se concluye que el par entregado por una máquina rotatoria es ∂Wb′ Π= ∂θ (39) En general, será dL12 1 dL1 1 2 dL2 + i2 + i1 i2 (40) Π = i21 2 dθ 2 dθ dθ En el sistema de la Figura 9, la autoinducción L1 no depende de la posición del rotor, luego para esto motor: 1 dL2 dL12 Π = i22 + i1 i2 (41) 2 dθ dθ En un motor en el que el estator y el rotor son cilı́ndricos y por construcción las autoinducciones son independientes del ángulo θ del rotor respecto a una dirección de referencia, no hay más que término de inducción mutua, y el par es 98 Figura 9 dL12 (42) dθ con L12 = M cos θ si M es el pico de inducción mutua, que se alcanza cuando están alineados los ejes magnéticos del estator y del rotor y θ es el ángulo que forman ambos ejes. Se entiende entonces que como dirección de referencia se toma el eje magnético del estator. Si las corrientes son Π = i1 i2 i1 = I1 cos ω1 t i2 = I2 cos(ω2 t + α) (43) θ = ωm t + δ (44) y donde ωm es la velocidad angular del rotor y δ es la posición del rotor en t = 0, entonces Π = −I1 I2 M cos ω1 t cos(ω2 t + α) sin(ωm t + δ) (45) Hay dos casos prácticos: a) ω2 = 0, α = 0, ω1 = ωm . El estator se alimenta con corriente alterna y el rotor con corriente continua. El rotor gira a la misma frecuencia angular a la que se excita el primario. Estos son los motores monofásicos sincrónicos. Particularizando: Π = −I1 I2 M cos ω1 t sin(ω1 t + δ) 99 (46) Aplicando la identidad trigonométrica sin x cos y = 1 1 sin(x + y) + sin(x − y) 2 2 (47) tenemos I1 I2 M [sin(2ω1 t + δ) + sin δ] 2 El promedio del primer término es nulo, y queda sólo el segundo: Π=− I1 I2 M sin δ 2 Se ve que el promedio es máximo cuando δ = π/2. Πm = − (48) (49) b) ωm = ω1 − ω2 . La frecuencia angular del rotor no coincide ni con la de excitación del estator ni con la del rotor. Por esta razón estos motores se llaman monofásicos asincrónicos. Aplicando la misma identidad trigonométrica que hemos usado antes dos veces podemos poner la expresión general para el par como la suma de cuatro términos sinusoidales. En efecto: 1 1 sin[(ωm + ω2 )t + α + δ] + sin[(ωm − ω2 )t + δ − α] 2 2 (50) y ahora desarrollamos el producto de cada uno de ellos por cos ω1 t y obtenemos los cuatro términos: sin(ωm t + δ) cos(ω2 t + α) = 1 sin[(ωm + ω1 + ω2 )t + α + δ] + 4 1 sin[(ωm − ω1 + ω2 )t + α + δ] + 4 1 sin[(ωm + ω1 − ω2 )t − α + δ] + 4 1 sin[(ωm − ω1 − ω2 )t − α + δ] (51) 4 de los cuales, el único cuyo promedio temporal es distinto de cero es el segundo, resultando I1 I2 M sin(α + δ) (52) 4 Se observa también que cuando ωm = 0 el par medio es cero: el motor necesita ser llevado en un proceso de arranque a una ωm 6= 0 para que pueda dar par. Πm = − 100 6 Ecuaciones generales Recapitulamos los resultados más importantes y agrupamos las ecuaciones relevantes. Consideramos la parte eléctrica y la parte mecánica. Para la parte eléctrica, el voltaje suministrado a estator y rotor se iguala con la caı́da de potencial en las resistencias y la fuerza electro-motriz inducida. Esta última viene dada por la derivada temporal del flujo λ, que es esencialmente el flujo debido a una espira por el número de espiras: λ = nΦ. En los modelos lineales λ es una función lineal de la intensidad i. Esta relación funcional λ(i), sea lineal o no, permite encontrar la co-energı́a Wb′ , de donde por derivación encontramos las fuerzas y pares magnéticos: Wb′ = Z λ(i)di; fm = ∂Wb′ ∂q ! (53) donde q puede representar una coordenada lineal, o angular. El procedimiento es más sencillo cuando λ(i) es lineal. Si escribimos: λ1 = L1 i1 + L12 i2 λ2 = L12 i1 + L2 i2 (54) tenemos, cuando los coeficientes de inducción dependen del giro θ del rotor: dλ1 di1 dL1 = L1 + i1 ωm dt dt dθ di2 dL12 +L12 + i2 ωm dt dθ di1 dL12 dλ2 = +L12 + ii ωm dt dt dθ dL2 di2 + i2 ωm +L2 dt dθ (55) En cuanto a la parte mecánica, dado que la única parte móvil es el rotor: dθ d2 θ + β + Πl (56) 2 dt dt donde Π es el par aplicado, y depende del tipo de motor y la forma de alimentarlo, como hemos visto en la sección anterior, β el coeficiente de rozamiento y Πl la carga que el motor ha de vencer. Π=J 101 7 Bibliografı́a Hemos seguido aquı́ más o menos ”Electromechanical energy conversion”, de Ernest Mendrela. Como se ve, todo depende de dos puntos: a) la existencia de una relación λ(i), que si es lineal facilita mucho el análisis, y b) la posibilidad de calcular los coeficientes de autoinducción e inducción mutua Lij . Este punto se puede estudiar, por ejemplo, en ”Campos y ondas electromagnéticos” de P. Lorrain y D.R. Corson. En la página 368 y siguientes de la edición española se pueden encontrar algunos ejemplos para geometrı́as sencillas. 8 Resumen conceptual 1. Se plantea y discute la máquina simple, y se introducen la velocidad de equilibrio y la velocidad sincrónica, ası́ como los regı́menes de generador y motor. 2. Motores sincrónicos con diseño lineal y rotatorio. 3. Se introduce un modelo sencillo de primario-secundario y se analiza el balance energético. Se introduce la relación λ(i) y se estudia la influencia del ”gap”. Se introducen los circuitos magnéticos. 4. Energı́a y co-energı́a. 5. Ecuaciones generales para el modelo primario-secundario anterior cuando circula intensidad por las dos partes. Ecuaciones de la parte eléctrica y de la parte mecánica. 6. Obtención del par como derivada de la co-energı́a. 7. El motor rotatorio monofásico sincrónico y asincrónico. 8. Ecuaciones generales. 9 Ejercicios Los siguientes ejercicios están tomados de Fitzgerald, ”Electromechanical energy conversion principles”, capı́tulo 3 de ”Electric machinery”. 1. Sea un rotor cilı́ndrico de 30 cm de longitud y 5 cm de radio (Figura 10). Este rotor se encuentra en un campo magnético uniforme B̄ de 102 Figura 10 Figura 11 0.02T que es perpendicular al eje del rotor. En la superficie del mismo, siguiendo lı́neas paralelas al eje diametralmente opuestas, hay dos conductores por los que circulan corrientes de sentidos opuestos de 10A. Si α es el ángulo que forma la lı́nea AB con el eje x, demostrar que el par que experimenta el rotor es Π = −0.006 sin α N ·m (57) 2. En el dispositivo de la Figura 11, calcular la energı́a magnética almacenada en el ”gap” suponiendo que N = 1000 vueltas, i = 10 A, g = 2.0 mm d = 0.15 m y l = 0.1 m. Se supone que la permeabilidad magnética del núcleo tiende a ∞. Solución: de (27) y (29) Wb′ = 236(1 − x/d) J. 3. La inductancia de un solenoide fue medida en varias posiciones a lo 103 largo del eje x, resultando la tabla siguiente: x cm 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0 L(x) 2.80 2.26 1.78 1.52 1.34 1.26 1.20 1.16 1.13 1.11 1.10 Para i = 0.75 A, encontrar la fuerza que experimenta el solenoide. Sugerencia: usando polyfit de Matlab ajustar un polinomio (de cuarto orden es suficiente), de forma que se pueda expresar L(x) = a0 + a1 x + a2 x2 + a3 x3 + a4 x4 y luego calcular la fuerza usando (30). 4. En el sistema de la Figura 12, el rotor es ovalado, lo que hace que el ”gap” sea variable. Cuando el eje del rotor forma un ángulo θ con el eje del estator, L(θ) = L0 + L1 cos(2θ), con L0 = 10.6 mH y L1 = 2.7 mH. Demostrar que para una corriente de 2 A, el par que experimenta el rotor es 1 Π(θ) = i2 (−2L1 sin θ) = −1.08 × 10−2 sin(2θ) 2 N ·m (58) 5. En el segundo problema, si i(x) = i0 (x/d) A, demostrar que la fuerza actuante sobre la pieza móvil es f =− i0 µ 0 N 2 l 4g 2 x d N (59) Encontrar la co-energı́a y comprobar que si calculamos la fuerza a partir de ella como f= ∂Wb′ ∂x no obtenemos el resultado (59), que proviene de (30). ¿Por qué? 104 (60) Figura 12 Figura 13 6. En el sistema de la Figura 13, calcular el par sobre el rotor como una función de θ. La longitud del rotor es h = 1.8 cm, con r1 = 2.5 cm y g = 3 mm. Se supone que la reluctancia del núcleo y del propio rotor es nula, con lo que la energı́a magnética se encuentra en el ”gap”, cuyo volumen depende del ángulo θ. El flujo máximo a través del ”gap” está limitado a 1.65 T, para evitar saturación. Sugerencia: obtener una expresión para el volumen del ”gap” y tomar de (24) la densidad de energı́a magnética. Luego obtener el par derivando respecto a θ. 105 V La máquina generalizada 1 Motivación El objeto de este capı́tulo es generalizar los resultados del anterior, presentando un modelo generalizado de máquina rotatoria, del cual los distintos tipos de máquinas son casos particulares. Al hacerlo, plantearemos un sistema de seis ecuaciones diferenciales no lineales cuya resolución nos da la evolución temporal de las variables eléctricas y mecánicas. 2 La máquina rotatoria generalizada En general, las máquinas eléctricas tienen diseños rotatorios. El estator es una carcasa cilı́ndrica, fija, y en su interior y concéntrico con él gira el rotor, sujeto a un eje que se apoya en rodamientos. Hay varias razones para este tipo de diseño, unas teóricas y otras prácticas. Si vamos a la Figura 1 de IV, vemos que la fuerza magnética sobre un conductor y el campo inducido son máximos cuando la velocidad v̄ del movimiento del conductor, el campo magnético y el elemento de corriente son mutuamente perpendiculares. En el diseño cilı́ndrico por tanto es preciso hacer que el campo magnético sea perpendicular al movimiento del rotor, y como el movimiento del rotor es circular, se sigue que el campo ha de ser radial, o lo más cercano a eso que se pueda conseguir. Por otro lado, como ∇ · B̄ = 0, si aplicamos el teorema de la divergencia al cilindro del rotor, la integral de superficie B̄ · dS̄ será nula. Esto significa que habrá tantas lı́neas entrantes como salientes en el cilindro. Esto significa a su vez que si hacemos un recorrido que dé la vuelta al cilindro, desde ϕ = 0 hasta ϕ = 2π y registramos B̄ como función de ϕ, ha de ocurrir: 1) que en la gráfica correspondiente el área bajo el eje ϕ sea igual al área sobre la misma; 2) que B̄ sea función periódica de ϕ. Una representación de las lı́neas de campo es la de la Figura 1. El punto en que B̄ entra perpendicularmente a la sección normal al cilindro se denomina ”polo sur”, y el punto en que B̄ sale perpendicularmente ”polo norte”. Al ser B̄ periódico, lo será cualquiera de sus componentes, luego se podrá escribir como un desarrollo en serie de Fourier, luego podemos hacer el análisis para la frecuencia fundamental. Si la componente principal de B̄ es sinusoidal, esto significa que existen dos ejes, que llamaremos α y β, perpendiculares entre sı́, de forma que B̄ = B̄α + B̄β , como muestra la Figura 2. Es decir, que B̄ se puede conseguir como superposición o suma vectorial de dos 106 Figura 1 Figura 2 campos perpendiculares. Entonces, el campo creado por el estator se puede representar por dos bobinas mutuamente perpendiculares, cuyos campos, al variar en el tiempo, hacen rotar a B̄ en el plano (α, β). Con un razonamiento similar para el campo del rotor, podemos modelar la máquina rotatoria como un sistema de dos pares de campos creados por dos pares de bobinas, como se muestra en la Figura 3, alimentadas por intensidades (ieα , ieβ , irα , irβ ) donde los subı́ndices ’e’ y ’r’ significan respectivamente ”estator” y ”rotor”. Colineal con el eje común a ambos cilindros está el eje mecánico, que se mueve con velocidad angular θ (la del rotor). Si escribimos en forma vectorial las relaciones entre λ e i, poniendo λ̄ = Lī, donde 107 Figura 3  λeα λeβ λrα λrβ  (1)  ieα ieβ irα irβ  (2)    λ̄ =  e  ī =            y L es la matriz de inducciones, tenemos para la parte eléctrica d dλ̄ = Rī + (Lī) (3) dt dt donde R es la matriz de resistencias. Como la resistencia en el circuito que alimenta a la bobina j depende sólo de la intensidad que circula por ese circuito, la matriz R es diagonal. Por otro lado ū = Rī + dī dL d (Lī) = L + θ̇ī dt dt dθ Ahora, calculamos la co-energı́a 108 (4) Wc′ = Z C λ̄ · dī = Z ī 0̄ Lī′ dī′ (5) donde el camino de integración lleva desde ī′ = 0̄ hasta ī′ = ī. Como L no depende de las intensidades, 1 Wb′ = īT Lī 2 Y, finalmente, el par entregado por el motor es 1 dL ∂Wb′ = īT · · ī Π= ∂θ 2 dθ 2.1 (6) (7) La matriz de inductancias Falta darle forma a la matriz L. Los coeficientes no dependen de las intensidades, sino de la geometrı́a. Se puede ver esto considerando dos casos extremos. En el primero tenemos dos bobinas situadas en planos paralelos. El flujo que atraviesa una de ellas debido a la corriente que circula por la otra, es máximo. Pero si las bobinas están en planos perpendiculares, el flujo que atraviesa una de ellas es debido a la corriente que circula por la otra es mı́nimo, como se ve en la Figura 4. Figura 4 Con esto en mente, se ve que en la matriz L: 1) los elementos diagonales son constantes, ya que la autoinducción de una bobina no depende de su 109 orientación respecto a otros cuerpos; 2) la influencia entre las bobinas del rotor es mı́nima, ya que son perpendiculares. En nuestro modelo, damos a estos elementos el valor 0; 3) Las inducciones mutuas de una bobina del estator (rotor) con las otras dos del rotor (estator) dependen del coseno del ángulo que forman (para que sea máxima si este ángulo es cero y mı́nima si es de π/2). En definitiva:     L= Lee 0 Ler cos θ −Ler sin θ 0 Lee Ler sin θ Ler cos θ er er L cos θ L sin θ Lrr 0 er er −L sin θ L cos θ 0 Lrr      (8) donde hemos supuesto además que las dos bobinas del estator son iguales y que las dos bobinas del rotor también son iguales (L11 = L22 y L33 = L44 ). A partir de aquı́ calculamos:  dL   =  dθ 0 0 −Ler sin θ −Ler cos θ 0 0 Ler cos θ −Ler sin θ −Ler sin θ Ler cos θ 0 0 −Ler cos θ −Ler sin θ 0 0 y el par es entonces      (9) ∂Wc′ dL Π = = īT · · ī ∂θ dθ   = [ieα ieβ irα irβ ]    0 0 −Ler sin θ −Ler cos θ 0 0 Ler cos θ −Ler sin θ −Ler sin θ Ler cos θ 0 0 −Ler cos θ −Ler sin θ 0 0 = Ler sin θ(−ieα irα − ieβ irβ ) + Ler cos θ(−ieα irβ + ieβ irα )      ieα ieβ irα irβ      (10) Debido a los productos cruzados, si las corrientes del estator son nulas, o las corrientes del rotor son nulas, entonces Π = 0. Además, si las corrientes son todas constantes, el par serı́a Π = Ler (p sin θ + q cos θ) (11) con p y q constantes, cuya media en una revolución completa es nula. Por tanto, un motor no puede funcionar si por sus bobinas circula sólo corriente continua. En general, calculamos el par promedio en una vuelta como 110 1 Z 2π er L (j1 sin θ + j2 cos θ)dθ Π= 2π 0 donde j1 = −ieα irα − ieβ irβ y j2 = −ieα irβ + ieβ irα . 3 (12) Planteamiento y solución numérica del problema Las ecuaciones que determinan el movimiento del sistema son entonces: ū = Rī + L J dī dL + θ̇ ī dt dθ d2 θ dθ = Π − Πr − β 2 dt dt (13) siendo Πr el par resistente que se ha de vencer mediante Π y β el coeficiente de fricción. Π viene dado por Π= ∂Wb′ ∂θ (14) y a su vez 1 (15) Wb′ = īT Lī 2 La primera ecuación es una ecuación vectorial con cuatro componente escalares. La segunda ecuación, por ser de segundo orden, se puede desdoblar en dos ecuaciones de primer orden. El acoplamiento entre la parte eléctrica y la parte mecánica viene a) por el hecho de que L es función de θ y b) en la parte mecánica, el par Π es función de las corrientes. Juntas las partes eléctrica y mecánica forman un sistema de seis ecuaciones diferenciales no lineales de primer orden. Introduzcamos las variables de estado:      x̄ =      x1 = ieα x2 = ieβ x3 = irα x4 = irβ x5 = θ x6 = θ̇ y en función de ellas, nuestro sistema: 111           (16) ueα = Rαe x1 + Lee ẋ1 + Ler ẋ3 cos x5 − Ler ẋ4 sin x5 −Ler x3 x6 sin x5 − Ler x4 x6 cos x5 ueβ = Rβe x2 + Lee ẋ2 + Ler ẋ3 sin x5 + Ler ẋ4 cos x5 Ler x3 x6 cos x5 − Ler x4 x6 sin x5 urα = Rαr x3 + Ler ẋ1 cos x5 + Ler ẋ2 sin x5 + Lrr ẋ3 −Ler x1 x6 sin x5 + Ler x2 x6 cos x5 urβ = Rβr x4 − Ler ẋ1 sin x5 + Ler ẋ2 cos x5 + Lrr ẋ4 −Ler x1 x6 cos x5 − Ler x2 x6 sin x5 ẋ5 = x6 Ler Ler (−x1 x3 − x2 x4 ) sin x5 + (−x1 x4 + x2 x3 ) cos x5 ẋ6 = J J Πr − − βx6 J (17) El problema con este sistema, escrito tal como está, es que los métodos numéricos habituales, por ejemplo los métodos de Runge-Kutta, tratan con sistemas de ecuaciones donde cada ecuación es de la forma ẋi = fi (x1 , x2 , · · ·). A esta forma se ajustan las dos últimas ecuaciones, pero no las cuatro primeras, donde aparecen combinaciones de las derivadas. Para reescribir las cuatro primeras ecuaciones en forma adecuada, vemos que, tal y como están, se pueden reordenar en la forma      Lee 0 Ler cos x5 −Ler sin x5 0 Lee Ler sin x5 Ler cos x5 er er L cos x5 L sin x5 Lrr 0 er er −L sin x5 L cos x5 0 Lrr      ẋ1 ẋ2 ẋ3 ẋ4       =   f1 f2 f3 f4      (18) donde f1 f2 f3 f4 = = = = ueα − Rαe x1 + Ler x3 x6 sin x5 + Ler x4 x6 cos x5 ueβ − Rβe x2 − Ler x3 x6 cos x5 + Ler x4 x6 sin x5 urα − Rαr x3 + Ler x1 x6 sin x5 − Ler x2 x6 cos x5 urβ − Rβr x4 + Ler x1 x6 cos x5 + Ler x2 x6 sin x5 (19) Entonces, las cuatro primeras ecuaciones, escritas en la forma adecuada para su resolución numérica aparecen como 112      ẋ1 ẋ2 ẋ3 ẋ4       =   Lee 0 Ler cos x5 −Ler sin x5 ee 0 L Ler sin x5 Ler cos x5 Ler cos x5 Ler sin x5 Lrr 0 er er −L sin x5 L cos x5 0 Lrr −1          f1 f2 f3 f4      (20) La inversa de la matriz existe siempre que se cumpla la condición de que Ler Ler 6= Lee Lrr , y viene dada por 1 er er L L − Lee Lrr      −Lrr 0 Ler cos x5 −Ler sin x5 0 −Lrr Ler sin x5 Ler cos x5 Ler cos x5 Ler sin x5 −Lee 0 er er −L sin x5 L cos x5 0 −Lee      (21) Ahora ya podemos escribir un sistema adecuado para su resolución numérica: Lrr Ler Ler f1 + f3 cos x5 − f4 sin x5 ∆ ∆ ∆ Lrr Ler Ler − f2 + f3 sin x5 + f4 cos x5 ∆ ∆ ∆ Ler Lee Ler f1 cos x5 + f2 sin x5 − f3 ∆ ∆ ∆ Ler Ler Lee − f1 sin x5 + f2 cos x5 − f4 ∆ ∆ ∆ f5 f6 ẋ1 = − ẋ2 = ẋ3 = ẋ4 = ẋ5 = ẋ6 = (22) donde hemos introducido ∆ = Ler Ler − Lee Lrr f 5 = x6 Ler Ler f6 = (−x1 x2 − x2 x4 ) sin x5 + (−x1 x4 + x2 x3 ) cos x5 J J Πr − βx6 − J 3.1 (23) Método de Runge-Kutta de cuarto orden Existen muchos tratados de cálculo numérico donde se explican los métodos de integración de sistemas de ecuaciones diferenciales. Aquı́ damos la explicación de uno de estos métodos, probablemente el más popular, no por 113 añadir nada a lo ya escrito en otros lugares, sino por hacer estas notas en lo posible auto-contenidas y facilitar el camino al estudiante. El método de Runge-Kutta de cuarto orden es un método popular, sencillo de programar, relativamente rápido y en la mayor parte de las ocasiones de suficiente precisión, que permite resolver sistemas de ecuaciones diferenciales de primer orden de la forma: ẋ1 ẋ2 ẋ3 .. . = f1 (x1 , x2 , · · ·) = f2 (x1 , x2 , · · ·) = f3 (x1 , x2 , · · ·) . = .. (24) No vamos a discutir la forma en que se obtiene dicho método, sino simplemente describir el algoritmo. Antes de eso, conviene aclarar la naturaleza de todos estos métodos. Una integración numérica no nos proporciona la función x(t), sino una serie de valores de x para instantes t1 , t2 , t3 ...tn . Aunque existen métodos de paso variable donde los intervalos ti+1 − ti dependen de i, en la mayorı́a de las ocasiones, para todos los i, la diferencia ti+1 −ti es una constante h, de manera que si partimos desde un instante inicial t0 , ti = t0 + ih. Todos estos métodos requieren el conocimiento de un estado inicial a partir del cual calcular estados sucesivos. En primer lugar, para ecuaciones simples de la forma ẋ = f (x, t). El método de Runge-Kutta parte de un valor xk (indicamos ası́ x(tk )) y calcula el valor xk+1 . Si fijamos h (por ejemplo, h = 0.1 cuando deseamos conocer x de décima en décima de segundo) el algoritmo sigue los siguientes pasos: 1. Calcular k1 = hf (xk , tk ) 2. Calcular k2 = hf (xk + k1 /2, tk + h/2) 3. Calcular k3 = hf (xk + k2 /2, tk + h/2) 4. Calcular k4 = hf (xk + k3 , tk + h) 5. Calcular xk+1 = xk + 61 [k1 + 2k2 + 2k3 + k4 ] En general, los sistemas dinámicos vienen descritos no por una sola variable, sino por varias. Por consiguiente, necesitamos generalizar el algoritmo para el caso en que queremos integrar no una ecuación sino un conjunto de ellas. Daremos el algoritmo explı́cito para un sistema de dos ecuaciones. 114 La generalización para un número cualquiera es inmediata y se deja como ejercicio al lector. Sea el sistema: ẋ = f (x, y, t) ẏ = g(x, y, t) (25) Dados unos valores xk e yk , el algoritmo sigue los siguientes pasos: 1. Calcular k1 = hf (xk , yk , tk ) 2. Calcular n1 = hg(xk , yk , tk ) 3. Calcular k2 = hf (xk + k1 /2, yk + n1 /2, tk + h/2) 4. Calcular n2 = hg(xk + k1 /2, yk + n1 /2, tk + h/2) 5. Calcular k3 = hf (xk + k2 /2, yk + n2 /2, tk + h/2) 6. Calcular n3 = hg(xk + k2 /2, yk + n2 /2, tk + h/2) 7. Calcular k4 = hf (xk + k3 , yk + n3 , tk + h) 8. Calcular n4 = hg(xk + k3 , yk + n3 , tk + h) 9. Calcular xk+1 = xk + 61 [k1 + 2k2 + 2k3 + k4 ] 10. Calcular yk+1 = yk + 16 [n1 + 2n2 + 2n3 + n4 ] 4 Transformación de coordenadas Es evidente la complejidad del sistema de ecuaciones anterior, lo que motiva a la búsqueda de una transformación que conduzca a un sistema más sencillo. En general, buscamos una transformación lineal definida por una matriz A, de forma que, en función de nuevas corrientes j̄ y tensiones v̄, las originales se puedan escribir como ī = Aj̄ y ū = Av̄. Impondremos la condición de que la potencia eléctrica suministrada al sistema no dependa de la transformación, es decir P = īT ū = j̄ T AT Av̄ = j̄ T v̄ (26) lo que implica que ha de ser AT A = I, es decir, que la matriz traspuesta de A coincida con la inversa, lo cual sabemos que es cierto, en particular, 115 para las matrices de rotación. Procedemos a escribir en función de las nuevas variables las ecuaciones para la parte eléctrica: Av̄ = RAj̄ + θ̇ dL dA dj̄ Aj̄ + L θ̇j̄ + LA dθ dθ dt (27) o dL dA dj̄ Aj̄ + θ̇A−1 L j̄ + A−1 LA dθ dθ dt Introduciendo las nuevas matrices v̄ = A−1 RAj̄ + θ̇A−1 R′ = A−1 RA L′ = A−1 LA dA H = A−1 L dθ dL T = A−1 A dθ (28) (29) la parte eléctrica se escribe como dj̄ + θ̇ (H + T) j̄ (30) dt En cuanto a la parte mecánica, la única parte afectada es el par Π, que se escribe en función de las nuevas variables como v̄ = R′ j̄ + L′ 1 dL 1 1 dL Π = īT Aj̄ = j̄ T Tj̄ ī = j̄ T AT (31) 2 dθ 2 dθ 2 Como se ve, todo depende de la elección de la matriz A. ¿De dónde proviene la complejidad de la máquina? Proviene de la dependencia de L con θ, y en última instancia del giro del rotor. Es obvio que un ”motor” en que el rotor estuviese en reposo, al igual que el estator, serı́a mucho más sencillo. Con esta guı́a, elegiremos la matriz A como una matriz de giro que compense el giro del rotor, de tal forma que, en el nuevo sistema, el rotor se encuentre fijo y sus ejes sean colineales con los del estator. La matriz de transformación, de dimensiones 4 × 4, ha de dejar inalterados los valores de corrientes y tensiones del estator. Como habı́amos tomado    ī =   ieα ieβ irα irβ 116      (32) la matriz A se puede particionar como A= " I 0 0 Ar # (33) donde Ar es un giro en sentido inverso al del rotor: r A = " cos θ sin θ − sin θ cos θ # (34) Ahora se pueden calcular las nuevas matrices introducidas en (27). En primer lugar, R′ = AT RA = R (35) siempre que sea Rαr = Rβr . En general, por simetrı́a, consideraremos que se cumple esta condición, Rαr = Rβr = Rr , ası́ como la condición Rαe = Rβe = Re . La nueva matriz de inductancias es    L′ =   Además T = A−1 y Lee 0 Ler 0 0 Lee 0 Ler Ler 0 Lrr 0 0 Ler 0 Lrr   dL  A=  dθ H = A−1 L      (36) 0 0 0 −Ler 0 0 Ler 0 er 0 L 0 0 −Ler 0 0 0  dA  =   dθ 0 0 0 0 0 0 Ler er 0 −L 0 0 0 Lrr 0 −Lrr 0      (37)      (38) Y ahora se puede escribir la parte eléctrica en las nuevas coordenadas:    v̄ =    Re 0 0 0 e 0 R 0 0 0 θ̇Ler Rr θ̇Lrr −θ̇Ler 0 −θ̇Lrr Rr       j̄ +      117 Lee 0 Ler 0 0 Lee 0 Ler Ler 0 Lrr 0 0 Ler 0 Lrr   dj̄    dt (39) Falta calcular el par: 1 dL 1 Π = īT ī = j̄ T Tj̄ (40) 2 dθ 2 Hemos dicho antes que elegı́amos A de forma que las variables ligadas al estator quedasen inalteradas. Escribimos ahora explı́citamente el nuevo vector de corrientes:    j̄ =   ieα ieβ ird irq      (41) Las intensidades ligadas al nuevo sistema se denominan habitualmente con los subı́ndices ’d’ (de ”directo”) y ’q’ (de ”quadrature”), y al nuevo sistema se le suele llamar (αβdq). Pues bien, en las nuevas variables el par viene dado por Π = Ler (ieβ ird − ieα irq ) (42) y la ecuación para la parte mecánica se escribe entonces: J 5 d2 θ dθ = Ler (ieβ ird − ieα irq ) − β − Πm 2 dt dt (43) Resumen conceptual 1. Se razona a partir del teorema de Gauss que el campo en el que se encuentra el rotor es una función periódica del ángulo, en un instante dado. De ahı́ que se pueda hacer el análisis de la frecuencia fundamental y que el campo B̄ se pueda considerar como la composición de dos campos perpendiculares, B̄α y B̄β , lo que motiva el modelo de máquina generalizada. 2. Se escriben las ecuaciones para la parte eléctrica y se calcula el par a partir de la co-energı́a y en la hipótesis lineal λ̄ = Lī. 3. Al hacer explı́cita una forma de L es posible escribir un conjunto de seis ecuaciones que incluyen la parte eléctrica y la parte mecánica. Se manipulan ligeramente para ponerlas en una forma apta para la resolución numérica y se presenta uno de los muchos algoritmos disponibles para integrar este tipo de sistemas. 118 4. A la vista de la complejidad del sistema anterior, se introduce una transformación de coordenadas que simplica notablemente el sistema, y se re-escribe en las nuevas coordenadas. 6 Ejercicios No se proponen ejercicios para este tema, dada su orientación. Sin embargo, y con vistas al trabajo computacional, se recomienda la implementación del algoritmo de Runge-Kutta. 119 VI La máquina de corriente continua 1 La máquina de corriente continua Al comentar la ecuación V.11, decı́amos que la máquina no puede funcionar si por las bobinas del rotor y del estator circula corriente continua. Pero una máquina puede ser alimentada con corriente continua y, sin embargo, circular corriente no continua internamente. Además, eso es algo que se puede conseguir con facilidad. En la Figura 1 la bobina se encuentra integrada en una pieza circular, discontinua, cuyas partes p y q se ponen en contacto con la fuente de alimentación a través de dos escobillas, A y B. En la posición de la Figura 1, la corriente circula por la bobina de derecha a izquierda. Pero con un pequeño giro adicional la escobilla B pasa a estar en contacto con la parte p y la escobilla A con la parte q, y la corriente en la bobina se invierte. Figura 1 De esta forma, desde una posición inicial, el rotor gira buscando alinearse con el estator. Si cuando se produce este alineamiento se conmuta la corriente en el rotor, cambia la polaridad de su campo y eso fuerza el giro de media vuelta buscando la nueva alineación. Al completarse esta media vuelta vuelve a cambiar la polaridad, y ası́ sucesivamente. En la Figura 1, donde hay una sola bobina, aparece dos escobillas. Si tuviésemos más bobinas, necesitarı́amos, en principio, una pareja de escobillas por cada bobina. Pero hay disposiciones ingeniosas de las bobinas, de forma que sólo se necesita un par de escobillas. Omitiremos aquı́ estos 120 detalles constructivos. Sin embargo, el flujo de la corriente es relevante para la operación de la máquina, y es preciso tenerlo en cuenta. Por ejemplo, si el rotor y el estator se alimentan de forma independiente tenemos una configuración. Si estator y rotor se encuentran en serie alimentados por una misma fuente, tenemos otra. Si se encuentran en paralelo, otra. Incluso puede haber una parte en serie y otra en paralelo. Las Figuras 2a, b, c y d muestran estas posibilidades. Figura 2 2 2.1 Modelo Configuración independiente La máquina de continua conmutada mecánicamente se puede modelar mediante un par de bobinas, una para el estator y otra para el rotor. Si en la máquina generalizada nos quedamos sólo con la bobina β del estator y la bobina ’d’ del rotor, las ecuaciones para la parte eléctrica quedan como 121 " vβe vdr # = " Re + Lee d/dt 0 er r θ̇L R + Lrr d/dt #" jβe jdr # (1) y para la parte mecánica d2 θ dθ = Ler jβe jdr − β − Πm (2) 2 dt dt Estamos asumiendo implı́citamente la configuración independiente de la Figura 2a. Este sigue siendo un sistema no lineal, aunque muy simple. Se puede simplificar todavı́a más si se considera el régimen permanente, en cuyo caso las derivadas respecto al tiempo se anulan. La parte eléctrica se reduce entonces a J vβe = Re jβe vdr = θ̇Ler jβe + Rr jdr (3) donde ahora las tensiones e intensidades son constantes, ası́ como θ̇, la velocidad de giro de la máquina. Para la parte mecánica: Ler jβe jdr = Πm + β θ̇ (4) Si usamos las ecuaciones de la parte eléctrica para obtener las corrientes y sustituimos en la parte mecánica: vβe Re θ̇Ler vβe vdr − = Rr Rr Re ! e vdr θ̇Ler vβe er vβ = L − r e − β θ̇ Re Rr R R jβe = jdr Πm (5) Ası́, Πm es una función lineal de θ̇, de ordenada en el origen vβe vdr L Re Rr er (6) y pendiente Ler vβe −β − Re 122 !2 1 Rr (7) mientras que el par eléctrico es Π= Ler jβe jdr ve = L βe R er vdr θ̇Ler vβe − Rr Rr Re ! (8) que es también una función lineal de θ̇, de ordenada en el origen Ler vβe vdr Re Rr (9) y pendiente 1 − r R Ler vβe Re !2 (10) Se ve que el par se puede modificar de dos formas: o bien modificando vdr , y entonces tenemos una familia de lı́neas caracterı́sticas paralelas, como se muestra en la Figura 3, o bien modificando vβe , en cuyo caso al aumentar vβe aumenta la pendiente, como se muestra en la Figura 4. Aquı́ se ve una diferencia esencial entre el motor de explosión interna y este tipo de motor eléctrico, en el cual el par es una función monótona decreciente de θ̇, mientras que en el primero es creciente hasta alcanzar un máximo y luego decrece. Figura 3 2.2 Configuración en paralelo Cuando el rotor y el estator se alimentan en paralelo con la misma fuente, entonces vβe = vdr = v, y seguimos teniendo una dependencia lineal del par eléctrico con la velocidad angular, con ordenada en el origen 123 Figura 4 Ler v 2 Re Rr (11) y pendiente 1 Ler v 2 (12) − r R Re En la configuración independiente, cuando la fuerza electromotriz inducida iguala a vdr , cesa el par, y esto ocurre para θ̇ = vdr Re Ler vβe (13) En la disposición en paralelo, ocurre para θ̇ = 2.3 Re Ler (14) Configuración en serie La situación es distinta cuando la configuración es en serie, porque en ese caso jβe = jdr = j (15) vβe + vdr = v (16) y Para la parte eléctrica tenemos: 124 vβe = (Re + Lee d )j dt vdr = (θ̇Ler + Rr + Lrr d )j dt (17) Ası́ que v = vβe + vdr = (Re + Rr )j + θ̇Ler j + (Lee + Lrr ) dj dt (18) y para la parte mecánica d2 θ = Ler j 2 − β θ̇ − Πm (19) dt2 En régimen estacionario, las derivadas respecto al tiempo se anulan, y queda J v = (Re + Rr )j + θ̇Ler j 0 = Ler j 2 − β θ̇ − Πm (20) Despejando j de la primera y sustituyendo en la segunda, tenemos para el par: Π = Ler v2 (Re + Rr + θ̇Ler )2 (21) La caracterı́stica de estos motores es que tienen un par de arranque elevado. En efecto, si θ̇ = 0: Π(0) = Ler v 2 (Re + Rr )2 (22) y vemos cómo el par de arranque crece con el cuadrado de la tensión aplicada. Es por eso que esta configuración se usa en motores de tracción. Por ejemplo, se necesita un par muy elevado para poner en marcha a un vehı́culo, o para poner en movimiento un montacargas. Muchos otros aspectos del funcionamiento de la máquina alimentada por corriente continua no serán tratados aquı́, donde nos hemos limitado a extraer las caracterı́sticas básicas del modelo de máquina generalizada que fue propuesto en el capı́tulo anterior. 125 3 Resumen conceptual 1. Se presenta un modelo constructivo sencillo que muestra cómo una máquina puede ser alimentada por corriente continua. Se presentan cuatro configuraciones posibles. 2. Se analiza la máquina de corriente continua particularizando la máquina generalizada al caso en que se consideran sólo jβe y jdr . 3. Para las configuraciones independiente, serie y paralelo, se estudia el régimen estacionario, y en particular las curvas de par. 126 VII La máquina de inducción El principio de la máquina de inducción fue establecido en IV.5. En este capı́tulo vamos a desarrollar con mayor amplitud la teorı́a de este tipo de máquinas. 1 La máquina n-fásica En primer lugar, veamos que la máquina generalizada que presentamos en V se base en que el campo B̄ se puede descomponer en dos campos perpendiculares. Esto no quiere decir que si B̄ es la resultante de un número arbitrario de polos, no podamos considerarlos a cada uno en particular. Si tenemos n bobinas en el estator y otras tantas en el rotor, tenemos un vector de n corrientes īel y un vector de n corrientes īrl , con l = 1, · · · , n. En total, 2n componentes de corriente y 2n componentes de tensión, v̄le y v̄lr . En cuanto a la matriz de resistencias, tendrá la forma " Re 0 0 Rr # (1) donde Re y Rr son matrices diagonales. Falta la matriz de inducciones, de dimensiones 2n × 2n, que se puede considerar subdividida en cuatro submatrices: L= " Le Ler Lre Lr # (2) Le contendrá en su diagonal las autoinducciones de las bobinas del estator, y fuera de la diagonal la inducciones mutuas entre las bobinas del estator, que dependen del coseno del ángulo que forman entre sı́. Como hay n bobinas, se encuentran separadas por un ángulo 2π/n, de manera que la inducción mutua entre la bobina i y la bobina j será de la forma Le (i, j) = M e cos(2π(i − j)/n) (3) Lr (i, j) = M r cos(2π(i − j)/n) (4) Por el mismo razonamiento, Lr contendrá en su diagonal las autoinducciones de las bobinas del rotor, y fuera de la diagonal Faltan las submatrices Ler y Lre . Supondremos que Ler (i, j) = Lre (j, i), por simetrı́a. Si θ es el ángulo del rotor respecto al estator: 127 Ler (i, j) = M er cos(θ + 2π(i − j)/n) (5) Siguen siendo válidas las ecuaciones V.13, en las cuales el par eléctrico se obtiene de V.7. Como se ve, no hay nada nuevo, y una rutina de integración numérica que resuelva el problema puede parametrizarse en función del número de fases n. 2 La máquina trifásica Por su relevancia en la industria, vamos a tratar con una máquina trifásica, que es una particularización de lo dicho hasta ahora, con n = 3. Otra particularidad es que las tensiones no son cualesquiera, sino tensiones alternas desfasadas entre sı́. La idea es que si excitamos los polos del estator con un cierto desfase entre sı́, es como si tuviésemos un sólo polo giratorio que en su movimiento arrastra al rotor tras de sı́. En el caso más simple posible, tendrı́amos una bobina de rotor y una bobina de estator, excitada con una frecuencia angular igual a la de rotación del rotor, de forma que en el recorrido ABC en la Figura 1 las bobinas se repelen, y en el recorrida CDA se atraen. Es evidente que podemos seguir añadiendo bobinas, pero también que es preciso encontrar un equilibrio entre las caracterı́sticas electro-mecánicas y la complejidad constructiva y robustez de la máquina. Parece que, para la industria de las máquinas eléctricas, este equilibrio se encuentra en n = 3. Figura 1 En lo que sigue, usaremos un modelo como el de la Figura 2, donde el estator y el rotor están compuestos por tres bobinados de dos polos, en 128 disposición simétrica. Nos referiremos con los subı́ndices (a, b, c) a cada bobinado y con los superı́ndices (e, r) al estator y al rotor. Supondremos que el campo es radial en el ”gap”. Supondremos relaciones lineales entre el flujo y las intensidades, escribiendo λ̄ = Lī y partiremos de las ecuaciones básicas V.13. Figura 2 Como la resistencia de cada bobina depende sólo de la intensidad que atraviesa esa bobina, la matriz de resistencias será diagonal: R= " Re 0 0 Rr #      =     Re 0 0 0 0 0 0 Re 0 0 0 0 0 0 Re 0 0 0 0 0 0 Rr 0 0 0 0 0 0 Rr 0 0 0 0 0 0 Rr En cuanto a la matriz de inductancias: L= " Le Le r Lre Lr #           (6) (7) Le da cuenta de las inducciones mutuas y autoinducciones en las bobinas del estator: Leaa Leab Leac  e e L =  Lba Lebb Lebc   Leca Lecb Lecc   129 (8) Si suponemos que las autoinducciones son iguales entre las tres bobinas, Leaa = Lebb = Lecc = Le . En cuanto a las inducciones mutuas, llamaremos M e al valor máximo de la inducción mutua entre las bobinas del estator, que ocurrirá cuando el flujo que atraviesa a una de ellas producido por otra es máximo, y dependerá de la orientación relativa de ambas, como se discutió en V.2.1. Entonces Le − 12 M e − 12 M e Le M e cos 2π/3 M e cos 2π/3    Le M e cos 2π/3  =  − 12 M e Le − 12 M e  Le =  M e cos 2π/3  M e cos 2π/3 M e cos 2π/3 Le − 12 M e − 21 M e Le (9) y por el mismo razonamiento     Lr − 21 M r − 12 M r  r 1 r Lr − 12 M r  L =  −2M  Lr − 21 M r − 12 M r   (10) Pasamos a Ler y Lre . Por simetrı́a, estas matrices han de ser la una traspuesta de la otra. Si θ es el ángulo que forman el estator y el rotor: M er cos θ M er cos(θ − 4π/3) M er cos(θ − 2π/3)  er M er cos θ M er cos(θ − 4π/3)  Ler =  M er cos(θ − 2π/3)  = M R(θ) er er er M cos(θ − 4π/3) M cos(θ − 2π/3) M cos θ (11) con     cos θ cos(θ − 4π/3) cos(θ − 2π/3)  cos θ cos(θ − 4π/3)  R(θ) =  cos(θ − 2π/3)  cos(θ − 4π/3) cos(θ − 2π/3) cos θ (12) Las ecuaciones para la parte eléctrica son entonces: ū = " Re 0 0 Rr # d ī + dt " Le M er R(θ) er T M R (θ) Lr # ! ī (13) y el par, como sabemos, viene dado por 1 dL ī (14) Π = īT 2 dθ Como sólo las submatrices superior derecha e inferior izquierda de L dependen de θ, se produce el siguiente desacoplo: 130  1 Π = [(īe )T , (īr )T ]   2 M er dR/dθ 0 er T M dR /dθ   0 Es decir 1 dR r dRT e Π = M er (īe )T ī + (īr )T ī 2 dθ dθ "  " īe īr # (15) # (16) dRT e dR r ī = M er (īr )T ī dθ dθ (17) y es fácil comprobar que Π = M er (īe )T con   sin θ sin(θ − 4π/3) sin(θ − 2π/3) dR  sin θ sin(θ − 4π/3)  = −  sin(θ − 2π/3)  dθ sin(θ − 4π/3) sin(θ − 2π/3) sin θ 2.1 (18) Transformación de Park En IV.5 discutimos los motores monofásicos y vimos que habı́a dos casos prácticos importantes, el de los motores sı́ncronos y el de los ası́ncronos. En los primeros, la frecuencia angular mecánica coincide con la eléctrica, y en los segundos no. Esto motiva la búsqueda de una transformación genérica a unos ejes rotatorios (d, q), cuya frecuencia angular después se pueda particularizar para diversos casos. En la Figura 3 se representan tres ejes eléctricos desfasados en 2π/3, que llamaremos (a, b, c), y dos ejes rotatorios (d, q). Proyectando cada uno de los ejes eléctricos sobre d y sobre q, vemos que la relación entre las coordenadas de un vector x̄ en (a, b, c) y las coordenadas en (d, q) es la siguiente: x̄dq = " cos θ cos(θ − 2π/3) cos(θ − 4π/3) − sin θ − sin(θ − 2π/3) − sin(θ − 4π/3) # x̄abc (19) Si vamos a V.4, donde presentamos la teorı́a general de las transformaciones de coordenadas, vemos que allı́ se precisa la matriz inversa de la matriz de transformación, cosa que es imposible en nuestro razonamiento actual porque tenemos una matriz que no es cuadrada. Para solucionar este problema formal, introducimos una tercera componente en el sistema (d, q), que, de acuerdo con la costumbre, llamaremos ’0’. Ası́, en el sistema (d, q, 0), la transformación que deseamos es 131 Figura 3 x̄dq0   cos θ cos(θ − 2π/3) cos(θ − 4π/3)  =  − sin θ − sin(θ − 2π/3) − sin(θ − 4π/3)   x̄abc ? ? ? (20) La idea es que la transformación, representada por la matriz A, ha de ser tal que la potencia suministrada a la máquina sea la misma en un sistema y en otro, es decir P = īTdq0 v̄dq0 = (Aīabc )T (Av̄abc ) = īTabc AT Av̄abc (21) y eso implica que ha de ser AT A = I. Como la matriz I se caracteriza por dos condiciones: a) que los elementos de la diagonal sea iguales a 1 y b) que los elementos de fuera de la diagonal sean nulos, vamos a intentar como matriz de transformación una que dependa de dos parámetros, k1 y k2 , y después ajustaremos esos parámetros para tratar de que se cumplan a) y b). Ası́ pues, intentamos con   cos θ cos(θ − 2π/3) cos(θ − 4π/3)  − sin θ − sin(θ − 2π/3) − sin(θ − 4π/3)  A = k1   k2 k2 k2 (22) de donde k22 + 1 k22 − 1/2 k22 − 1/2 k22 + 1 k22 − 1/2  AT A = k12    k22 − 1/2 2 2 2 k2 − 1/2 k2 − 1/2 k2 + 1   132 (23) q √ y como esta matriz debe ser igual a la identidad, k2 = 1/ 2 y k1 = 2/3. En definitiva: A= q   cos θ cos(θ − 2π/3) cos(θ − 4π/3)  − 2π/3) − sin(θ √ − 4π/3)  2/3  − sin  √ θ − sin(θ √ 1/ 2 1/ 2 1/ 2 (24) Las intensidades, flujos y voltajes en ambos sistemas se relacionan entre sı́ a través de esta matriz. A esta transformación se la conoce como ”transformación de Park” (Park, 1929). En lo sucesivo, y como esta transformación tiene nombre propio, a su matriz la llamaremos P en lugar de A. 2.2 Utilidad de la transformación de Park Si volvemos a (13), aquéllas son, obviamente, las ecuaciones en el sistema (a, b, c), aunque no las distinguiésemos ası́ explı́citamente. Ahora necesitamos hacerlo. A las cantidades en el sistema (a, b, c) las distinguiremos con el subı́ndice ’a’, y a las cantidades en el sistema (d, q, 0) con el subı́ndice ’0’. d λ̄a = ūa − Ra īa dt (25) Figura 4 Para pasar al sistema (d, q, 0), tengamos en cuenta que para el rotor la transformación es P(θr ), y para el estator, P(θe ). Además, en la Figura 4 se ve que, si θ es el ángulo relativo entre estator y rotor, θ = θe − θr . Ası́ que 133 desdoblamos la ecuación anterior en dos: una para el estator y otra para el rotor: d e λ̄ = ūea − Rea īea dt a d r λ̄ = ūra − Rra īra dt a (26) y escribiendo las cantidades (a, b, c) en función de las cantidades (d, q, 0): d −1 (P (θe )λ̄e0 ) = P−1 (θe )ūe0 − Rea P−1 (θe )īe0 dt d −1 (P (θr )λ̄r0 ) = P−1 (θr )ūr0 − Rra P−1 (θr )īr0 dt (27) Efectuando las derivadas de la izquierda y premultiplicando por P: dP−1 (θe ) dλ̄e0 + P(θe ) = ūe0 − Rea īe0 dt dt dλ̄r0 dP−1 (θr ) + P(θr ) = ūr0 − Rra īr0 dt dt (28) Ahora, se comprueba sin dificultad que   0 −1 0 dP (θ)  P(θ) = θ̇  1 0 0   dt 0 0 0 −1 (29) con lo cual, podemos escribir explı́citamente las componentes de (28): dλed /dt − θ̇e λeq = ued − Re ied dλeq /dt + θ̇e λed = ueq − Re ieq dλe0 /dt = ue0 − Re ie0 dλrd /dt − θ̇r λrq = urd − Rr ird dλrq /dt + θ̇r λrd = urq − Rr irq dλr0 /dt = ur0 − Rr ir0 Consideremos ahora los flujos: 134 (30) λ̄ea = Le īea + Ler īra λ̄ra = (Ler )T īea + Lr īra (31) P−1 (θe )λ̄e0 = Le P−1 (θe )īe0 + M er R(θ)P−1 (θr )īr0 P−1 (θr )λ̄r0 = M er RT (θ)P−1 (θe )īe0 + Lr P−1 (θr )īr0 (32) al pasar a (d, q, 0): Premultiplicando la primera por P(θe ) y la segunda por P(θr ), tenemos: " λ̄e0 λ̄r0 # = " P(θ)Le P−1 (θe ) M er P(θe )R(θ)P−1 (θr ) er T −1 M P(θr )R (θ)P (θe ) P(θr )Lr P−1 (θr ) #" īe0 īr0 # (33) Y ahora pasamos a calcular las submatrices. En primer lugar 0 0 Le + 21 M e   e −1 1 e e 0 L + 2M 0 P(θe )L P (θe ) =   e e 0 0 L −M (34) Lr + 12 M r 0 0   r −1 1 r r 0 L + 2M 0 P(θr )L P (θr ) =   0 0 Lr − M r (35)   y análogamente:   En cuanto a las otras dos submatrices, veamos que   1 0 0 3  M er P(θe )R(θ)P−1 (θr ) = M er   0 1 0  2 0 0 0 (36) simplificación que se alcanza teniendo en cuenta que θ = θe − θr . Como ésta es una matriz diagonal, coincide con su traspuesta, pero vemos que [P(θe )R(θ)PT (θr )]T = P(θr )RT (θ)PT (θe ) (37) y si tenemos en cuenta que PT = P−1 :   1 0 0 3 er  er T −1 M P(θr )R (θ)P (θe ) = M  0 1 0   2 0 0 0 135 (38) Por fin es posible apreciar qué extraordinaria simplificación produce la transformación de Park. En primer lugar, los coeficientes de la matriz de inducciones son constantes. En segundo lugar, las intensidades están desacopladas. 2.3 Par El par se calcula a partir de (17). Aplicando la transformación de Park: Π = M er (īea )T dR r dR T P (θr )īr0 īa = M er (īe0 )T P(θe ) dθ dθ (39) pero   0 −1 0 dR T 3  P(θe ) P (θr ) =  1 0 0  dθ 2 0 0 0 (40) ası́ que, finalmente 3 Π = M er (ieq ird − ied irq ) 2 2.4 (41) Casos particulares Como el sistema (d, q, 0) es arbitrario, hemos obtenido unas ecuaciones generales que ahora es posible particularizar. Teniendo en cuenta que θ = θr − θe , tenemos tres casos de interés: a) Cuando el sistema (d, q, 0) se hace coincidir con el estator, es θe = 0 y por tanto θr = θ, y las ecuaciones (30), teniendo en cuenta (34), (35), (36) y (37), se pueden escribir como      ū =      Re + pl1 0 0 pm 0 0 e 0 R + pl1 0 0 pm 0 e 0 0 R + pl2 0 0 0 pm −θ̇m 0 Rr + pl3 −θ̇l3 0 r θ̇m pm 0 θ̇l3 R + pl3 0 r 0 0 0 0 0 R + pl4 donde 136       ī (42)          ū =      ued ueq ue0 urd urq ur0       ;         ī =      ied ieq ie0 ird irq ir0           (43) p es el operador derivada temporal (p = d/dt) y l1 = Le + 12 M e , l2 = Le − M e , l3 = Lr + 21 M r , l4 = Lr − M r , m = 23 M er . b) Cuando el sistema se hace coincidir con el rotor, es θr = 0 y por tanto θe = −θ. Se tiene:      ū =      Re + pl1 θ̇l1 0 pm θ̇m 0 e −θ̇l1 R + pl1 0 −θ̇m pm 0 e 0 0 R + pl2 0 0 0 pm 0 0 Rr + pl3 0 0 r 0 pm 0 0 R + pl3 0 0 0 0 0 0 Rr + pl4       ī (44)     c) Cuando el sistema (d, q, 0) se hace girar con la velocidad sincrónica, θe = θr      ū =       3 Re + pl1 −θ̇e l1 0 pm −θ̇e m 0 e θ̇e l1 R + pl1 0 θ̇e m pm 0 0 0 Re + pl2 0 0 0 pm −θ̇e m 0 Rr + pl3 −θ̇e l3 0 r θ̇e m pm 0 θ̇e l3 R + pl3 0 0 0 0 0 0 Rr + pl4        ī (45)     Bibliografı́a Parte del material contenido en este capı́tulo proviene del capı́tulo 2, ”Dynamic modeling of Induction machines”, de ”Vector control of induction machines”, B. Robyns et al. Puede consultarse también ”Matrix analysis of electric machinery”, de N. N. Hancock. Gran parte de la bibliografı́a disponible basa la discusión en el formalismo de fasores en el plano complejo, que hemos omitido aquı́ completamente. Otras referencias que pueden 137 ser útiles: ”d, q reference frames for the simulation of induction motors”, de R.J. Lee, P. Pillay y R.G. Harley; En ”High performance drives”, de E. Levi, el capı́tulo ”Mathematical modelling of an induction machine and the supply”. Rara vez se considera la parte mecánica, por eso puede ser interesante ”Analysis and modelling of an induction machine with a pulsating load torque used for a washing machine application”, de Magnus Hedin y Linda Lundström. Para una ilustración del uso de los distintos sistemas de referencia, con simulaciones numéricas, véase ”Transient analysis of three-phase induction machine using different reference frames”, de Vivek Pahwa y K. S. Sandhu. 4 Resumen conceptual 1. Se razona sobre una máquina hipotética de un número arbitrario de fases, y se ve cual serı́a la forma de la matriz L. Al considerar una máquina de tres fases, se escriben las matrices R y L. 2. A partir de las formas especı́ficas para las matrices, se obtienen las ecuaciones de la parte eléctrica y el par. 3. Al poner en relación las variables en el sistema (a, b, c) con las variables (d, q) que usamos en la máquina generalizada, vemos que la matriz de transformación es de 2 × 3, lo que es un inconveniente formal ya que al poner en relación a ambos sistemas necesitamos la matriz inversa de la transformación, que en este caso no existe. Por eso, se amplia el sistema (d, q) introduciendo un eje adicional (d, q, 0) y se especula sobre cómo la matriz de transformación original deberı́a ampliarse. 4. Se obtiene finalmente la relación entre los sistemas (a, b, c) y (d, q, 0). Se trata de la transformación de Park. 5. Se usa la transformación de Park para encontrar las ecuaciones generales de la máquina en el sistema (d, q, 0), y se muestra la gran simplificación conseguida, que puede ser aún más si se consideran, lo que se hace en la última sección, velocidades angulares particulares. 5 Ejercicios Dado el carácter algebraico de este capı́tulo, recomendamos al estudiante que se ayude de un programa de cálculo simbólico para verificar algunas de las relaciones que hemos usado. Los ejercicios propuestos van en este sentido. 138 1. Verificar la ecuación (29). 2. Verificar (34). 3. Verificar (36). 4. Verificar (40). 139

Electromecánica

Documentos relacionados

Productos

Apoyo

Electromecánica

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib