Electromecánica

Anuncio
Electromecánica
Prof. Dr. Francisco Javier Gil Chica
Octube de 2012
1
2
I
Repaso de Cálculo
1
Integrales de camino
1.1
Formas de la integral de camino
Una integral de camino en dos dimensiones tiene la forma:
P (x, y)dx + Q(x, y)dy
(1)
P (x, y, z)dx + Q(x, y, z)dy + R(x, y, z)dz
(2)
y en tres dimensiones:
Z
Z
Sin pérdida de generalidad y para aligerar notación, restringimos la discusión al caso bidimensional. En (1), x e y no son independientes, sino que
existe una relación funcional entre ellas de la forma y(x). Si la curva y(x)
está dada en forma paramétrica mediante un par de relaciones
x = ϕ(t)
y = ψ(t)
(3)
entonces la integral de camino se reduce a una integral ordinaria
Z
[P (ϕ(t), ψ(t))ϕ′ (t) + Q(ϕ(t), ψ(t))ψ ′ (t)]dt
(4)
Ejemplo: calcular
α=
Z
(2,0)
(0,2)
xydx
(5)
a lo largo de la lı́nea que une el punto (2, 0) con el punto (0, 2). Solución:
la ecuación de la recta es y = 2 − x, de manera que
α=
En forma paramétrica:
Z
x=0
x=2
x(2 − x)dx = −
x = t
y = 2−t
3
4
3
(6)
(7)
y
4
(8)
3
t=0
Parece que no hay ventaja alguna en la representación paramétrica, pero
si elegimos para integrar el arco de circunferencia en el primer cuadrante que
une el punto (2, 0) con el punto (0, 2), entonces la representación paramétrica
se vuelve ventajosa, porque el arco viene dado por
α=
Z
t=2
t(2 − t)dt = −
x = 2 cos t
y = 2 sin t
(9)
donde t varı́a entre 0 y π/2 y
8
(10)
3
t=0
Obsérvese, de entrada, que la integral de camino depende de la trayectoria
elegida. Otra forma para las integrales de camino es
α=
Z
t=π/2
2 cos t × 2 sin t × (−2) sin tdt = −
α=
Z
B
A
g(x, y)ds
(11)
donde ds es un diferencial del camino que une A y B. Del teorema de
Pitágoras:
ds =
con lo cual
q
q
(dx)2 + (dy)2 = dx 1 + (y ′ )2
α=
Z
B
A
q
g(x, y) 1 + (y ′ )2 dx
(12)
(13)
Si el camino se da en forma parametrizada:
x = ϕ(t)
y = ψ(t)
(14)
entonces dx = ϕ′ dt, dy = ψ ′ dt y
ds =
con lo que
α=
Z
B
A
q
(ϕ′ )2 + (ψ ′ )2 dt
(15)
q
(16)
g(ϕ(t), ψ(t)) (ϕ′ )2 + (ψ ′ )2 dt
4
1.2
Trabajo
El trabajo que una fuerza desarrolla al mover un punto a lo largo de una
trayectoria viene dado por una integral de camino:
T =
Z
B
A
F̄ .dr̄
(17)
donde F̄ = Fx (x, y, z)î + Fy (x, y, z)ĵ + Fz (x, y, z)k̂ y dr̄ = dxî + dy ĵ + dz k̂.
Ejemplo: calcular el trabajo de una fuerza aplicada a un punto que se mueve
en el arco de circunferencia que une los puntos (0, 2) y (2, 0), cuya dirección
apunta siempre a (2, 0) y cuyo módulo es proporcional a la distancia a (2, 0),
con constante de proporcionalidad k. Solución: la fuerza se expresa como
F̄ = kū, donde ū es el vector (2 − x)î − y ĵ. Entonces
T =k
Z
(2,0)
(0,2)
(2 − x)dx − ydy
(18)
Usando la forma paramétrica para la trayectoria
x = 2 sin t
y = 2 cos t
(19)
tenemos
T = 4k
1.3
"Z
t=π/2
t=0
(1 − sin t) cos tdt +
Z
t=π/2
t=0
#
cos t sin tdt = 4k
(20)
Independencia del camino
Es importante el caso en que la integral de camino tiene el mismo valor independientemente de la trayectoria elegida. Es lo que ocurre en los llamados
”campos conservativos”. La integral de camino depende entonces sólo de
los puntos inicial y final de la trayectoria. ¿En qué condiciones ocurre esto?
Demostraremos que la condición necesaria y suficiente para que la integral
de camino
α=
Z
B
A
P (x, y)dx + Q(x, y)dy
(21)
dependa únicamente de A y B es que
∂P
∂Q
=
∂y
∂x
5
(22)
Necesidad: Si existiese una z(x, y) tal que
dz =
∂z
∂z
dx +
dy = P (x, y)dx + Q(x, y)dy
∂x
∂y
(23)
es decir:
∂z
= P (x, y)
∂x
∂z
= Q(x, y)
∂y
(24)
entonces
α=
Z
B
A
P (x, y)dx + Q(x, y)dy =
Z
B
A
dz = zB − zA
(25)
En resumen, si α es independiente del camino, significa que el integrando
es un dz, lo que implica (24), lo que implica (22), ya que
∂ 2z
∂ 2z
=
∂x∂y
∂y∂x
(26)
Z
(27)
Suficiencia: Llamamos
f (x, y) =
ası́ que, manteniendo y fija:
P (x, y)dx
∂f
= P (x, y)
∂x
(28)
∂ 2f
∂P
∂Q
=
=
∂x∂y
∂y
∂x
(29)
de donde
de donde
∂Q
∂ 2f
∂
∂f
0=
−
=
Q−
∂x
∂x∂y
∂x
∂y
!
(30)
y de aquı́
Q−
∂f
= φ(y)
∂y
Llamamos ahora
6
(31)
z(x, y) = f (x, y) +
Z
φ(y)dy
(32)
∂f
∂z
=
+ φ(y) = Q(x, y)
∂y
∂y
(33)
de donde, de (31) y (32):
y también, de (28)
∂f
∂z
=
∂x
∂x
P (x, y) =
(34)
es decir, que
P (x, y)dx + Q(x, y)dy =
∂z
∂z
dx +
dy = dz
∂x
∂y
(35)
y por tanto α es independiente del camino elegido.
2
Integrales dobles
Para introducir el concepto de integral doble, consideremos el problema de
calcular el volumen de un prisma recto cuya base es una curva cerrada C en
el plano xy. Las generatrices del prisma son paralelas al eje z. Para cada
punto (x, y) del interior de C, la altura del prisma es z(x, y). El volumen del
prisma es entonces la suma de los volúmenes de los prismas rectos de base
cuadrangular, de lados dx y dy y alturas z(x, y), es decir:
V =
Z
z(x, y)dxdy
(36)
Esta es una forma simbólica de expresar el volumen, pero no nos indica
cómo efectuar el cálculo. Una forma es dividiendo el volumen en láminas de
anchura dx. Entonces, para un x = constante, el area de la lámina es
Z
y=β
y=α
z(x, y)dy
(37)
donde los limites de integración α y β son funciones de x. De hecho, son
los puntos en que la lı́nea x = constante corta a C. El volumen de la lámina
es
dx
Z
y=β
y=α
z(x, y)dy
y el volumen total:
7
(38)
Z
x=η
x=ξ
dx
Z
y=β
y=α
z(x, y)dy
(39)
donde x = ξ y x = η son las tangentes a C paralelas al eje y. Es obvio
también que obtenemos el mismo volumen si tomamos láminas paralelas del
al eje x en lugar de láminas paralelas al eje y. En ese caso, el área de
cada lámina se expresarı́a como una integral en x, con lı́mites de integración
dependientes de y. Aunque hemos introducido
la integral doble en relación
R
con un problema particular, es claro que f (x, y)dxdy es un ente matemático
que
no requiere de interpretación fı́sica, como tampoco la requiere la integral
R
f (y)dy.
Ejemplo: Calcular
Z
2xydxdy
(40)
√
sobre el recinto limitado por las curvas y = x2 , y = x, x = 0 y x =
1/2. Los pasos a seguir son: a) hacerse una representación del recinto de
integración; b) obtener los lı́mites de la integral en y como función de x; c)
integrar en y y d) integrar en x, que en este caso varı́a entre 0 y 1/2. Ası́,
tenemos
Z
2.1
x=1/2
x=0
dx
"Z
√
y= x
y=x2
#
2xydy =
Z
x=1/2
x=0
dx(x2 − x5 ) =
5
128
(41)
Cambio de variable
Consideremos el cambio de variables x = f (u, v) e y = g(u, v). En el plano
(u, v), el punto (u, v) se corresponde en el plano (x, y) con (f (u, v), g(u, v)).
Por su parte, el punto (u + du, v) se transforma en
∂f
∂f
du = x +
du
∂u
∂u
∂g
∂g
g(u + du, v) = g(u, v) +
du = y +
du
∂u
∂u
f (u + du, v) = f (u, v) +
(42)
De igual forma, (u, v + dv) se transforma en
∂f
∂f
dv = x +
dv
∂v
∂v
∂g
∂g
g(u, v + dv) = g(u, v) +
dv = y +
dv
∂v
∂v
f (u, v + dv) = f (u, v) +
8
(43)
Ası́, la región de área dudv en el plano (u, v) se transforma en un área
en el plano (x, y). Este área se puede calcular como el módulo del producto
vectorial de los vectores de origen (x, y) y extremos dados por las ecuaciones
(42) y (43), ā y b̄ en la Figura 1, de tal manera que la relación entre las áreas
elementales es
∂(f, g) dxdy = dudv
∂(u, v) (44)
Figura 1
Por consiguiente, si la transformación lleva de la región S a la región D,
tenemos que
Z
∂(f, g) dudv
z(x, y)dxdy =
Z(u, v) ∂(u, v) S
D
Z
(45)
donde Z(u, v) = z(x(u, v), y(u, v)).
2.2
El teorema de Green
El teorema de Green relaciona la integral de superficie con la circulación
sobre el contorno de esa superficie. Establece que
Z
S
∂Q ∂P
−
∂x
∂y
!
dxdy =
Z
C
(P dx + Qdy)
(46)
Demostración: Consideramos una curva γ convexa cerrada en el plano
(x, y). Sea A el punto de la curva con la coordenada x = a mı́nima, B el
9
punto de la curva con la coordenada y = b mı́nima, C el de coordenada x = c
máxima y D el de coordenada y = d máxima. Ası́, la curva está incrita en
un rectángulo de lados c − a y d − b. Llamamos θ1 (x) a la curva ABC, y
θ2 (x) a la curva ADC. Tenemos que
Z
γ
P (x, y)dx =
=
Z
Z
x=c
x=a
x=c
x=a
P (x, θ1 (x))dx +
Z
x=a
x=c
P (x, θ2 (x))dx
[P (x, θ1 (x)) − P (x, θ2 (x))]dx
(47)
Por otro lado
Z
S
Z x=c
Z y=θ2 (x)
∂P
∂P
dxdy =
dy
dx
∂y
x=a
y=θ1 (x) ∂y
=
Z
x=c
x=a
[P (x, θ2 (x)) − P (x, θ1 (x))]
(48)
de donde se sigue que
Z
γ
P dx = −
Z
S
∂P
dxdy
∂y
(49)
y por análogo razonamiento
Z
γ
Qdy =
Z
S
∂Q
dxdy
∂x
(50)
lo que demuestra el teorema.
Ejemplo: Deseamos calcular
Z
C
(2y 2 − x2 )dx + (3x2 − y 2 )dy
(51)
sobre la circunferencia y 2 + (x − a)2 = a2 , que tiene la forma paramétrica
x = a(1 + cos t)
y = a sin t
(52)
donde t varı́a entre 0 y 2π. Esta integral puede sustituirse por una de
superficie, más sencilla de calcular, usando el teorema de Green. En efecto:
Z
2
C
2
2
2
(2y − x )dx + (3x − y )dy =
10
Z
S
(6x − 4y)dxdy
(53)
La primera parte es
Z
S
6xdxdy =
Z
a
dy
−a
Z
x2 (y)
x1 (y)
6xdx = 3
Z
a
h
dy x2
−a
ix2 (y)
x1 (y)
(54)
√
√
con x1 (y) = a − a2 − y 2 y x2 (y) = a + a2 − y 2 , resultando finalmente
6πa3 . La integral que contiene 4y se puede comprobar que es nula. Por
consiguiente,
Z
3
C
(2y 2 − x2 )dx + (3x2 − y 2 )dy =
Z
S
(6x − 4y)dxdy = 6πa3
(55)
Integral de superficie
Se define
Z
F (x, y, z)dS
(56)
sobre una región A de la superficie z(x, y) como
Z
A
q
F (x, y, z(x, y)) 1 + zx2 + zy2 dxdy
(57)
Por tanto, la integral de superficie ası́ definida no es más que una integral
doble, ya vista. Pero ilustremos el cálculo de este tipo de integrales con un
ejemplo. Sea
Z
S
(x2 + y 2 − 3z 2 )dS
(58)
sobre la superficie superior (z > 0) de la esfera x2 + y 2 + z 2 = 4. El
elemento de superficie es
dS = √
dxdy
4 − x2 − y 2
(59)
La integral que buscamos es entonces:
8
Z
y=2
y=−2
dy
Z
x2 (y)
x1 (y)
x2 + y 2 − 3
√
dx
4 − x2 − y 2
(60)
Vemos que los lı́mites de integración para x dependen de y. Serı́a más
sencillo si los lı́mites de cada integral fuesen independientes, lo que se consigue
con el cambio a coordenadas polares (r, θ), que son ambas independientes.
En polares:
11
x = r cos θ
y = r sin θ
(61)
y el cambio de variables exige el cálculo del determinante del jacobiano,
que es
∂(x, y) =r
∂(r, θ) (62)
ası́ que, finalmente, calculamos
Z
4
θ=2π
θ=0
dθ
Z
r=2
r=0
8r(r2 − 3)
32
√
π
=
−
3
4 − r2
(63)
Cálculo vectorial
4.1
Gradiente
Dada una función f (x, y, z), se define el vector gradiente como
grad(f ) =
∂f ∂f ∂f
,
,
∂x ∂y ∂z
!
(64)
Su interpretación es la siguiente: dada la familia de superficies f (x, y, z) =
constante, el vector gradiente en el punto (x, y, z) es perpendicular a la superficie f (x, y, z) = constante a la que pertenece el punto y apunta hacia
valores crecientes de c. En efecto, entre dos puntos próximos pertenecientes
a la misma superficie:
df =
∂f
∂f
∂f
dx +
dy +
dz = 0
∂x
∂y
∂z
(65)
es decir, que los vectores
grad(f ) =
∂f
∂f
∂f
k̂
î +
ĵ +
∂x
∂y
∂z
(66)
y
dr̄ = dxî + dy ĵ + dz k̂
(67)
son perpendiculares, ya que su producto escalar es nulo. Pero como dr̄
se encuentra sobre la superficie, grad(f ) es perpendicular a ella. Por otro
12
lado, si P (x, y, z) es un punto que se encuentra sobre la superficie c y R(x +
dx, y + dy, z + dz) un punto que se encuentra sobre la superficie c′ , en la
perpendicular a c por P , entonces, si llamamos dr̄ = P R, será dr̄ paralelo al
gradiente, de donde
dx
dy
dz
=
=
=
fx
fy
fz
q
(dx)2 + (dy)2 + (dz)2
q
fx2 + fy2 + fz2
=q
dn
fx2 + fy2 + fz2
(68)
donde dn es la distancia entre las superficies c y c′ ; entonces,
al pasar de
q
′
2
c a c por la perpendicular a P , sustituyendo dx = fx dn/ fx + fy2 + fz2 y
análogamente para dy y dz:
df =
q
∂f
∂f
∂f
∂f
dx +
dy +
dz = fx2 + fy2 + fz2 dn =
dn
∂x
∂y
∂z
∂n
(69)
de donde se sigue que
∂f
(70)
∂n
Al pasar de c a c′ no a lo largo de la perpendicular, sino en una dirección
que forma un ángulo θ con la perpendicular y a lo largo de un ds, entonces
|grad(f )| =
q
fx2 + fy2 + fz2 =
∂f dn
∂f
∂f
=
=
cos θ
∂s
∂n ds
∂n
Si ŝ es la dirección de ds y n̂ la normal,
∂f
∂f
∂f
=
(ŝ · n̂) = ŝ ·
n̂ = ŝ · grad(f )
∂s
∂n
∂n
Se introduce el operador vectorial ∇ como
∇=
∂
∂
∂
î +
ĵ + k̂
∂x
∂y
∂z
(71)
(72)
(73)
de forma que se puede escribir
grad(f ) = ∇f
(74)
Ejemplo: Dada la función r2 = x2 + y 2 + z 2 , calcular su gradiente. Se ve
que
∂r2
= 2x
∂x
y análogamente para las otras dos coordenadas, de donde
13
(75)
∇r2 = 2r̄
(76)
Ejemplo: si f (r) es una función arbitraria de r =
su gradiente. Se ve que
√
x2 + y 2 + z 2 , calcular
∂f (r)
∂f (r) ∂r
x
=
= f ′ (r)
∂x
∂r ∂x
r
y análogamente para las otras coordenadas, de donde, finalmente
(77)
f ′ (r)
r̄ = f ′ (r)r̂
(78)
r
Si f1 (x, y, z) y f2 (x, y, z) son dos funciones escalares, continuas y derivables, de las reglas elementales de derivación se sigue que
∇f (r) =
∇(f1 + f2 ) = ∇f1 + ∇f2
∇(f1 f2 ) = f2 ∇f1 + f1 ∇f2
4.2
(79)
Campos vectoriales irrotacionales
Un campo vectorial V̄ (x, y, z) es una función que a cada punto (x, y, z) del espacio asigna un vector de componentes (V1 (x, y, z), V2 (x, y, z), V3 (x, y, z)). La
circulación de un campo vectorial sobre una curva ya la definimos implı́citamente en 1.2, ecuación (17). El trabajo es entonces la circulación de la fuerza
a lo largo de la trayectoria. Para un campo vectorial cualquiera V̄ (x, y, z) a
lo largo de una trayectoria C, la circulación es
Z
C
V̄ · dr̄
(80)
y si la trayectoria viene dada en la forma paramétrica (x(t), y(t), z(t)),
entonces la circulación es
Z
β
α
!
dx
dy
dz
V1
+ V2 + V3
dt
dt
dt
dt
(81)
donde α y β son los valores de t en los extremos de la trayectoria. Si la
trayectoria es cerrada, se suele usar el sı́mbolo
I
14
(82)
En (1.3) demostramos la condición que debe cumplir un campo vectorial para que su circulación sea independiente del camino, aunque allı́ no
habı́amos todavı́a introducido el término ”campo vectorial”. La extensión
obvia al caso tridimensional de aquella condición es que sea
∂V1
∂V2
=
;
∂y
∂x
∂V1
∂V3
=
;
∂z
∂x
∂V2
∂V3
=
∂z
∂y
(83)
Un campo vectorial se llama irrotacional si su circulación a lo largo de
cualquier trayectoria cerrada es nula. Ahora demostraremos dos resultados
importantes: a) si un campo V̄ es irrotacional, existe una función escalar f
tal que V̄ = ∇f . b) Si f es una función escalar, su gradiente es irrotacional.
Demostración de a): Elegimos como trayectoria cerrada una que va desde
el punto A al punto B pasando por P y vuelve de B a A pasando por Q, de
forma que
I
V̄ · dr̄ =
Z
AP B
V̄ · dr̄ +
Z
BQA
V̄ · dr̄ = 0
(84)
lo que implica que
Z
AP B
=−
Z
BQA
=
Z
AQB
(85)
y por tanto la integral es independiente de la trayectoria. Si fijamos A,
Z
AB
(86)
es una función sólo de B, pero como dicha integral es un escalar, entonces
Z
AB
V̄ · dr̄ = f (B)
(87)
Si B ′ es un punto próximo de B:
de manera que
Z
AB ′
V̄ · dr̄ = f (B ′ )
f (B ′ ) − f (B) = df = V̄ · dr̄
(88)
(89)
pero sabemos que el incremento df de una función escalar entre dos puntos
separados por dr̄ es ∇f · dr̄, de donde
(V̄ − ∇f ) · dr̄ = 0
15
(90)
y finalmente V̄ = ∇f , ya que dr̄ es arbitrario.
Demostración de b): Si f es una función escalar, la circulación de su
gradiente en un circuito cerrado es
I
∇f · dr̄ =
I
df = 0
(91)
Ejemplo: Dado el campo vectorial
V̄ = (3x2 y + zy 2 )î + (x3 + 2xyz)ĵ + y 2 xk̂
(92)
a) demostrar que es irrotacional; b) encontrar la función escalar f de
la cual deriva y c) calcular su circulación entre los puntos A = (1, 2, 3) y
B = (2, 4, 12) a lo largo de la curva
x(t) = t
y(t) = 2t
z(t) = 3t2
(93)
a) Para demostrar que es irrotacional, basta con derivar y comprobar que
se cumplen las condiciones:
∂V1
∂V2
=
;
∂y
∂x
∂V1
∂V3
=
;
∂z
∂x
∂V2
∂V3
=
∂z
∂y
(94)
b) de V1 = 3x2 y + zy 2 = fx se sigue que ha de ser
f (x, y, z) = x3 y + zxy 2 + g(y, z)
(95)
Derivando respecto a y e igualando a V2 :
x3 + 2xyz +
∂g
= x3 + 2xyz
∂y
(96)
de donde se sigue que
∂g
=0
∂y
(97)
o
g = h(z) salvo constante. Luego f (x, y, z) = x3 y +zxy 2 +h(z). Derivando
respecto a z e igualando a V3 vemos que ha de ser h(z) = c, y como V̄ se
obtiene de f por derivación, esa constante no tiene importancia, ası́ que,
finalmente
16
f (x, y, z) = x3 y + zxy 2
(98)
c) En representación paramétrica, el punto A corresponde a t = 1 y el
punto B a t = 2. Entonces
Z
AB
V̄ · dr̄ =
Z
!
dy
dz
dx
+ V2 + V3
dt
V1
dt
dt
dt
t=2
t=1
(99)
Sustituyendo y efectuando las integrales, se obtiene el resultado
Z
4.3
V̄ · dr̄ = 402
AB
(100)
Integral de superficie
Se puede reformular ligeramente y adaptar al formato vectorial el concepto
de integral de superficie presentado en la sección 4. Si un elemento de superficie lo representamos no mediante un escalar sino mediante un vector cuyo
módulo es dS y cuya dirección es normal a la superficie (si la superficie es
cerrada, la normal se tomará hacia afuera):
dS̄ = n̂dS
(101)
Entonces redefinimos la integral de superficie como
Z
S
V̄ · dS̄ =
Z
V̄ · n̂dS =
S
Z
S
(V̄ · n̂)dS
(102)
y como el producto escalar es un escalar, la integral anterior es del tipo
escalar considerado antes, en (56)
4.4
Flujo y divergencia
Dado un elemento de superficie dS̄ que contiene un punto P en el cual el
campo vectorial toma un valor V̄ , se define el flujo del campo a través del
elemento de superficie como
dφ = V̄ · dS̄
(103)
A partir de aquı́, dada una superficie cerrada que encierra un cierto volumen y un punto P interior a ese volumen, se define la divergencia del campo
vectorial en el punto P como el
∆φ
∆v→0 ∆v
lim
17
(104)
es decir, la relación entre el flujo que atraviesa la superficie y el volumen contenido en la misma, cuando éste tiende a cero. Para dar con una
forma operativa de calcular la divergencia, consideramos un pequeño cubo
de lados dx, dy, dz paralelos a los ejes coordenados. Consideremos las caras
perpendiculares al eje x, una en x y otra en x + dx. La normal a la primera
cara es (−1, 0, 0), y la normal a la segunda cara es (1, 0, 0). El módulo de la
superficie de ambas caras en dydz. El campo en la primera cara es V̄ , y el
campo en la segunda:
∂ V̄
dx
(105)
∂x
El flujo total a través de ambas caras (flujo a través de la primera más
flujo a través de la segunda) es
V̄ +
∂V1
dxdydz
(106)
∂x
y análogamente para las caras paralelas a los ejes y y z, de tal forma que
el flujo total a través del cubo es
dφx =
dφ = dφx + dφy + dφz =
!
∂V1 ∂V2 ∂V3
+
+
dxdydz
∂x
∂y
∂z
(107)
y de la definición de divergencia, vemos que
div(V̄ ) =
∂V1 ∂V2 ∂V3
+
+
∂x
∂y
∂z
(108)
que se puede escribir simbólicamente usando el operador nabla:
div(V̄ ) = ∇ · V̄
(109)
∇ · (f Ū ) = ∇f · Ū + f ∇ · Ū
(110)
Ejemplo: si V̄ = x3 y î + y 3 z ĵ + z 2 k̂, entonces ∇ · V̄ = 3x2 y + 3y 2 z + 2z.
Obsérvese que la divergencia es un escalar. Cuando el campo vectorial es de la
forma f Ū , siendo f una función escalar, se comprueba por simple derivación
que
Ejemplo: Si V̄ = f (r)r̄, calcular la divergencia. Sabemos que el gradiente
de la parte escalar es (segundo ejemplo, 4.1)
∇f = f ′ (r)r̂
y que
18
(111)
∇ · r̄ = 3
ası́ que
(112)
∇ · (f (r)r̄) = rf ′ (r) + 3f (r)
(113)
2
2
Como caso particular de este caso particular: ∇ · (r r̄) = 5r .
4.5
Campos solenoidales
Un campo es solenoidal si su divergencia es nula en todo punto. Por ejemplo,
el campo V̄ = rn r̄ es solenoidal sólo para n = −3. En efecto:
∇ · V̄ = nrn + 3rn = (n + 3)rn
(114)
que es cero sólo para n = −3. ¿Qué implica que un campo sea solenoidal?
que el flujo a través de cualquier superficie cerrada es nulo, lo que significa,
a su vez, que las lı́neas de campo no tienen ni fuentes ni sumideros. Esto se
cumple para el campo eléctrico en regiones libres de cargas, y para el campo
magnético siempre.
Ejemplo: el campo V̄ = yz î + zxĵ + xy k̂ es a la vez irrotacional y
solenoidal. En efecto, por cálculo directo se ve que es irrotacional; por ejemplo:
∂
∂
(yz) =
(zx)
∂y
∂x
etc. Que es solenoidal se ve calculando la divergencia:
∇ · V̄ =
4.6
∂
∂
∂
(yz) +
(zx) + (xy) = 0
∂x
∂y
∂z
(115)
(116)
Teorema de la divergencia
El teorema de la divergencia afirma que si S es una superficie que encierra
un volumen V en el que está definido un campo vectorial Ū , entonces
Z
V
∇ · Ū dV =
Z
S
Ū · dS̄
(117)
Se puede dar de este teorema una demostración cualitativa. A tal efecto,
divı́dase mentalmente el volumen V en un número muy grande de pequeños
volúmenes adyacentes. El flujo a través de un elemento de superficie que separa dos volúmenes adyacentes es nulo, porque, sea cual sea en este elemento
19
el valor del campo, aparecerá una vez Ū · dS̄ y otra −Ū · dS̄ al considerar las
normales hacia el exterior de los dos pequeños volúmenes que comparten la
misma frontera dS̄. Por tanto, el flujo total interior al volumen es nulo, ya
que cualquier pequeño elemento es adyacente a otro, con el que comparte una
superficie de separación. Ası́ que sólo quedan sin compensar los elementos de
volumen limitados parcialmente por la superficie exterior S. De la definición
de la divergencia, vemos que la suma para el conjunto de todos los elementos
de volumen ha de ser igual al flujo neto total que atraviesa S.
Ejemplo: Calcular
Z
S
r̄ · dS̄
(118)
sobre una superficie cerrada. Solución: como
Z
S
r̄ · dS̄ =
Z
V
∇ · r̄dV
(119)
y ∇ · r̄ = 3, se sigue que la integral buscada es 3V .
Ejemplo: calcular,
Z
S
Ā · dS̄
(120)
donde S es la esfera centrada en el origen de radio R y Ā = x3 î+y 3 ĵ +z 3 k̂.
Solución: como ∇ · Ā = 3(x2 + y 2 + z 2 ):
Z
S
Ā · dS̄ = 3
Z
V
(x2 + y 2 + z 2 )dxdydz
(121)
Para calcular esta integral pasamos a coordenadas polares esféricas. El
jacobiano de la transformación es r2 sin θ, ası́ que la integral es
3
4.7
Z
2π
0
dφ
Z
π
0
dθ sin θ
Z
r
0
r4 dr =
12 5
πR
5
(122)
Identidades de Green
Hemos visto que, dado un campo vectorial de la forma V̄ = f Ū , su divergencia es
∇ · V̄ = (∇f ) · Ū + f ∇ · Ū
Cuando Ū es a su vez el gradiente de un campo escalar g:
20
(123)
∇ · V̄ = (∇f ) · (∇g) + f (∇ · ∇g)
(124)
Se escribe abreviadamente ∇ · ∇ = ∇2 , y se le llama operador laplaciano:
∇2 =
∂2
∂2
∂2
+
+
∂x2 ∂y 2 ∂z 2
(125)
ası́ que
∇ · V̄ = (∇f ) · (∇g) + f ∇2 g
(126)
y aplicando el teorema de la divergencia:
Z
V
∇ · V̄ dV =
Z
V
[(∇f ) · (∇g) + f ∇2 g]dV =
Z
S
f (∇g) · dS̄
(127)
que es la primera identidad de Green. Intercambiando f y g y restando
se obtiene la segunda identidad de Green:
Z
4.8
V
(f ∇2 g − g∇2 f )dV =
Z
S
[f (∇g) − g(∇f )] · dS̄
(128)
El rotacional
De forma similar a la divergencia, que se define como el lı́mite entre el flujo
que atraviesa una superficie cerrada y el volumen encerrado por la misma,
cuando éste tiende a cero, se define el rotacional en un punto P como un
vector en la dirección normal a una superficie dS que contiene a P cuyo
módulo es el lı́mite cuando dS → 0 entre la circulación sobre el contorno γ
de dS y la misma dS:
∆C
(129)
∆S→0 ∆S
Y al igual que con la divergencia, necesitamos aquı́ un procedimiento
de cálculo que no da la propia definición. Para ver cómo se expresan las
componentes del rotacional, vamos a considerar la componente k̂, para lo
cual consideramos un pequeño circuito en el plano xy que contiene el punto
P de coordenadas (x, y, 0). Las coordenadas de un punto del contorno se
expresan como r̄ = (x + x′ , y + y ′ , 0). En cuanto al campo en los puntos del
contorno, se puede desarrollar en serie de Taylor alrededor del punto P , y
escribir:
rot(Ū ) = lim
U1 (x + x′ , y + y ′ , 0) = U1 (x, y, 0) +
21
∂U1 ′ ∂U1 ′
x +
y
∂x
∂y
(130)
y de la misma forma
U2 (x + x′ , y + y ′ , 0) = U2 (x, y, 0) +
∂U2 ′ ∂U2 ′
x +
y
∂x
∂y
(131)
La circulación que buscamos es
Z
γ
Ū · dr̄ =
Z
γ
U1 (x + x′ , y + y ′ , 0)dx′ + U2 (x + x′ , y + y ′ , 0)dy ′
(132)
Insertando los desarrollos en serie de Taylor, y como las componentes del
campo y las derivadas pueden salir de las integrales, ya que se evalúan en P ,
quedan las integrales curvilı́neas siguientes:
Z
γ
Z
Z
γ
dx′ = 0
(133)
dy ′ = 0
(134)
1
x′ dx′ = x′2 |γ = 0
2
γ
(135)
1
y ′ dy ′ = y ′2 |γ = 0
2
γ
(136)
Z
y usando (49) y (50) que fueron encontradas en la demostración del teorema de Green,
Z
Z
γ
x′ dy ′ = ∆S
(137)
y ′ dx′ = −∆S
(138)
γ
Se tiene finalmente que
∆C
∂U1 ∂U2
=
−
(139)
∆S
∂y
∂x
Como el segundo miembro es una función de sólo las coordenadas del
punto P , al hacer el lı́mite ∆S → 0 se tiene el rotacional que es precisamente
ese segundo miembro. Análogamente para el resto de componentes, lo que
nos darı́a:
rot(Ū ) =
!
!
!
∂U2 ∂U3
∂U3 ∂U1
∂U1 ∂U2
−
−
−
k̂
î +
ĵ +
∂z
∂y
∂x
∂z
∂y
∂x
22
(140)
y recordando la definición del operador ∇, vemos que se puede poner
rot(Ū ) = ∇ × Ū
(141)
Se demuestran sin dificultad, de la definición del rotacional y las propiedades
de la derivación, los resultados siguientes:
a) Si Ū y V̄ son dos campos vectoriales, entonces el rotacional de Ū + V̄
es la suma de los rotacionales.
b) Si Ū es un campo vectorial y f una función escalar, entonces
∇ × (f Ū ) = (∇f ) × Ū + f ∇ × Ū
(142)
c) Para cualquier función escalar f ,
∇ × (∇f ) = 0̄
(143)
d) Para cualquier función vectorial Ū
∇ · (∇ × Ū ) = 0
4.9
(144)
Campos vectoriales irrotacionales
Si la circulación de un campo a lo largo de una trayectoria entre dos puntos
depende sólo de los extremos, entonces la circulación en cualquier trayectoria
cerrada es nula, y por la definición, el rotacional de ese campo será nulo.
Falta la demostración en el otro sentido: que cuando ∇ × Ū = 0̄, entonces
la circulación a lo largo de cualquier camino cerrado es cero. En efecto, si
∇ × Ū = 0̄, entonces
∂U1
∂U2
=
;
∂y
∂x
∂U1
∂U3
=
;
∂z
∂x
∂U2
∂U3
=
∂z
∂y
(145)
La trayectoria desde un punto (x0 , y0 , z0 ) a un punto (x, y, z) se puede
implementar de una infinidad de formas mediante segmentos paralelos a los
ejes de coordenadas. Sea una de estas trayectorias que transcurre en tres
tramos, el primero paralelo al eje x, desde (x0 , y0 , z0 ) hasta (x, y0 , z0 ). El
siguiente tramo será paralelo al eje y, desde (x, y0 , z0 ) a (x, y, z0 ). El último
paralelo al eje z, desde (x, y, z0 ) a (x, y, z). La circulación es entonces
Z
C
Ū · dr̄ =
Z
x
x0
U1 (x, y0 , z0 )dx +
Z
y
y0
U2 (x, y, z0 )dy +
Z
z
z0
U3 (x, y, z)dz (146)
Esta integral será una función de (x, y, z), que llamaremos f (x, y, z):
23
Z
De aquı́:
C
Ū · dr̄ = f (x, y, z)
(147)
∂f
= U3 (x, y, z)
∂z
Como z0 es constante en las otras dos integrales, tenemos:
∂f
∂y
Z z
∂U3
∂U2
dz = U2 (x, y, z0 ) +
dz
z0 ∂y
z0 ∂z
= U2 (x, y, z0 ) + U2 (x, y, z)|zz0 = U2 (x, y, z)
= U2 (x, y, z0 ) +
Z
(148)
z
(149)
Y de la misma forma
Z y
Z z
∂f
∂U2
= U1 (x, y0 , z0 ) +
dy +
∂x
y0 ∂x
z0
Z y
Z z
∂U1
= U1 (x, y0 , z0 ) +
dy +
y0 ∂y
z0
= U1 (x, y, z)
∂U3
dz
∂x
∂U1
dz
∂z
(150)
En definitiva,
∂f
= U1 (x, y, z);
∂x
∂f
= U2 (x, y, z);
∂y
∂f
= U3 (x, y, z)
∂z
(151)
y por tanto Ū = ∇f .
Resumiendo: definimos anteriormente los campos irrotacionales como
aquellos en que la circulación a lo largo de una trayectoria depende sólo
de los extremos. Demostramos que si un campo Ū es irrotacional, existe una
función escalar f tal que Ū = ∇f , y también que dada una función escalar
f , la circulación de su gradiente a lo largo de una trayectoria cerrada es nula.
A continuación hemos definido el rotacional de un campo vectorial, y hemos
encontrado la forma de calcularlo haciendo ∇ × Ū . Lo que acabamos ahora
de demostrar es que si ∇ × Ū = 0̄, entonces existe una función escalar tal
que Ū = ∇f , luego su circulación por cualquier trayectoria cerrada es nula,
luego Ū es irrotacional.
Ejemplo: Dado Ū = rα r̄, demostrar que es irrotacional. Será irrotacional
si su circulación a lo largo de una trayectoria depende sólo de los extremos,
y eso sucederá si existe un f tal que Ū = ∇f . Busquemos esa f . De entrada
24
∂f
= rα x;
∂x
∂f
= rα y;
∂y
∂f
= rα z
∂z
(152)
Por otro lado
x
∂r
= ;
∂x
r
∂r
y
= ;
∂y
r
∂r
z
=
∂z
r
(153)
y sustituyendo la última en la anterior:
∂f
∂r
= rα+1 ;
∂x
∂x
∂f
∂r
= rα+1 ;
∂y
∂y
∂f
∂r
= rα+1
∂z
∂z
(154)
A la vista de las ecuaciones anteriores, está claro que puede tomarse
1 α+2
r
α+2
siempre que sea α 6= −2. Pero si α = −2
f=
x
∂f
= 2
∂x
x + y2 + z2
(155)
(156)
y análogamente para las otras coordenadas. Se ve entonces que puede
tomarse
f = log
q
x2 + y 2 + z 2
(157)
Obsérvese lo siguiente: si hubiésemos fallado en la búsqueda de la función
f , eso no demostrarı́a que el campo no es irrotacional. Por eso, desde el
punto de vista lógico, parece mejor demostrar la irrotacionalidad simplemente
calculando el rotacional y comprobando que es nulo, ya que, como hemos
demostrado, el rotacional nulo implica campo irrotacional.
4.10
El teorema de Stokes
Daremos aquı́ una demostración cualitativa. Sea una superficie cualquiera
S que se apoya sobre una curva C. Si dividimos la superficie S en una
multitud de pequeños circuitos adyacentes, veremos que la cada segmento
de circuito compartido aparece dos veces, una con un signo y otra con otro,
y que por tanto la circulación total sobre todos los circuitos se reduce a la
circulación sobre C. Ahora, de la definición de rotacional, la circulación sobre
cada pequeño circuito es el producto del rotacional de Ū en cada circuito
(suponemos que los circuitos son muy pequeños y que podemos tomar el
rotacional como el rotacional en un punto interior al circuito) por el área del
25
circuito. Al sumar para todos los circuitos, tenemos la integral de superficie
del rotacional. Y esto es lo que afirma el teorema de Stokes:
Z
5
C
Ū · dr̄ =
Z
S
(∇ × Ū )dS̄
(158)
Bibliografı́a
Estas notas han seguido grosso modo el excelente texto de Kathleen M. Urwin, ”Cálculo Superior y Teorı́a del Vector Campo”, en traducción de Elena
Martı́n Peinador. También recomendamos ”Cálculo diferencial e integral”,
de N. Piskunov, ed. Montaner y Simón. Ambos contienen multitud de ejemplos ilustrativos, de los que hemos tomado unos pocos.
6
Resumen conceptual
1. Integrales de camino. La integral de camino en forma paramétrica.
Trabajo
2. Condición para que la integral de camino sea independiente de la trayectoria elegida.
3. Integrales dobles y cambio de variable.
4. El teorema de Green.
5. Campo escalar. Gradiente.
6. Campo vectorial. Definición de campo irrotacional. Si un campo Ū es
irrotacional, entonces existe una función escalar f tal que Ū = ∇ · f .
Si f es una función escalar, entonces ∇ · f es irrotacional.
7. Flujo y divergencia. Campos solenoidales.
8. Teorema de la divergencia e identidades de Green.
9. El rotacional. Si ∇ × Ū = 0̄, entonces el campo es irrotacional, y a la
inversa.
10. Teorema de Stokes.
26
7
Ejercicios
1. Calcular
Z
(x2 + y)dx + xydy
(159)
a lo largo del camino AD formado por las rectas AB, BC y CD, con
A = (0, 0), B = (2, 2), C = (2, 6), D = (3, 9). (Solución: 661/6)
2. Demostrar que la integral
Z
(y 2 + 4)dx + (2xy + 3)dy
(160)
es independiente del camino de integración, y calcular su valor entre
A = (1, 2) y B = (3, 4). (Solución: 58)
3. Calcular
∇(f (r) + g(1/r))
(161)
donde f y g son funciones arbitrarias y r2 = x2 + y 2 + z 2 .
4. Calcular la divergencia del campo vectorial
f¯ = rn g(1/r)r̄
(162)
5. Si ā es un vector constante, demostrar que
∇ × (ā × r̄) = 2ā
27
(163)
II
Leyes básicas del electromagnetismo
1
Campos
Es un hecho experimental que la materia puede modificar el espacio circundante, incluso a largas distancias, confiriéndole alguna propiedad que se
manifiesta por la aparición de fuerzas. Por ejemplo, una masa crea unas
condiciones tales que aparecen fuerzas sobre otras masas cercanas, o incluso
muy lejanas. Como la forma de manifiestarse esta propiedad que la materia
confiere al espacio es mediante fuerzas, que son vectoriales, podemos representar la alteración introducida mediante un campo vectorial Ē(x, y, z). Es
también un hecho experimental que hay campos de distintas clases. Tenemos la gravedad, el campo eléctrico y el magnético, y otros campos que se
manifiestan a cortas distancias. Cada campo está asociado a una propiedad
distinta de la materia. Ası́, el campo de gravedad a la masa y el campo eléctrico a la carga. Nos centraremos desde este momento en el campo eléctrico.
2
Campo eléctrico
Una carga q, que colocamos en el origen de un sistema de referencia, crea en
la posición r̄ un campo, de forma que una carga q ′ influida por ese campo
experimenta una fuerza F̄ = q ′ Ē. Se comprueba experimentalmente que
el campo creado por la carga q es proporcional a la misma, inversamente
proporcional al cuadrado de la distancia al punto considerado y dirigido
según la recta que la une con el punto. Cuantitativamente:
Ē =
q r̄
4πε0 r3
(1)
En el S.I. de unidades:
1
N m2
= 9 × 109 2
4πε0
C
(2)
La fuerza que experimenta una carga q ′ situada en r̄ respecto a q es
F̄ =
qq ′ r̄
4πε0 r3
(3)
Vemos que cuando qq ′ > 0 la fuerza es repulsiva, y que cuando qq ′ < 0 es
atractiva.
28
Otro hecho experimental es que los campos debidos a varias cargas se
suman vectorialmente, de modo que, dada una serie de cargas qi en posiciones
r̄i , el campo creado en un punto r̄ viene dado por
Ē(r̄) =
qi (r̄ − r̄i )
4πε0 |r̄ − r̄i |3
X
i
(4)
Si en lugar de un conjunto de cargas puntuales tenemos una distribución
continua, entonces calcularemos el campo como una integral sobre la distribución continua, descrita por la densidad lineal, superficial o volúmica de
carga.
Ejemplo: Dada una distribución lineal continua de longitud infinita a lo
largo del eje z y densidad lineal λ, calcular el campo en un punto del eje x a
distancia d del eje z.
Solución: un elemento de carga situado en la coordenada z y de longitud
dz contiene una carga λdz, y crea un campo
dĒ =
λdzr̄
4πε0 r3
(5)
con r3 = (d2 + z 2 )3/2 y r̄ = (d, 0, −z). Por tanto, no hay campo en la
dirección y. En la dirección x:
dEx =
λd
dz
2
4πε0 (d + z 2 )3/2
(6)
y
λ
dz
λd Z ∞
=
Ex =
4πε0 −∞ (d2 + z 2 )3/2
2πε0 d
(7)
Por simetrı́a, ya se ve que Ez = 0, pero se puede comprobar por integración.
2.1
Propiedades del campo eléctrico
El campo creado por una carga q en r̄ (tomándola como origen) es:
q r̄
(8)
4πε0 r3
Este campo es irrotacional. Para verlo podemos aplicar I.153 y siguientes,
o bien calcular directamente:
Ē =
∇ × Ē =
1 ∇(r−3 ) × r̄ + r−3 ∇ × r̄
4πε0
29
(9)
Pero ∇ × r̄ = 0 y ∇r−3 = −3r−5 r̄, de donde se sigue ∇ × Ē = 0̄.
Demostramos en I.4.9 que si ∇ × Ū = 0̄ entonces Ū es irrotacional, es decir,
existe una función escalar f tal que Ū = ∇f . En nuestro caso, tomando
I.156 con α = −3:
f =−
q 1
4πε0 r
(10)
Por otra parte, en I.114 vimos que para Ū = f (r)r̄, la divergencia es
∇ · Ū = rf ′ (r) + 3f (r)
(11)
∇2 f = 0
(12)
que en nuestro caso da ∇ · Ē = 0. Pero como E = ∇f , se sigue que el
potencial satisface la ecuación de Laplace:
Nota: aunque no hay razón matemática para ello, en Fı́sica se suele tomar
el potencial de forma que el campo sea no el gradiente del potencial, sino
menos dicho gradiente: Ū = −∇f . De acuerdo con ello, y para no introducir
divergencias que hagan molesta la comparación de estas notas con los textos
habituales, adoptamos aquı́ también esa convención, y en consecuencia el
potencial lo tomamos no como fue definido en (10), sino como
f=
2.2
1 q
4πε0 r
(13)
Regiones que contienen cargas
Los razonamientos anteriores presuponen que el campo se puede calcular en
todo punto, pero precisamente en r = 0 existe una singularidad, de manera
que los resultados anteriores serán válidos para regiones libres de cargas, en
que el campo se puede calcular y por tanto su divergencia y rotacional, pero
no para regiones que contienen cargas, pues en los puntos ocupados por esas
cargas el campo es singular.
Consideremos una carga q situada en el origen, y una esfera de radio a
centrada en el mismo. Calculamos el flujo a través de la esfera:
1 q
q Z
q
ā
·
d
S̄
=
(14)
r̂ · r̂dS =
3
2
4πε0 a S
ε0
S 4πε0 a
Esto significa que una carga positiva se comporta como una fuente de
lı́neas de campo, y una carga negativa como un sumidero. Si ahora consideramos que tenemos no una carga puntual sino una distribución continua de
densidad ρ en un pequeño volumen ∆v, entonces
Z
30
ρ
1 Z
(15)
Ē · dS̄ =
∆v S
ε0
pero la parte de la izquierda es precisamente la definición de la divergencia, luego
∇ · Ē =
ρ
ε0
(16)
Además, como Ē = ∇f ,
ρ
ε0
que es conocida como ecuación de Poisson. La expresión
∇2 f =
(17)
Z
(18)
S
Ē · dS̄
es útil en algunos casos en que se dan simetrı́as evidentes. Por ejemplo,
calculamos el campo a una distancia d de un hilo infinito de densidad lineal
de carga λ. Por simetrı́a, el campo ha de ser radial y valer lo mismo en todo
punto de un cilindro de radio d cuyo eje coincida con la distribución de carga.
Tomando la superficie de un cilindro de altura h y radio d cuyo eje coincida
con el de la distribución, al ser el campo radial no existe flujo más que a
través de la superficie curva del cilindro, de manera que
Z
S
Ē · dS̄ = 2πdhE =
λh
ε0
(19)
y de aquı́
λ
(20)
2πε0 d
que coincide con (7), pero que hemos obtenido de forma mucho más directa.
E=
2.3
El campo eléctrico en la materia
Es un hecho experimental que la materia está constituida por partı́culas
cargadas, de carga positiva y negativa (y también de partı́culas sin carga,
que no juegan papel en nuestra discusión). Cuando una substancia se expone
a un campo, las partı́culas cargadas de la substancia experimentan fuerzas
que son de un sentido u otro según la carga positiva o negativa, y como
consecuencia aparece una cierta separación de carga: las cargas positivas
tienden a desplazarse en un sentido y las negativas en otro opuesto. Aparece
31
entonces un campo interno debido a esta separación que se superpone con el
campo exterior aplicado, dando lugar a un campo neto:
Ē = Ēext + Ēint
(21)
La magnitud y dirección del campo interno depende de cada substancia
en particular, ası́ como de su forma geométrica. Hay dos situaciones que
pueden presentarse, según que las partı́culas cargadas en el interior de la
substancia se encuentren libres o no. A las substancias del primer tipo se las
llama ”conductores”; a las del segundo, ”dieléctricos”.
A) Conductores. Puesto que en los conductores las cargas se pueden
mover libremente, una situación de equilibrio implica la no existencia de
corrientes, luego el campo en el interior es nulo, luego, aplicado un campo
externo, las cargas libres se reorganizan sobre la superficie del conductor,
dando lugar a un campo Ēint que superpuesto al campo aplicado dan un
campo total nulo. Otra forma de expresar esto es diciendo que en el interior
del conductor el potencial es constante.
Es posible usar el mismo razonamiento que conduce a (20) para encontrar el campo en puntos próximos a la superficie del conductor. Para ello
consideramos un cilindro cerrado cuya base es paralela a la superficie y se
encuentran justo bajo la misma. El otro extremo del cilindro se encuentra
justo sobre la superficie. La altura del cilindro es muy pequeña. Ahora bien,
el campo ha de ser perpendicular a la superficie. Si no lo fuera, existirı́a
una componente tangencial y habrı́a corrientes superficiales, en contra de
la hipótesis de equilibrio. Por tanto, el flujo que atraviese el cilindro ha de
pasar a través de las dos circunferencias. Pero el flujo a través de la base es
nulo, porque el campo en el interior el conductor es nulo, ası́ que sólo queda
el flujo a través de la parte superior. Por tanto:
E∆S =
σ∆S
ε0
(22)
es decir:
Ē =
σ
n̂
ε0
(23)
Puede dar la impresión de que Ē es debido sólo a la densidad σ, pero
esto no es ası́: Ē es debido al sistema total de cargas, a consecuencia del
cual hay en el punto considerado una densidad superficial; de hecho, en
nuestro razonamiento hemos considerado que el flujo en la cara inferior es
nulo, aunque el debido sólo a la carga superficial no lo es. Entonces, hemos
32
considerado el campo total. Y sin embargo, este campo total se expresa en
función sólo de la carga superficial. Esta es una propiedad muy notable.
Al considerar ahora el campo externo Ēext , un elemento ∆S de superficie
se verá sometido a una fuerza
F̄S = σ∆S Ēext
(24)
¿Cuánto vale Ēext ? En el razonamiento anterior calculamos el campo
total. Pero si calculamos el campo debido sólo a la densidad superficial σ,
entonces hemos de considerar el flujo a través de las dos caras del cilindro, y
obtenemos un campo que es exactamente la mitad. Por tanto, si conocemos
el campo debido a la carga superficial y el campo total, y el primero es la
mitad del segundo, está claro que el campo exterior serı́a la otra mitad del
campo total:
1σ
n̂
(25)
2 ε0
y la fuerza sobre la unidad de superficie se calcula entonces fácilmente
como
Ēext =
1 σ2
1
F̄S
=
n̂ = ε0 E 2 n̂
f¯S =
∆S
2 ε0
2
(26)
B) Dieléctricos. En los dieléctricos, la movilidad de las cargas es limitada, y por tanto la separación inducida por un campo externo también lo
es. Aunque en lo posible queremos mantenernos en el campo macroscópico,
consideraremos en relación con los dieléctricos en primer lugar un modelo
de dipolo. Un dipolo es un conjunto de dos cargas de signo opuesto y valor
q separadas por una distancia l. Colocamos la carga negativa en el origen
del sistema de referencia, y la carga positiva sobre el eje y, a distancia l del
origen. Como el problema tiene simetrı́a axial nos podemos limitar a calcular
el campo creado por el dipolo en un punto P = (x, y) del plano. El potencial
creado por el conjunto de las dos cargas es
f=
1 q(r− − r+ )
4πε0 r− r+
(27)
donde r̄− = (x, y) y r̄+ = (x, y − l). Es una pura cuestión algebraica
escribir los módulo de ambos vectores, sustituirlos en la ecuación del potencial
y obtener ası́ f (x, y), y a partir de ahı́ el campo eléctrico creado por el dipolo
Ē(x, y). En el proceso, que vamos a omitir aquı́, se puede suponer que P es
un punto muy alejado del dipolo, de tal forma que r+ , r− >> l. También,
33
dada la simetrı́a del problema, se puede introducir el ángulo θ que forma la
dirección desde el origen del punto P con el eje y. El resultado de los cálculos
es que
1 p cos θ
1 p̄ · r̄
=
(28)
2
4πε0 r
4πε0 r3
donde p̄ es un vector de módulo ql y que va desde la carga negativa a la
positiva. Las proyecciones del campo eléctrico Ē = −∇f sobre la dirección
radial y la dirección perpendicular a la misma son
f=
1 2p cos θ
4πε0 r3
1 p sin θ
=
4πε0 r3
Er =
Eθ
(29)
Se ve que cuando un dipolo se introduce en un campo uniforme, la fuerza
que actúa sobre él es
F̄ = q Ē − q Ē = 0̄
(30)
F̄ = q(Ē+ − Ē− )
(31)
Sólo cuando el dipolo está sometido a un campo no uniforme, de manera
que la fuerza sobre cada carga es distinta, existe una fuerza neta sobre el
dipolo:
Por otro lado, el trabajo realizado por el campo para llevar a una carga
q desde la posición 1 a la posición 2 es
Z
2
1
q Ē · dr̄ = −q
Z
1
2
(∇f ) · dr̄ = q(f1 − f2 )
(32)
Si se toma convencionalmente el punto final como ∞, al trabajo realizado
se le llama ”energı́a potencial”. Véase que f (r = ∞) = 0, ası́ que la energı́a
potencial de una carga en un punto r es W = qf (r). La energı́a potencial
del dipolo es entonces
W = q(f+ − f− )
(33)
W = q(∇f )l · ˆl = −qlˆl · Ē = −p̄ · Ē
(34)
pero f+ − f− es la variación de f al movernos en la dirección del vector
p̄ una distancia l. El cambio en una función escalar al movernos en una
dirección dada quedó establecido en la fórmula I.75, de forma que:
34
La idea subyacente a la discusión anterior es que en un dieléctrico sometido
a un campo, las cargas positivas y negativas de las moléculas se separan un
poco (no mucho, porque las cargas no son libres y porque el campo interno
de las moléculas es mucho más intenso que el campo externo) y se comportan como dipolos. Si las distribuciones de densidad de cargas positivas
y negativas, ρ+ y ρ− son constantes, la separación conducirá a cargas sin
compensar sólo en la superficie del dieléctrico. Si las densidades no son constantes, entonces aparecerán cargas sin compensar en todo el volumen. Estas
separaciones microscópicas nos permiten definir un vector polarización por
unidad de volumen de la siguiente forma: aislamos mentalmente un pequeño
volumen ∆v, calculamos la suma vectorial de todos los momentos dipolares
p̄i de cada molécula y dividimos por el volumen. Ası́, se define el momento
dipolar por unidad de volumen como
P̄ =
1 X
p̄i
∆v i
(35)
Se ha comprobado experimentalmente para un gran número de dieléctricos
que la polarización varı́a linealmente con el campo aplicado. Se escribe:
P̄ = χε0 Ē
(36)
donde a χ se le llama ”susceptibilidad dieléctrica”, y es siempre mayor
que cero.
2.4
Propiedad del vector P̄
Como hemos dicho, en un dieléctrico existen densidades de cargas positivas
y negativas, ρ+ y ρ− , y cuando se aplica un campo externo, se produce una
separación entre ambas. Si estas densidades no son constantes, en cada punto
resultará un exceso de densidad de carga ρ′ = ρ+ − ρ− . Pues bien, el vector
P̄ cumple la siguiente importante propiedad:
∇ · P̄ = −ρ′
(37)
Demostración: Sea un elemento de volumen del dieléctrico limitado por
una superficie S, y sea dS un elemento de dicha superficie. Al aplicar el
campo, que suponemos dirigido en una dirección cualquiera hacia el exterior
del volumen, la carga positiva experimenta un desplazamiento l+ y la negativa
un desplazamiento l− . Si α es el ángulo que forma el campo aplicado y por
tanto el desplazamiento con la normal a la superficie, en dirección saliente
atraviesa ésta una cantidad de carga ρ′+ l+ cos αdS, y en dirección entrante
ρ′− l− cos αdS. Pero el movimiento de una cantidad de carga negativa hacia el
35
interior del volumen equivale a un desplazamiento de una igual cantidad de
carga positiva en sentido contrario, ası́ que se puede poner como flujo total:
ρ′+ (l+ + l− ) cos αdS y esto se puede poner como P̄ · dS̄. La cantidad de carga
que abandona S se obtiene integrando a todo el volumen, y debe ser igual
al exceso de carga en el interior del volumen, con signo contrario, de manera
que
Z
S
P̄ · dS̄ = −
Z
V
ρ′ dV = −q ′
(38)
y aplicando el teorema de la divergencia, se tiene en forma diferencial
∇ · P̄ = −ρ′
(39)
Todavı́a hay una relación entre el exceso de carga ρ′ inducida por el campo
aplicado y la densidad de carga ρ de otro tipo que pueda estar presente. En
efecto, para dieléctricos homogéneos se cumple (36), es decir
χ
Z
S
ε0 Ē · dS̄ = −q ′
(40)
pero la integral es justamente la carga total contenida en el volumen
encerrado por S, como muestra (16), luego
χ(q + q ′ ) = −q ′ ;
2.5
q′ = −
χ
q
1+χ
(41)
El vector D̄
De vuelta a (16), pero distinguiendo la carga total entre carga de exceso por
polarización y ”otras cargas”, escribimos:
Z
S
ε0 Ē · dS̄ = q + q ′
(42)
El problema con esta expresión es que q ′ depende de Ē pero a su vez Ē
depende de q ′ . Sin embargo, como q ′ se puede escribir en función de P̄ :
Z
S
(ε0 Ē + P̄ )dS̄ = q
(43)
Introducimos el vector auxiliar D̄ y escribimos, en forma diferencial,
∇ · D̄ = ρ
(44)
Para un dieléctrico homogéneo:
D̄ = ε0 Ē + P̄ = ε0 Ē + χε0 Ē = ε0 εĒ
36
(45)
con ε = 1 + χ. Un comentario pertinente a propósito de (44) es que dicha
ecuación nos indica que las fuentes de D̄ son sólo las cargas distintas de las de
polarización. Luego las lı́neas del campo D̄ tienen sus fuentes y sumideros en
las cargas distintas de las de polarización. Ahora bien, esto no significa que
el campo D̄ esté determinado sólo por este tipo de cargas: está determinado
por todas las cargas, al igual que Ē, con el que está relacionado por (45).
(44) expresa una propiedad de D̄, pero no dice cómo calcularlo.
2.6
Condiciones de contorno
Supongamos dos dieléctricos 1 y 2 separados por una interfaz donde, para
mayor generalidad, admitimos la existencia de una densidad de cargas libres
σ. Las propiedades de Ē y D̄:
Z
Z
C
Ē · d¯l = 0
(46)
S
D̄ · dS̄ = q
(47)
nos permiten encontrar condiciones que cumplen ambos al pasar del medio
1 al 2. Apliquemos la primera considerando un pequeño circuito rectangular
que comienza con un primer tramo d¯l1 en el medio 1, paralelo a la superficie;
después, cruza la superficie y hace el camino de vuelta por el otro lado,
recorriendo un d¯l2 = −d¯l1 . Finalmente, cruza de nuevo la superficie de
separación y vuelve al punto de partida. Si los tramos donde se cruza la
interfaz son despreciables frente a los que van paralelos a ella, y si estos
son a su vez tan pequeños que a lo largo de los mismos el campo se puede
considerar constante, es claro que la circulación de Ē en ese circuito se puede
escribir:
Ē1 · d¯l1 + Ē2 · d¯l2 = 0
(48)
(Ē1 − Ē2 ) · d¯l1 = 0
(49)
o
Es decir, que las proyecciones de Ē tangenciales a la superficie de separación son iguales a ambos lados:
E1t = E2t
(50)
En general, las componentes normales no serán iguales, ya que el mismo
campo aplicado crea polarizaciones distintas en 1 y 2 y por tanto campos de
37
polarización distintos que se superponen al campo aplicado para dar campos
totales distintos. En cuando a D̄, tomando un cilindro de altura despreciables
y caras paralelas a la interfaz, con una a cada lado, la ecuación (47) nos dice
que
¯ 1 + D̄2 · ∆S
¯ 2 = σ∆S
D̄1 · ∆S
(51)
(D̄1 − D̄2 ) · n̂∆S = σ∆S
(52)
¯ 2 = −∆S
¯ 1:
o, como ∆S
y se sigue que las componentes normales de D̄ cumplen:
D1n − D2n = σ
(53)
Una consecuencia de esto es que las lı́neas del campo eléctrico Ē sufren
una refracción al pasar de un dieléctrico a otro. En efecto, si α1 es el ángulo
que forma Ē con la normal a la superficie por el lado del dieléctrico 1 y α2
el ángulo por el lado del dieléctrico 2, teniendo en cuenta que D̄ = ε0 εĒ,
poniendo D̄1 = ε1 Ē1 y D̄2 = ε2 Ē2 , y teniendo en cuenta también que en
ausencia de cargas libres D1n = D2n :
E1t
E1n
con expresión similar para α2 , de donde
tan α1 =
(54)
ε1
tan α1
=
(55)
tan α2
ε2
Por otro lado, si la interfaz separa un conductor de un dieléctrico, sabemos
que el campo Ē en el interior del conductor es nulo, y por tanto también lo
es D̄. Si el medio 2 es el conductor, la ecuación (53) nos dice que Dn = σ.
Finalmente, consideremos el caso en que se ponen en contacto un conductor cargado con una carga superficial σ con un dieléctrico. Si el dieléctrico
es homogéneo, aparecerá una carga de polarización superficial σ ′ . De
q
(56)
ε0
S
tomando un pequeño cilindro de altura despreciable y caras paralelas a
la interfaz, una a cada lado, se sigue:
Z
Ē · dS̄ =
En =
σ + σ′
ε0
y como al mismo tiempo
38
(57)
En =
Dn
εε0
(58)
combinando ambas:
ε−1
σ
(59)
ε
y esto nos dice que hay una relación definida entre la densidad de cargas
de polarización y la densidad de cargas libres. Este resultado tiene más
importancia de la que parece. Veamos por qué.
Hemos dicho que el campo total Ē en el interior de un dieléctrico es
difı́cil de calcular, porque depende de las cargas de polarización, que a su vez
dependen del campo que hay que calcular. También hemos dicho que cuando
las densidades de carga ρ+ y ρ− en un dieléctrico son constantes, entonces el
exceso de carga de polarización aparece sólo en la superficie del dieléctrico.
Pues bien: consideremos la situación en que tenemos una serie de conductores
cargados en el espacio vacı́o que crean un campo Ē0 . Cuando ese espacio se
rellena completamente con un dieléctrico homogéneo, en las superficies de
contacto entre conductores y dieléctrico aparecen cargas superficiales σ ′ , de
tal forma que la densidad superficial en cada punto pasa de σ a σ + σ ′ = σ/ε.
Como esta relación es válida en cada punto de cada superficie, quiere decir
que no se altera la configuración de Ē0 , sino sólo su magnitud:
σ′ = −
1
Ē = Ē0
(60)
ε
Multiplicando por εε0 ambos lados, se sigue que D̄ = D̄0 . Además,
podemos calcular el campo de polarización. Combinando Ē = Ē ′ + Ē0 , que
P̄ = χε0 Ē y que Ē0 = εĒ, se sigue que
Ē ′ =
1−ε
1
P̄ = − P̄
χε0
ε0
(61)
Además, como el campo se reduce por la introducción del dieléctrico
(Ē = Ē0 /ε), y dicho campo deriva de un potencial f , se sigue también que
f = f0 /ε, e igualmente para las diferencias de potencial.
2.7
Energı́a del campo eléctrico
Consideremos dos cargas iguales aisladas interaccionando sólo entre ellas.
Como consecuencia de las fuerzas mutuas que ejercen la una sobre la otra
sufren desplazamientos dr̄1 y dr̄2 , luego se realiza un trabajo
39
δA = F̄1 · dr̄1 + F̄2 · dr̄2 = F̄1 dr̄
(62)
donde r̄ = r̄1 − r̄2 es la posición relativa de la carga 1 en un sistema fijo en
la carga 2. Por tanto: el trabajo realizado por las dos fuerzas de interacción
entre dos cargas es igual al realizado por la fuerza que actúa sobre una de las
cargas en un sistema de referencia fijo en la otra. Como la fuerza eléctrica
deriva de un potencial f :
δA12 = −dW12
(63)
donde W12 depende sólo de la distancia entre las cargas 1 y 2. Este resultado se puede generalizar a un conjunto arbitrario de cargas. Por ejemplo,
para tres cargas:
W = W12 + W13 + W23
(64)
que se puede poner como
1
1
1
W = (W12 + W21 ) + (W13 + W31 ) + (W23 + W32 )
2
2
2
que se puede reorganizar ası́:
1
1
1
W = (W12 + W13 ) + (W21 + W23 ) + (W31 + W32 )
2
2
2
y finalmente escribir como
W =
1X
Wi
2 i
(65)
(66)
(67)
donde Wi es la energı́a de interacción de la carga i con el resto de cargas.
Es obvio que este razonamiento no depende de que sea i = 3 y por tanto es
válido para cualquier número de cargas. Como, además, Wi = qi fi , ecuación
(32), queda finalmente
W =
1X
qi f i
2 i
(68)
donde fi es el potencial creado en la posición de qi por el resto de cargas.
Ejemplo: encontrar la energı́a de interacción de un sistema de cuatro
cargas iguales q situadas en los vértices de un tetraedro regular de lado
a. Solución: sobre cada carga actúan las otras tres, creando un potencial
conjunto que es tres veces el que crearı́a una sola, ya que están las tres a la
misma distancia de la cuarta. Este potencial conjunto es
40
1 3q
4πε0 a
La energı́a total de interacción será
(69)
1
3q 2
1 6q 2
×4×
=
2
4πε0 a
4πε0 a
En el caso de una distribución continua de carga, la energı́a es
(70)
1Z
W =
ρf dV
(71)
2 V
Sin embargo, se ha de tener presente que esta expresión difiere cualitativamente de la expresión para el caso discreto. Y es que, dados dos cuerpos
continuos cargados, W no es simplemente la energı́a de interacción entre ellos,
porque para cada carga elemental ρdV de un cuerpo es preciso considerar el
potencial de todos los elementos del otro cuerpo, pero también el potencial de
todos los elementos del mismo cuerpo. Es decir, que para un cuerpo cargado
aislado, todavı́a será W 6= 0 debido a la interacción entre sus propias partes.
La ecuación (71) puede ponerse en una forma interesante. En efecto
1Z
1Z
ρf dV =
(∇ · D̄)f dV
(72)
W =
2 V
2 V
pero (∇ · D̄)f = ∇ · (f D̄) + Ē · D̄. Transformamos ahora la integral de
volumen del primer término del segundo miembro:
Z
V
∇ · (f D̄)dV =
Z
S
f D̄ · dS̄
(73)
S puede ser cualquier superficie arbitraria con tal de que encierre al sistema de cargas. Si hacemos esa superficie más y más grande, ella crece como
r2 , pero f D decrece como r−3 , ası́ que la primera integral tiende a cero y
sólo queda la segunda, pudiendo escribirse
1Z
Ē · D̄dV
2 V
que es una expresión que contiene sólo los campos, no las cargas.
W =
2.8
(74)
Corriente
Cuando se aplica un campo a un conductor, se produce movimiento en las
cargas. La carga puede ser transportada por electrones o iones, en conductores metálicos, electrolitos, etc. Aquı́ nos restringimos al movimiento de
electrones en conductores metálicos. Si S es una superficie cualquiera en el
41
interior de un conductor al que se aplica un campo, se define la intensidad a
través de esa superficie como la carga que la atraviesa por unidad de tiempo:
dq
(75)
dt
Esta carga que atraviesa S en la unidad de tiempo depende de dos factores: de la densidad de carga ρ y de la velocidad media ū a la que se muevan
las cargas. Se define entonces el vector densidad de corriente como
i=
j̄ = ρū
(76)
El flujo a través de S en términos de j̄ se puede poner entonces como
dq
(77)
dt
S
donde el signo ’-’ proviene de que la normal a S, si es una superficie
cerrada, se toma convencionalmente hacia afuera. Entonces, el flujo de j̄ es
la carga que abandona el volumen encerrado por S. Aplicando el teorema
de la divergencia podemos escribir la ley diferencial para la densidad de
corriente:
i=
Z
j̄ · dS̄ = −
∂ρ
(78)
∂t
que se conoce como ”ecuación de continuidad”.
La ley de Ohm es un resultado experimental que afirma que, cuando se
establece una diferencia de potencial U entre los extremos de un conductor,
la intensidad que circula es
∇ · j̄ = −
i = U/R
(79)
donde R es una constante que depende tanto del material conductor como
de su geometrı́a. Por ejemplo, cuando el conductor tiene forma de cable de
longitud l y sección s:
l
(80)
s
A la constante ρ se le llama resistividad, y depende del material conductor
y de su temperatura 1 .
R=ρ
1
Usamos la misma letra, ρ con la que nos hemos referido a la densidad de carga, primero
porque la resistividad se ha designado tradicionalmente con esta letra, y segundo porque
con este significado sólo la empleamos en esta parte y en un contexto en que no hay peligro
de confusión con otras partes del texto en que representa una densidad de carga.
42
Si aislamos mentalmente un cilindro de sección dS y longitud d¯l cuyo eje
es paralelo a j̄ y a Ē, combinando las dos ecuaciones anteriores:
dl
(81)
dS
y simplificando queda j = σE, donde a σ = 1/ρ se le llama ”conductividad” 2 . En forma vectorial:
jdS = Edl/ρ
j̄ = σ Ē
(82)
Esta es conocida como ”forma diferencial” de la ley de Ohm, no porque
contenga diferenciales, sino porque es local: válida para cada punto del conductor. Ahora bien, es evidente que las fuerzas electrostáticas por sı́ mismas sólo pueden dar lugar a una corriente transitoria, ya que la energı́a de
cualquier sistema de cargas es una cantidad limitada al valor dado por (68).
Por tanto, es preciso que existan otras fuerzas de naturaleza distinta que
llamaremos Ē ⋆ . Entonces, reescribimos (82) como
j̄ = σ(Ē + Ē ⋆ )
(83)
Podemos integrar esta expresión entre dos puntos de un conductor rectilı́neo. Si el conductor es delgado, podemos considerar a j̄ paralelo a d¯l:
Z 2
j̄ ¯ Z 2
· dl =
Ē · d¯l +
Ē ⋆ · d¯l
(84)
1 σ
1
1
Pero la primera integral es Ri mientras que el primer término del segundo
miembro es f2 − f1 . Al segundo término del segundo miembro le llamamos
”fuerza electro-motriz”, o abreviadamente ”fem”, designándola mediante E:
Z
2
E12 =
Z
2
1
Ē ⋆ · d¯l
(85)
Ası́ que tenemos la generalización de la ley de Ohm:
Ri = f1 − f2 + E12
(86)
Esta es la ecuación básica que permite resolver circuitos de corriente continua. En particular, las reglas de Kirchoff permiten plantear un sistema de
ecuaciones en las intensidades que circulan por las diferentes ramas de un
circuito. No entraremos en esta materia.
2
Vale la misma observación para σ que hemos hecho en la nota anterior para ρ.
43
3
Campo magnético
Desde antiguo son conocidos los imanes y las substancias magnéticas, y el hecho de que aparecen fuerzas entre ellas o entre ellas y algunos metales. Más
recientemente se descubrió la interacción entre los imanes y las corrientes
eléctricas, o entre corrientes eléctricas. Todos estos experimentos permitieron
formular la existencia de un tipo de interacción distinta a la electrostática y
que actúa también sobre las cargas. Aunque la razón profunda de estas interacciones es relativista, las propiedades del campo magnético son conocidas
con anterioridad a la formulación de la teorı́a de la relatividad, a partir de
experimentos, ası́ que podemos partir de estos experimentos en la exposición
que sigue.
3.1
Fuerza de Lorentz
Se comprueba que existe una fuerza que afecta a las cargas en movimiento,
de forma que la fuerza total sobre una carga podrá descomponerse en una
parte eléctrica y una parte magnética. Esta ley de fuerza es
F̄ = q[Ē + v̄ × B̄]
(87)
y como puede verse: a) depende de la velocidad y b) es perpendicular
a la misma, lo cual significa que el campo magnético, que representaremos
por B̄, no realiza trabajo sobre la carga. Pero la velocidad v̄ dependerá del
sistema de referencia en que se mida, ası́ que distintos sistemas de referencia
medirán distintos valores de la fuerza magnética.
La otra parte de la cuestión es que cargas en movimiento crean campos
magnéticos. Es decir: una carga en movimiento crea un campo magnético,
que ella misma no experimenta, y a su vez una carga que se mueve en un
campo magnético, creado por otras cargas en movimiento, experimenta una
fuerza. El campo magnético creado por una carga en un punto r̄ es
µ0 q v̄ × r̄
(88)
4π r3
Esto significa que el campo magnético decrece con el cuadrado de la
distancia, y que es siempre perpendicular al plano en que se mueve la carga.
En el S.I. de unidades:
B̄ =
µ0
= 10−7 H/m
(89)
4π
A B̄ se le llama ”inducción magnética” y se mide en Teslas. Recordando
la ley de Coulomb (1):
44
B̄ = µ0 ε0 [v̄ × Ē]
(90)
y como µ0 ε0 es una cantidad muy pequeña, se ve que a velocidades ordinarias B << E. La razón por la cual el campo magnético se hace evidente es
porque en general la materia es eléctricamente neutra, de forma que, aunque
pequeña, la fuerza magnética es la única relevante en muchas situaciones.
3.2
Ley de Biot-Savart
Al igual que el campo eléctrico, el campo magnético obedece al principio de
superposición: la inducción magnética B̄ creada por un conjunto de cargas
en un punto es igual a la suma vectorial de las inducciones creadas por cada
una de ellas:
B̄ =
X
B̄i
(91)
i
y como una corriente es un conjunto de cargas que se pueden suponer
moviéndose a la misma velocidad y en la misma dirección 3 , esto permite
encontrar el campo creado por elementos de corriente, y, por integración,
la inducción creada por corrientes finitas. A partir de la ley fundamental
(88), si consideramos un elemento de volumen dV que contiene una carga
dq = ρdV , la cual se mueve a velocidad v̄:
µ0 j̄ × r̄
dV
(92)
4π r3
donde j̄ es la densidad de corriente. Particularizando a un hilo delgado de
sección dS cuyo vector tangente d¯l tiene la misma dirección que la velocidad
de las cargas, tenemos que j̄dV = id¯l, de manera que también:
B̄ =
µ0 i d¯l × r̄
(93)
4π r3
Ejemplo: un hilo de longitud infinita que coincide con el eje z transporta
una intensidad i. Calcular la inducción magnética a una distancia b sobre el
eje x. Solución: el vector de posición que va desde un elemento de corriente
situado en z al punto del eje x de coordenada b es r̄ = (b, 0, −z), con r3 =
(b2 + z 2 )3/2 . El elemento de corriente es d¯l = (0, 0, dz), de forma que d¯l × r̄ =
(0, bdz, 0). Quiere decir que la inducción magnética tiene la dirección del eje
y, y valor:
B̄ =
3
Más bien, a las que se puede atribuir una velocidad media, pero no queremos entrar
en estos detalles del transporte.
45
µ0 i
bdz
2
4π (b + z 2 )3/2
dBy =
(94)
El campo total se encuentra integrando para z desde −∞ a ∞:
µ0 i
(95)
2πb
Ejemplo: una espira circular de radio a se encuentra sobre el plano xy, con
su centro en el origen de coordenadas. Encontrar la inducción magnética en
un punto del eje z situado a distancia b. Solución: sea un pequeño elemento
genérico de la espira, y sea θ el ángulo que forma su vector posición con el eje
x. Entonces, el vector que va desde este elemento de corriente al punto b del
eje z es r̄ = (−a cos θ, −a sin θ, b). Por otro lado, d¯l = adθ(− sin θ, cos θ, 0),
de forma que d¯l × r̄ = adθ(b cos θ, b sin θ, a). Al integrar para z desde 0 a
2π, las componentes en x e y se anulan, y sólo queda componente z. La
inducción total se encuentra integrando en θ, y resulta:
By =
µ0 i
a2
2 (a2 + b2 )3/2
Bz =
3.3
(96)
Propiedades de la inducción magnética
Al calcular la divergencia de B̄, tenemos
1
1
v̄ × r̄
= ∇ 3 · (v̄ × r̄) + 3 ∇ · (v̄ × r̄)
∇·
(97)
3
r
r
r
pero por cálculo directo se ve que el resultado es nulo, de manera que
∇ · B̄ = 0
(98)
Integrando esta expresión para un volumen V limitado por una superficie
cerrada S y aplicando el teorema de la divergencia:
Z
S
B̄ · dS̄ = 0
(99)
Esto quiere decir que el flujo que atraviesa cualquier superficie cerrada es
nulo, lo cual quiere decir que el flujo entrante es igual siempre al flujo saliente,
lo cual quiere decir que no existen ni sumideros ni fuentes de lı́neas de campo
magnético; finalmente, eso quiere decir que no existen cargas magnéticas.
La otra propiedad importante de la inducción magnética es conocida como
Ley de Ampere, y establece que la circulación de B̄ en un circuito sobre el
que se apoya una superficie a través de la que existe un flujo de corriente, es:
46
Z
C
B̄ · d¯l = µ0
X
Ii
(100)
i
donde las Ii son las intensidades que atraviesan la superficie, tomadas
como cantidades algebraicas, es decir, positivas si la dirección de la corriente
es congruente con la regla de la mano derecha (el sentido de giro es el de la
circulación) y negativas en caso contrario. Para la deducción, algo farragosa,
de esta ley, remitimos a la bibliografı́a, y aquı́ la podemos tomar como la
generalización de resultados experimentales.
Este resultado es especialmente útil en algunos casos en que se presentan
fuertes simetrı́as.
Ejemplo: inducción magnética a una distancia b de un hilo infinito.
Solución: por simetrı́a, sabemos que las lı́neas de campo son tangentes a
circunferencias centradas en el hilo. Tomando como circuito una circunferencia de radio b:
2πbB = µ0 i
(101)
de donde
B=
µ0 i
2πb
(102)
de acuerdo con (95).
Ejemplo: inducción magnética en el eje de una bobina. Solución: la
simetrı́a del problema nos indica que B̄ será paralelo al eje. Tomando un
circuito rectangular uno de cuyos lados de longitud l se encuentre sobre el
eje, y tomando el paralelo a éste fuera de la bobina y muy alejado, para que
allı́ el campo se pueda considerar nulo, como la circulación en los tramos
perpendiculares es nula:
Bl = µ0 N i
(103)
donde N es el número de vueltas de espira en la longitud l. Por tanto
N
i = µ0 ni
(104)
l
donde n es el número de vueltas por unidad de longitud. No obstante ser
útil, la aplicación de este resultado está limitada a unos pocos casos, aunque
éstos sean de interés. Véase cómo no es útil en un caso tan simétrico como
el de la espira simple.
B = µ0
47
La ley de Ampére puede ponerse en forma diferencial recordando que
de donde
Z
B̄ · d¯l =
Z
S
(∇ × B̄) · dS̄ = µ0
Z
S
j̄ · dS̄
∇ × B̄ = µ0 j̄
3.4
(105)
(106)
Fuerza y pares sobre conductores
A partir de la fuerza de Lorentz, podemos encontrar la fuerza sobre un elemento de corriente, y a partir de ahı́, por integración, la fuerza y el par
sobre un elemento finito. En efecto, aislando un elemento de volumen dV
que contiene una densidad de carga ρ que se mueve con velocidad v̄:
dF̄ = ρ(v̄ × B̄)dV = (j̄ × B̄)dV
(107)
dF̄ = i(d¯l × B̄)
(108)
Pero para un elemento lineal de corriente, j̄dV = id¯l, de manera que
Ejemplo: fuerza por unidad de longitud entre dos hilos paralelos separados una distancia b, por los que circulan intensidades ii e i2 . Solución:
calculamos la fuerza sobre el hilo que conduce i2 . El campo creado por i1
sobre un elemento en el hilo 2 situado a distancia b es el que da (95):
B=
µ 0 i1
2πb
(109)
Entonces
dF
µ 0 i1 i2
=
(110)
dl
2πb
donde hemos tenido en cuenta que B̄ es perpendicular al hilo. En cuanto
al momento:
M̄ =
Z
C
(r̄ × dF̄ )
(111)
El desarrollo de esta expresión es algo farragoso, y lo omitimos, pero
damos el resultado:
M̄ = p̄m × B̄
donde p̄m es el momento magnético del elemento, definido como
48
(112)
p̄m = i
3.5
Z
dS̄
(113)
Magnetismo en la materia
Al igual que las moléculas tienen momento dipolar eléctrico intrı́nseco, también tienen momento magnético intrı́nseco (se puede pensar en los electrones
como pequeñas espiras de corriente alrededor del núcleo). En cada punto del
material, se define un vector magnetización J¯ como el momento magnético
por unidad de volumen:
1 X
J¯ =
p̄m,i
∆V i
(114)
Si no existe una dirección preferente, los momentos individuales se compensan unos con otros. Cuando existe una dirección preferente, el material
muestra magnetización. Esta magnetización es la misma que producirı́a una
distribución de corrientes. En un material homogéneo, perfectamente magnetizado en una dirección, el sistema de corrientes forma circuitos, todos
girando en el mismo sentido, de forma que, en cualquier punto interior al
material, cada circuito se compensa con los circuitos adyacentes. Queda
sin compensar solamente una corriente superficial. En un material no homogéneo quedan sin compensar corrientes en el interior del material. Si
implementásemos en el vacı́o estas corrientes, el resultado serı́a equivalente
al producido por el momento magnético intrı́nseco. Lo que ocurre es que a
su vez estas corrientes dependen del vector B̄, ası́ que el cálculo de B̄ en el
interior del volumen no es directo: para conocer el campo necesitamos las
corrientes, pero éstas dependen del campo, que es desconocido. Llamaremos
j̄ ′ a estas corrientes equivalentes.
3.6
Circulación del vector J¯
Consideremos una superficie cualquiera S y su contorno C en el seno de un
material magnético. Acudiremos a un razonamiento microscópico, y consideraremos a cada átomo o molécula del material como una pequeña espira
de superficie sm por la que circula una corriente im , dando un momento
magnético pm . Calculemos el flujo de las corrientes equivalentes a través de
S. Cualquier circuito que corte la superficie sin incluir al contorno, lo hará en
dos puntos, en dos direcciones opuestas, y por tanto dará como resultado un
flujo nulo. Sólo quedan sin compensar las corrientes que atraviesan S una sola
vez, y esas son las que abrazan al contorno C. Sea dl un segmento pequeño
de ese contorno. Si en el material hay n moléculas por unidad de volumen,
49
la corriente que atraviesa S en la longitud dl del contorno es di′ = nim dV ,
con dV = sm dl cos α y siendo α el ángulo que forma la normal a los pequeños
circuitos con d¯l. Entonces: di′ = nim sm dl cos α = npm dl cos α, pero esto es
justamente J¯ · d¯l. Finalmente, si integramos a todo el contorno:
Z
C
J¯ · d¯l =
Z
S
j̄ ′ · dS̄
(115)
pero la integral de circulación sabemos que es la integral de superficie del
rotacional, luego:
Z
C
Z
J¯ · d¯l =
y ası́ encontramos que
S
¯ · dS̄ =
(∇ × J)
Z
S
∇ × J¯ = j̄ ′
3.7
j̄ ′ · dS̄ = i′
(116)
(117)
Vector H̄
Ası́ pues, la ley de Ampere aplicada a un material magnético ha de incorporar
las corrientes equivalentes, y escribirse como
Z
B̄ · d¯l = µ0 (i + i′ )
C
(118)
Pero esta expresión no es útil, porque las i′ dependen de B̄, que a su vez
depende de i′ . Por eso escribimos:
Z
!
B̄
− J¯ d¯l = i
µ0
C
(119)
Introducimos el vector auxiliar H̄ = B̄/µ0 − J¯ y tenemos la versión para
medios magnéticos de la ley de Ampere:
o en formato diferencial:
Z
C
H̄ · d¯l = i
∇ × H̄ = j̄
(120)
(121)
Si suponemos una dependencia lineal de J¯ con H̄, de la forma J¯ = χm H̄,
entonces
H̄ =
B̄
− χm H̄
µ0
50
(122)
de donde
B̄ = µµ0 H̄
(123)
con µ = 1 + χm . A χm se le llama ”susceptibilidad magnética”. Se puede
ver ahora que en un medio homogéneo, si no hay corrientes de conducción j̄
tampoco hay corrientes equivalentes j̄ ′ . En efecto:
′
i =
Z
S
′
j̄ · dS̄ =
Z
C
J¯ · d¯l = χm
Z
C
H̄ · d¯l = i
(124)
de manera que i′ = χm i y j̄ ′ = χm j̄. De aquı́ se ve que j̄ ′ = 0̄ si j̄ = 0̄.
3.8
Condiciones de contorno
De manera similar a como hicimos con el campo eléctrico, ahora partiremos
de:
y
Z
C
Z
C
B̄ · dS̄ = 0
(125)
H̄ · d¯l = i
(126)
para deducir condiciones de contorno. De la primera, tomando un pequeño
cilindro de altura despreciable y caras paralelas a la superficie de separación
de dos medios magnéticos, despreciando el flujo en la superficie lateral:
B1n ∆S − B2n ∆S = 0
(127)
de donde B1n = B2n . De la segunda, tomando un pequeño circuito rectangular de lados dl paralelos a la interfaz y lados perpendiculares a la misma
de longitud despreciable, se sigue
H1t − H2t = jn
(128)
donde jn es la componente de la corriente de conducción perpendicular
al circuito considerado. Si esta densidad es nula, entonces H1t = H2t . Igual
que en el caso de las lı́neas de campo eléctrico, se puede ver aquı́ que existe
una refracción.
51
3.9
Campo en un medio magnético homogéneo
Hemos dicho que el campo B̄ es debido tanto a las corrientes de conducción
como a las corrientes equivalentes originadas en el momento intrı́nseco magnético de los materiales. El problema es que esas corrientes son a su vez función
del campo. Hay un caso sin embargo en que se puede razonar sobre la configuración total del campo, y es cuando el medio está completamente ocupado
por un material magnético homogéneo.
Supongamos una zona del espacio que contiene sólo corrientes de conducción, que dan lugar a un campo B̄0 . Si rellenamos el espacio circundante
a los conductores con un material magnético, no conductor, homogéneo e
isótropo, aparecerá una magnetización en su superficie, inducida por B̄0 , que
podemos atribuir a corrientes superficiales. Considerando un circuito que
rodea a un conductor, que consideramos fino:
Z
C
J¯ · d¯l = χm
Z
C
H̄ · d¯l = i′ = χm i
(129)
Quiere decir que el campo de magnetización creado por i′ no difiere del
campo B̄0 más que en una constante en cada punto. El campo total es
entonces
B̄ = B̄0 + B̄ ′ = (1 + χm )B̄0 = µB̄0
(130)
¯
y además hay una relación simple entre el campo de magnetización y J,
ya que
B̄ ′ = B̄ − B̄0 = (1 −
1
)B̄
µ
(131)
¯ m , se sigue B̄ ′ = µ0 J.
¯
y como B̄ = µµ0 H̄ y H̄ = J/χ
3.10
Inducción magnética
El fenómeno de la inducción, descubierto por Faraday en 1831, consiste en
la aparición de una correinte en una espira cerrada cuando varı́a el flujo de
campo magnético que la atraviesa. Esto delata la aparición de una fuerza
electro-motriz. Esta fem no depende de la forma cómo se consiguió el cambio
de flujo, sino sólo de la derivada:
dΦ
(132)
dt
Es decir, el resultado es el mismo cuando el cambio se consigue moviendo
la espira, o alterando el campo B̄ que la atraviesa, o ambas cosas a la vez.
E =−
52
Además, se cumple la ley de Lenz: la corriente inducida es tal que crea un
campo cuyo flujo se opone al flujo que la causó. Esto explica el signo menos
en la ecuación anterior. La unidad de flujo es el Weber. Si la variación en el
flujo es 1 W b/s, entonces E = 1V . Si la espira no es simple, sino que contiene
n vueltas, entonces el flujo es n veces el flujo que atraviesa una espira simple.
El origen de E ası́ como su sentido se puede ver considerando un experimento en que un circuito rectangular tiene un lado deslizante. Cuando éste
se mueve con velocidad v̄ aparece una fuerza de Lorentz sobre los electrones
del conductor, que se ponen en circulación. Esta corriente crea a su vez un
campo magnético, y se ve que el sentido de éste es contrario al del que originó
el movimiento de los electrones. Aquı́, el Ē ⋆ de la ecuación (85) es v̄ × B̄, y
se ve también que tiene sentido contrario al de la circulación que determina
la normal a la superficie de la espira. Se ve que
dΦ
Ē ⋆ · d¯l = −vBl = −
(133)
dt
C
Un caso distinto ocurre cuando el área es fija y el cambio en el flujo viene
por el cambio en B̄. Como las dos únicas fuerzas posibles son q Ē y q[v̄ × B̄]
y la segunda no puede ser 4 , se concluye con que hay una fuerza eléctrica
tal que
E=
de donde
Z
Z
d
Ē · d¯l = −
dt
C
Z
S
B̄ · dS̄ = −
Z
S
∂ B̄
· dS̄
∂t
(134)
∂ B̄
(135)
∂t
que está en aparente contradicción con (9), que nos indica que ∇× Ē = 0̄.
La contradicción es sólo aparente, porque allı́ considerábamos un campo electrostático, y aquı́ no. El campo eléctrico total será la suma del electrostático
y del variable. Como el rotacional del electrostático es nulo, la ecuación
anterior es válida para el campo total.
∇ × Ē = −
3.11
Autoinducción e inducción mutua
Como el origen del cambio en el flujo es irrelevante, puede darse y se da
de hecho el fenómeno en una espira aislada por la que circula una corriente
variable. Entonces, la variación de la corriente crea una variación en el flujo,
que crea una E que se opone a la que crea la variación del flujo. Entonces, al
4
En el ejemplo del circuito con un lado deslizante, se ve que v̄ = 0.
53
cerrar una espira abierta se induce una E que se opone al establecimiento de
la corriente. Al abrir el circuito, se induce una fem que tiende a hacer que
continúe la corriente.
Por otro lado, cuando se tienen dos espiras, el flujo que atraviesa una de
ellas depende de la corriente que atraviesa a la otra, y viceversa:
Φ1 = L12 i2
Φ2 = L21 i1
(136)
Es un hecho experimental, y cálculos detallados lo pueden confirmar, que
L12 = L21 .
4
Bibliografı́a
De entre la gran cantidad de bibliografı́a, recomendamos aquı́ el excelente
”Basic laws of electromagnetism”, de I. E. Irodov. La virtud de este libro
es que tiene una coherencia lógica perfecta y que no contiene innecesarias
distracciones. De un nivel algo superior, puede consultarse ”Campos y ondas
electromagnéticos”, de P. Lorrain y Dale R. Corson.
5
Resumen conceptual
1. Concepto de campo.
2. Campo eléctrico: de una carga y de una distribución, discreta y continua.
3. Rotacional y divergencia en una región libre de cargas. Ecuación de
Laplace.
4. Divergencia en una región que contiene cargas. Ecuación de Poisson.
5. El campo eléctrico en la materia. Conductores y dieléctricos.
6. Campo y fuerza superficial en un conductor.
7. Dieléctricos. Dipolo y momento dipolar.
8. Vector P̄ . Propiedades. Vector D̄, propiedades.
9. Condiciones de contorno.
54
10. Energı́a del campo eléctrico.
11. Corriente.
12. Campo magnético. Fuerza de Lorentz. Ley de Biot-Savart. Campo
creado por una distribución de corriente.
13. Divergencia de B̄. Circulación de B̄. Ley de Ampere.
14. Fuerzas y pares sobre conductores.
¯ Circulación de J.
¯
15. Magnetismo en la materia. Vector J.
16. Vector H̄. Condiciones de contorno.
17. Inducción magnética y rotacional de Ē. Autoinducción e inducción
mutua.
6
Ejercicios
1. Dada una distribución superficial uniforme de carga de densidad σ sobre
el plano (x, y), calcular el campo eléctrico en el punto (0, 0, z).
2. Encontrar la energı́a de interacción de cinco cargas eléctricas q situadas
en los vértices de un pentángono regular de lado a.
3. Encontrar el campo magnético creado por un hilo de longitud l a una
distancia l medida por la perpendicular al hilo desde uno de sus extremos. Por el hilo circula una intensidad i. Usar el resultado para
calcular el campo en el centro de una espira cuadrada de lado l.
4. Sean dos hilos paralelos y una espira rectangular, dos de cuyos lados,
de longitud h, son paralelos a los hilos. Los otros dos lados tienen
longitud w. ra es la distancia del hilo más cercano a la espira al lado
de ésta más cercano a él. rb es la distancia del hilo más alejado al
lado de la espira más cercano a él. Por los hilos circulan intensidades
i, de sentidos contrarios, que cambian con velocidad di/dt. Calcular la
fuerza electro-motriz inducida en la espira.
55
III
Sistemas electromecánicos
1
Motivación
Consideremos una masa m sometida a una fuerza u moviéndose en una dimensión. Llamemos q a su coordenada. Además de u, sobre la masa actúa
un resorte elástico de constante k y un amortiguador de fricción de constante
β. Aplicando la ecuación de Newton a esta masa tenemos que
mq̈ = u − kq − β q̇
(1)
u − mq̈ − β q̇ − kq = 0
(2)
o
Sea ahora un circuito RLC sencillo, de una sola malla, con una fuente de
alimentación que establece una ddp de u. Por el circuito circula una carga
q. La ecuación de este circuito es
di
q
+ Ri +
dt
C
reordenando y teniendo en cuenta que i = dq/dt:
u=L
u − Lq̈ − Rq̇ − q/C = 0
(3)
(4)
La semejanza es evidente: la bobina de autoinducción L se corresponde
con la inercia de la masa m. La resistencia se corresponde con el amortiguador, y el condensador con el resorte. Estas semajanzas permiten plantear
la cuestión de si serı́a posible tener una teorı́a general que pudiese acomodar
sistemas con partes mecánicas y eléctricas, de forma que pudiesen resolverse
simultáneamente las partes eléctricas y mecánica, más la interacción entre
ellas. Para ilustrar con un ejemplo lo que queremos decir, imagı́nese una circuito RLC sencillo de una sola malla, alimentado mediante una ddp u, donde
el condensador de placas paralelas está construido de la siguiente forma: la
distancia entre las placas no es fija, sino que una placa está fija y la otra
puede acercarse o alejarse de la otra, mediante un muelle de constante k. Al
circular la corriente, se polariza el condensador, y la fuerza entre las placas
hace que éstas se acerquen. Esta variación en la capacidad influye en la corriente circulante y por tanto en la fuerza entre las placas del condensador,
por lo que se altera su movimiento, lo cual altera a su vez su capacidad, que
modifica la corriente circulante, etc.
56
2
Hacia una teorı́a unificada
En principio, la unificación de la Mecánica con la Electricidad no parece posible, a pesar de las evidentes semejanzas que se ven en las ecuaciones (1) y (2).
El problema es que la Mecánica newtoniana es una teorı́a vectorial, mientras
que la teorı́a de circuitos es una teorı́a escalar. Ahora bien: la mecánica
newtoniana tiene algunos serios inconvenientes, y debido a eso ya en el siglo
XVIII se buscaron formulaciones alternativas. Una de estas alternativas es la
formulación de Lagrange. La formulación de Lagrange es ya una formulación
escalar, igual que la de circuitos. Una vez situados en una teorı́a mecánica
escalar, es fácil sacar provecho de las semejanzas entre sistemas mecánicos
y eléctricos, y extenderla para incluir a los últimos. Pero, ¿cuales son los
inconvenientes de la teorı́a de Newton?
1) En primer lugar, es una teorı́a vectorial, y esto implica que los problemas se plantean en sistemas de referencia cartesianos, lo cual puede no
ser adecuado. Por ejemplo, la posición de un péndulo simple viene dada de
forma unı́voca por el ángulo que forma con la vertical. Pero en la formulación
de Newton es imprescindible usar coordenadas cartesianas, que son dos si el
movimiento es en el plano.
2) En segundo lugar, es una teorı́a que es sólo válida en un tipo particular
de sistemas llamados ”inerciales”. Cuando los sistemas no son inerciales, es
preciso incluir fuerzas ficticias que hacen artificiosa la solución.
3) En tercer lugar, en la ecuación de Newton, F̄ = mā, F̄ es la resultante de todas las fuerzas que actúan sobre la masa m. Algunas de esas
fuerzas pueden ser desconocidas, y entran en el problema como incógnitas,
complicando la solución. Por ejemplo, sobre la masa de un péndulo actúa
la gravedad, pero también la tensión del hilo, que a su vez depende del
movimiento de la masa.
4) Es una formulación adecuada para sistemas de partı́culas, pero poco
adecuada para sólidos y sistemas continuos. En la formulación de Newton,
cada uno de los cuerpos se aisla mentalmente, se hace recuento de todas
las fuerzas que actúan sobre él y se escribe su ecuación del movimiento. Si
hay n cuerpos este proceso se repite n veces para obtener un sistema de n
ecuaciones. Pero un sólido continuo contiene una infinidad de partı́culas, y es
evidente entonces que la solución no es factible a menos que se introduzcan
hipótesis adicionales. Estas hipótesis fueron introducidas por Newton, y son
el principio de acción y reacción y el que las fuerzas entre partı́culas sean
centrales.
La mecánica de Lagrange resuelve todos estos inconvenientes:
1) Pueden usarse aquellas coordenadas que mejor describan la configuración del sistema. En el caso del péndulo, basta usar el ángulo θ: el
57
procedimiento de Lagrange da entonces una sola ecuación en θ.
2) Es válida en cualquier sistema de referencia, inercial o no. No es preciso
por tanto inventar fuerzas ficticias.
3) Las fuerzas desconocidas, como tensiones y, en general, las fuerzas
que limitan el movimiento, quedan excluidas de la formulación del problema.
No es preciso preocuparse por ellas. Al mismo tiempo, si se desea, pueden
calcularse después.
4) El método de Lagrange se aplica a sistemas completos: no es preciso
individualizar cada parte y razonar sobre ella. De hecho, las ecuaciones del
movimiento se obtienen a partir de una cantidad escalar T que es función
sólo de las coordenadas elegidas para representar la posición del sistema. En
el caso del péndulo, no es preciso conocer la tensión de la cuerda y T es una
función sólo de θ.
3
3.1
Mecánica de Lagrange
Principio de D’Alembert
La Mecánica lagrangiana es una formulación radicalmente diferente de la
mecánica, y muy distinta de la Mecánica de Newton. No es entonces extraño
que parta de un principio radicalmente diferente. Este principio es el de
los trabajos virtuales de D’Alembert, que establece que, para un sistema de
masas mi sometidas cada una de ellas a fuerzas resultantes F̄i , se cumple que
X
i
(F̄i − mi āi ) · δr̄i = 0
(5)
A primera vista, este principio no difiere de la ecuación de Newton, e
incluso parece que se deduce de él, porque, si la ecuación de Newton nos
dice que F̄i − mi āi = 0, sea lo que sea que signifique δr̄i , es claro que de
la ecuación de Newton se deduce el principio de D’Alembert. Pero no es
ası́. El motivo principal es que en la ecuación de Newton la fuerza F̄i es
la resultante de todas las fuerza que actúan sobre mi , incluidas las fuerzas
que, de alguna manera, restringen el movimiento de mi . Por ejemplo, la
ecuación de Newton, en el caso del péndulo, incluye la tensión de la cuerda,
responsable de que el movimiento transcurra de tal forma que la distancia de
la masa del péndulo al punto de suspensión permanezca constante. O, por
ejemplo, cuando una masa se mueve sobre una superficie plana, existe una
fuerza que el plano ejerce sobre la masa, de manera que el movimiento de
ésta queda restringido al plano. A estas fuerzas que restringen el movimiento
se las llama ”fuerzas de ligadura”. Pero en el principio de D’Alembert F̄i es
58
la resultante de las fuerzas que actúan sobre mi , excluidas las fuerzas de
ligadura. Por tanto, de la ecuación de Newton no puede deducirse el principio
de D’Alembert o ”principio de los trabajos virtuales”, y debe considerarse
un principio independiente.
Una vez establecido qué es F̄i , es preciso ver qué es δr̄i . Son ”desplazamientos virtuales”. Un desplazamiento virtual es la diferencia entre dos
movimientos reales posibles. Veámoslo con un ejemplo. Una masa m se
mueve sobre una superficie. Desde un punto de esa superficie, m puede
moverse en un plano tangente a la misma. La diferencia de dos vectores
desplazamiento en el plano tangente es otro vector en el plano tangente. Por
tanto, en este caso, los desplazamientos virtuales coinciden con desplazamientos reales. Imaginemos ahora que la superficie se mueve con una velocidad
ū. El desplazamiento d¯1 de la masa es la composición de su desplazamiento
sobre la superficie, dr̄1 más el desplazamiento de la superficie en el intervalo
de tiempo dt que haya llevado dr̄1 , y vale ūdt, ası́ que d¯1 = dr̄1 + ūdt. De la
misma forma, otro movimiento posible es d¯2 = dr̄2 + ūdt. El desplazamiento
virtual es en este caso d¯1 − d¯2 = dr̄1 − dr̄2 . Coincide con el caso anterior, solo
que ahora la superficie estaba en movimiento. Es como si el tiempo hubiese
sido ”congelado”; como si el movimiento virtual se produjese a t = constante.
3.2
Coordenadas generalizadas
El concepto de coordenada generalizada no entra directamente en la formulación vectorial de la Mecánica. Por contra, ocupa un lugar central en
la Mecánica Analı́tica, que es una ciencia que reduce los problemas del
movimiento de los cuerpos a la aplicación ordenada de procedimientos algebraicos. Lagrange (1736-1813) lo expresó ası́ en su Mechanique Analitique
de 1788:
Ya existen diversos tratados de Mecánica, pero el programa de
éste es completamente nuevo. Me he planteado la tarea de reducir tanto la teorı́a como el arte de resolver los problemas concernientes a esta Ciencia a fórmulas generales cuya simple aplicación dé todas las ecuaciones necesarias para obtener la solución
de cada problema.
Más aún:
No se encontrarán figuras en esta obra. Los métodos que aquı́
expongo no requieren ni imágenes ni razonamientos geométricos
o mecánicos, sino tan sólo operaciones algebraicas sujetas a un
proceso regular y uniforme.
59
Consideremos un sistema de N partı́culas, cada una de las cuales tiene, en
el espacio euclı́deo tridimensional, coordenadas r̄i . Nuestro problema consiste
en encontrar r̄i (t), es decir, encontrar 3N funciones del tiempo. Definiremos
las coordenadas generalizadas qi como el mı́nimo conjunto de n variables en
función de las cuales pueden escribirse los r̄i :
r̄i = fi (q1 , · · · , qn , t)
(6)
q̈i = fi (q1 , · · · , qn , q̇1 , · · · , q̇n , t)
(7)
A este número mı́nimo le llamaremos grados de libertad del sistema. Por
ejemplo, la posición de un péndulo ideal puede darse en función del ángulo
que forma con la vertical: n = 1, q1 = θ. La posición de un punto material
sobre una superficie f (x, y, z) puede especificarse mediante el par q1 = x,
q2 = y, y en este caso n = 2. Ocasionalmente, el conjunto de coordenadas
generalizadas adecuadas para un problema en concreto puede coincidir con
las coordenadas cartesianas de una o varias de las partı́culas que constituyen
el sistema, aunque esto no es lo habitual. En el movimiento de un planeta alrededor del Sol, pueden usarse coordenadas cartesianas, pero son más
adecuadas las coordenadas polares. Como último ejemplo, consideremos un
sólido rı́gido. Su posición en el espacio puede darse mediante las coordenadas
de su centro de masas y tres ángulos que especifican su orientación: es un
sistema con seis grados de libertad.
Aplicando los principios de la Mecánica Analı́tica encontraremos el conjunto de ecuaciones diferenciales ordinarias:
La solución de este conjunto de ecuaciones se considera como la solución
del problema y normalmente no se requiere la obtención de las coordenadas
cartesianas.
3.3
Ecuaciones de Lagrange
Escribiremos el principio de D’Alembert en función de las coordenadas generalizadas qi . Veamos para ello que:
δr̄i =
X ∂r̄i
∂qj
j
δqj
(8)
y transformemos cada uno de los términos en la formulación original. En
primer lugar:
X
i
F̄i δr̄i =
X
i
F̄i
X ∂r̄i
j
∂qj
δqj =
X X
j
60
i
∂r̄i
F̄i
∂qj
!
δqj =
X
j
Qj δqj
(9)
donde hemos introducido las fuerzas generalizadas Qj . Por otro lado:
X
mi āi δr̄i =
i
X
mi
i
X d
X
dr̄˙i
d
δr̄i =
(mi r̄˙i δr̄i ) −
mi r̄˙i δr̄i
dt
dt
i dt
i
(10)
Para el primer término:
X ∂r̄i
d X
d X
δqj
mi r̄˙i δr̄i =
mi r̄˙i
dt i
dt i
j ∂qj
(11)
∂r̄i
∂ r̄˙i
=
∂qj
∂ q˙j
(12)
∂r̄i
dr̄i X ∂r̄i
=
q˙j +
dt
∂t
j ∂qj
(13)
Ahora bien:
En efecto:
y de esta última se sigue la anterior. Por tanto, el primer término queda:
∂ r̄˙i
d X X
mi r̄˙i
dt j
∂ q˙j
i
!
d X ∂
δqj =
dt j ∂ q˙j
X1
i
2
mi r̄˙i
2
!
δqj
(14)
Para el segundo:
X
i
=

X
mi r̄˙i
X
mi r̄˙i
X
mi r̄˙i
i
=
=
∂qj
mi r̄˙i
i
X ∂
j
X ∂ r̄˙i
j
XX
j
∂qj
j
i
=
k
X ∂
∂qj
!
δqj
!
!
X ∂r̄i
k
∂r̄i
δqj
q˙k +
∂qk
∂t
δqj
∂ r̄˙i
δqj
∂qj
X1
i
∂r̄i
∂qj
∂ 2 r̄i
q˙k +
δqj
∂qj ∂qk
∂qj ∂t
X X ∂ 2 r̄i
j
i
=

X
X d
d
d X ∂r̄i  X
mi r̄˙i δr̄i =
mi r̄˙i 
δqj =
mi r̄˙i
dt
dt j ∂qj
i
i
j dt
2
mi r̄˙i
2
!
δqj
(15)
Definamos el escalar T como
61
T =
X1
i
2
mi r̄˙i
2
(16)
al que llamaremos Energı́a Cinética. Si ahora reunimos todas las piezas,
podemos escribir el principio de D’Alembert en función de las coordenadas
generalizadas:
X
j
"
#
d ∂T
∂T
−
− Qj δqj = 0
dt ∂ q˙j
∂qj
(17)
En esta versión del principio de D’Alembert, toda la información sobre el
sistema se encuentra sintetizada en el escalar T , y todas las fuerzas aplicadas,
en las fuerzas generalizadas Qj . Si las coordenadas qj son realmente coordenadas generalizadas, es decir, el mı́nimo número de parámetros en función
de los cuales puede expresarse la posición de cualquier punto del sistema, no
existirán relaciones funcionales entre ellas, y las δqj serán independientes, lo
que conduce a las n ecuaciones del movimiento
d ∂T
∂T
−
− Qj = 0
dt ∂ q˙j
∂qj
(18)
para j = 1, · · · , n.
3.4
Procedimiento y ejemplos
El procedimiento para encontrar las ecuaciones del movimiento (18) se puede
entonces resumir en los siguientes puntos:
1. Escribir T en función de las coordenadas cartesianas.
2. Transformar la expresión, escribiendo las coordenas cartesianas y sus
derivadas en función de las coordenadas generalizadas elegidas.
3. Calcular las Qj .
4. Aplicar (18) para cada coordenada generalizada.
Ejemplo: ecuaciones del movimiento de una partı́cula de masa m que se
mueve en el plano xz bajo la acción de la gravedad. Solución: la energı́a
cinética es
1
T = m(ẋ2 + ż 2 )
2
62
(19)
Como hay dos grados de libertad, necesitamos dos coordenadas generalizadas. Estas pueden ser las mismas coordenadas cartesianas, con lo cual
nos ahorramos el paso 2). En cuanto a las fuerzas generalizadas, la única
fuerza activa es la de la gravedad, de componentes ḡ = (0, −g). Las fuerzas
generalizadas son entonces:
y
Qx = ḡ ·
∂r̄
∂x
(20)
Qy = ḡ ·
∂r̄
∂y
(21)
siendo r̄ = (x, y). Entonces ∂r̄/∂x = (1, 0) y ∂r̄/∂z = (0, 1). De aquı́
Qx = 0 y Qz = −g. Las dos ecuaciones del movimiento son:
y
∂T
d ∂T
−
− Qx = 0
dt ∂ ẋ
∂x
(22)
∂T
d ∂T
−
− Qz = 0
dt ∂ ż
∂z
(23)
mẍ = 0
mz̈ = −g
(24)
que se reducen a:
Ejemplo: movimiento de un péndulo simple de longitud l y masa m
sometido a la gravedad. Lo suponemos contenido en el plano xz, con el
eje z dirigido verticalmente hacia abajo. Solución: es evidente que basta
saber el ángulo θ que forma el hilo con el eje vertical para determinar la
posición del péndulo, luego usaremos θ como única coordenada generalizada.
La energı́a cinética es
1
T = m(ẋ2 + ż 2 )
2
(25)
y en función de θ:
x = l sin θ
z = l cos θ
de donde
63
(26)
ẋ = lθ̇ cos θ
ż = −lθ̇ sin θ
(27)
con lo cual queda:
1
(28)
T = ml2 θ̇2
2
Como sólo hay una coordenada generalizada, sólo hay una ecuación, y
sólo una fuerza generalizada Qθ , que es
∂r̄
∂θ
con ḡ = (0, mg) y r̄ = (l sin θ, l cos θ). Derivando:
Qθ = ḡ ·
(29)
∂r̄
= (l cos θ, −l sin θ)
∂θ
(30)
Qθ = −mlg sin θ
(31)
∂T
d ∂T
−
− Qθ = 0
dt ∂ θ̇
∂θ
(32)
ml2 θ̈ + mgl sin θ = 0
(33)
Finalmente
La única ecuación del movimiento es
es decir:
Ejemplo: una barra rı́gida de longitud l y masa m se encuentra en el
plano vertical, apoyada en el suelo y en una pared que forma ángulo recto
con el suelo; se supone que no hay rozamiento. Si se abandona desde una
posición cualquiera, la barra se desliza y cae. Encontrar la ecuación del
movimiento. Solución: hay una sola ecuación del movimiento porque hay sólo
una coordenada generalizada, que puede ser el ángulo θ que forma la barra
con el suelo. Pero hay una infinidad de elementos de masa, ası́ que la energı́a
cinética total se encuentra sumando las energı́as de todos los elementos. Sea
uno de estos elementos, situado a una distancia s del extremo inferior de la
barra. Las coordenadas de este elemento son
xs = (l − s) cos θ
zs = s sin θ
64
(34)
Si la longitud del elemento es ds, su masa es λds, y su energı́a cinética
1
dTs = λds(ẋ2s + żs2 )
(35)
2
Derivando (34), sustituyendo en (35) e integrando desde s = 0 a s = l,
tenemos la energı́a total:
1
T = ml2 θ̇2
(36)
6
La fuerza sobre el elemento λds es ḡ = (0, −λgds) y ∂r̄/∂θ = (−(l −
s) sin θ, s cos θ). De aquı́, dQθ = −λg cos θsds. Integrando desde s = 0 a
s = l, se tiene que Qθ = − 21 mgl cos θ. Aplicando (18) y tras simplificar un
poco se encuentra la ecuación del movimiento de la barra:
θ̈ +
3.5
3g
cos θ = 0
2l
(37)
Sistemas con función potencial
Puede suceder que las fuerzas aplicadas al sistema deriven de una función
potencial, es decir, que exista una función U (q1 , · · · , qn ) tal que:
∂U
∂ r¯i
En este caso, las fuerzas generalizadas adoptan la forma sencilla:
F̄i = −
Qj =
X
i
F̄i
X ∂U ∂ r¯i
∂ r¯i
∂U
=−
=−
∂qj
∂qj
i ∂ r¯i ∂qj
(38)
(39)
Las ecuaciones (18) pueden escribirse entonces en la forma:
∂L
d ∂L
−
=0
dt ∂ q˙j
∂qj
(40)
donde hemos introducido la función L = T − U , conocida como función
de Lagrange, o simplemente Lagrangiana. Esta función dependerá en general
de las coordenadas y velocidades generalizadas, y posiblemente del tiempo:
bien porque la energı́a potencial dependa del tiempo, bien porque las relaciones r¯i (q1 , · · · , qn , t) lo contengan, bien por ambas causas a la vez. Cuando
las ecuaciones del movimiento pueden escribirse en esta última forma, que
recordemos son ecuaciones diferenciales de segundo orden en las coordenadas
generalizadas, es posible averiguar las circunstancias en que existen integrales
primeras, que pueden usarse para resolver las ecuaciones del movimiento.
65
En primer lugar, veamos que cuando una coordenada qj no aparece explı́citamente en la Lagrangiana:
d ∂L
=0
dt ∂ q˙j
(41)
lo que implica que la cantidad
pj =
∂L
∂ q˙j
(42)
es una constante. A pj se le llama momento generalizado.
En segundo lugar, procedamos a calcular la derivada respecto al tiempo
de la Lagrangiana:
!
∂L
∂L
dL X ∂L
=
q˙j +
q¨j +
dt
∂qj
∂ q˙j
∂t
j
(43)
Pero usando (41),
dL X d
∂L
q˙j
=
dt
∂ q˙j
j dt
!
+
∂L
∂t
(44)
Intercambiando en el segundo miembro derivada y sumatoria:


X
d 
∂L
L−
pj q˙j  =
dt
∂t
j
(45)
De manera que cuando L no es función explı́cita del tiempo, resulta que
la cantidad
h=L−
X
pj q˙j
(46)
j
es constante. De esta forma, una de las velocidades puede expresarse en
función de las coordenadas y velocidades restantes.
3.6
Fuerzas disipativas
En general, actuarán sobre los sistemas fuerzas que deriven de un potencial
y fuerzas que no deriven de un potencial. Designando estas últimas por Q∗j ,
es evidente que:
d ∂L
∂L
−
= Q∗j
dt ∂ q˙j
∂qj
66
(47)
Por otro lado, pueden existir fuerzas de rozamiento dependientes de la
velocidad, de la forma
F̄i = −k r¯˙i
(48)
Las fuerzas generalizadas se escriben entonces como:
Qj =
X
i
F̄i
X
X
∂ r¯i
∂F
∂ r¯i
∂ r¯˙i
=−
=−
=−
k r¯˙i
k r¯˙i
∂qj
∂qj
∂ q˙j
∂ q˙j
i
i
(49)
donde hemos introducido la función de disipación de Rayleigh F:
F=
X1
i
2
k r¯˙i
2
(50)
Para tales sistemas, donde parte de las fuerzas derivan de un potencial y
otra parte son fuerzas disipativas, las ecuaciones del movimiento son:
∂L ∂F
d ∂L
−
+
=0
dt ∂ q˙j
∂qj ∂ q˙j
4
(51)
Sistemas electromecánicos
A continuación trazaremos el paralelismo entre los sistemas eléctricos y los
sistemas mecánicos, veremos la forma de escribir la ”energı́a cinética” para
los sistemas eléctricos, cómo calcular las ”fuerzas generalizadas” y consecuentemente cómo calcular las ”ecuaciones del movimiento”. Finalmente,
ilustraremos el procedimiento con algunos ejemplos.
4.1
Coordenadas generalizadas
En un circuito formado por una serie de ramas, las coordenadas generalizadas
son las cargas qj que circulan por cada rama. Ahora bien, en el paso de
(17) a (18) hemos supuesto que todas las coordenadas generalizadas son
independientes. Usualmente, en los circuitos eléctricos esto no sucede ası́,
porque en cada nudo, que son los puntos en que confluyen tres o más ramas,
ha de suceder que la suma de las intensidades entrantes iguale a la suma
de las intensidades salientes. Esta condición constituye una ecuación, que
puede usarse para escribir una de las qj en función de las demás. Aplicando
el mismo procedimiento a todos los nudos, se pueden eliminar las coordenadas
superfluas.
67
4.2
Energı́a cinética
La energı́a cinética de una masa que se mueve en una dimensión es
1
T = mq̇ 2
(52)
2
La energı́a cinética de una serie de masas mi con coordenadas r̄i es
T =
1X
2
mi r̄˙ i
2 i
(53)
Cuando las r̄i son funciones de las coordenadas generalizadas (no consideramos el caso en que son funciones también del tiempo) tenemos que
r̄˙ i =
X ∂r̄i
j
y
2
r̄˙ i
=
X
j,k
∂r̄i
∂qj
!
(54)
∂qj
!
X
∂r̄i
Aij,k q̇j q̇k
q̇j q̇k =
∂qk
j,k
(55)
de forma que la energı́a cinética es
T =
XX 1
j,k
i
2
mi Aij,k q̇j q̇k =
1X
Mj,k q̇j q̇k
2 j,k
(56)
Ahora, el paralelo eléctrico: La energı́a magnética en una bobina de autoinducción L por la que circula una intensidad i = q̇ es
1
T = Lq̇ 2
(57)
2
(57) es el equivalente de (52). La energı́a magnética de una serie de
bobinas con coeficientes de inducción Lj y de inducción mutua Mj,k (Mj,j =
Lj ) por las que circulan intensidades ij = q̇j es
T =
1X
Mj,k q̇j q̇k
2 j,k
(58) y (56) tienen exactamente la misma forma.
68
(58)
4.3
Energı́a potencial
En un circuito eléctrico, la ”energı́a potencial” se encuentra en dos sitios: en
las fuentes de voltaje y en los condensadores. En el campo de la gravedad, la
energı́a potencial de un cuerpo situado a altura q (el eje q está dirigido hacia
arriba) es u = mgq. La energı́a suministrada por una fuente de voltaje u es
uq. Por otro lado, la energı́a almacenada en un resorte de constante k es
1 2
kq
2
y la energı́a almacenada en un condensador de capacidad C es
(59)
1 q2
(60)
2C
(59) y (60) tienen exactamente la misma forma. En general, la ”energı́a
potencial” de una malla que contiene r condensadores y s fuentes de voltaje
es
U=
X 1 qr2
r
4.4
2C
−
X
us q s
(61)
s
Fuerzas generalizadas
Comparando (18) y (51), se ve que las fuerzas generalizadas Qj , cuando hay
fuerzas aplicadas que derivan de un potencial y fuerzas disipativas, se pueden
poner como
Qj = −
∂F
∂U
−
∂qj
∂ q̇j
(62)
En los sistemas eléctricos, U viene dada por (61) y se toma
F=
1X
Rp q̇p2
2 p
(63)
cuando se tiene un sistema de p resistencias Rp por las que circulan cargas
qp .
4.5
Selección de ejemplos
Mostramos a continuación una serie de ejemplos. Para hacerlos más ilustrativos, algunos los resolveremos por duplicado: una vez por los medios
convencionales y otra usando el formalismo lagrangiano. Se verá que este
formalismo no parece muy ventajoso: esto se debe a que los ejemplos que
69
elegimos son sencillos: no son difı́ciles de resolver ni por un medio ni por
otro. Posteriormente, consideraremos algún ejemplo más complejo, y alguno
en que el sistema contiene partes eléctricas y partes mecánicas.
Ejemplo 1: Resolver el circuito de la Figura 1.
Figura 1
a) Método convencional. Sólo hay una malla, por tanto una corriente.
Recorriendo la malla u − iR = 0, de donde obtenemos la intensidad i = u/R.
b) Método lagrangiano. La ”energı́a cinética” es nula, porque no hay
autoinducciones. La ”energı́a potencial” es U = −uq y la función de Rayleigh
F = (1/2)Rq̇ 2 . La única ecuación de Lagrange es
0=−
∂U
∂F
−
∂q
∂ q̇
(64)
de donde u = Rq̇ = Ri.
Ejemplo 2: Resolver el circuito de la Figura 2.
a) Método convencional. Igualando las subidas y bajadas de potencial a
lo largo de la malla:
di
= Rq̇ + Lq̈
(65)
dt
b) Método lagrangiano. La energı́a cinética está asociada a la bobina, y
u = Ri + L
es
1
T = Lq̇ 2
2
70
(66)
Figura 2
La ”energı́a potencial” a la fuente, y es
U = −uq
(67)
y la función de Rayleigh es
1
F = Rq̇ 2
2
La única ecuación de Lagrange es
∂T
∂U
∂F
d ∂T
−
=−
−
dt ∂ q̇
∂q
∂q
∂ q̇
(68)
(69)
Efectuando las operaciones, encontramos u = Rq̇ + Lq̈, de acuerdo con el
método convencional.
Ejemplo 3: Resolver el circuito de la Figura 3.
a) Método convencional. Igualando ganancias y pérdidas de potencial en
un recorrido de la malla:
u = Lq̈ + q/C
(70)
b) Método lagrangiano: T = (1/2)Lq̇ 2 , F = 0 y U = −uq + (1/2)q 2 /C.
Hay una única ecuación. Efectuando las operaciones: u = Lq̈ + q/C.
Ejemplo 4: Resolver el circuito de la Figura 4.
La ”energı́a cinética” está asociada tanto a las autoinducciones como a la
inducción mutua entre ambas bobinas:
71
Figura 3
Figura 4
1
1
T = L1 q̇12 + L2 q̇22 + L12 q̇1 q̇2
2
2
La ”energı́a potencial” es
(71)
U = −uq1
(72)
1
F = Rq̇22
2
(73)
y la función de Rayleigh
Las dos ecuaciones son
72
d ∂T
∂U
∂F
=−
−
dt ∂ q̇1
∂q1 ∂ q̇1
(74)
d ∂T
∂U
∂F
=−
−
dt ∂ q̇2
∂q2 ∂ q̇2
(75)
y
Efectuando las operaciones:
u = L1 q̈1 + L12 q̈2
0 = Rq̇2 + L2 q̈2 + L12 q̈1
(76)
Ejemplo 5: Resolver el circuito de la Figura 5.
Figura 5
La ”energı́a cinética”, ”energı́a potencial” y función de Rayleigh son
T =0
y
U = −u1 q1 + u2 q2 +
(77)
1 q32
2C
(78)
1
1
F = R1 (i1 − i2 )2 + R2 (i3 − i2 )2
(79)
2
2
Ahora hay dos ecuaciones como (74) y (75) y otra adicional para la tercera
carga. Efectuando las operaciones:
73
u1 = R1 (q̇1 − q̇2 )
u2 = R1 (q̇1 − q̇2 ) + R2 (q̇3 − q̇2 )
0 = −q3 /C − R2 (q̇3 − q̇2 )
4.6
(80)
Un sistema mixto
El sistema de la Figura 6 contiene una parte mecánica y una eléctrica.
Figura 6
El circuito está excitado por una señal senoidal u = u0 sin ωt y del mismo
forma parte un condensador, una de cuyas placas está sostenida por un resorte de constante k. En la posición de equilibrio, la separación entre placas
es s. La capacidad es una función de x, separación de la placa superior de la
posición de equilibrio, de la forma:
A
(81)
s−x
La masa de la placa superior del condensador es m. Ahora, la energı́a
cinética contiene dos términos, uno correspondiente a la bobina y otro al
movimiento de m:
C=
1
1
T = Lq̇ 2 + mẋ2
2
2
74
(82)
La energı́a potencial contiene también dos términos. Una parte eléctrica,
que incluye a la fuente y al condensador, y una parte mecánica, que incluye
al resorte k:
1 q 2 (s − x) 1 2
+ kx
2
A
2
La función de disipación es debida a la resistencia:
U = −u0 q sin ωt +
(83)
1
F = Rq̇ 2
(84)
2
Hay dos ecuaciones, una para la carga circulante y otra para la coordenada x de la parte mecánica. La obtención de las ecuaciones del sistema
es inmediata y ya pone de manifiesto la potencia del método que hemos
presentado:
Lq̈ + Rq̇ + q(s − x)/A = u0 sin ωt
mẍ + kx − q 2 /(2A) = 0
5
(85)
Sistemas lineales
La mayorı́a de los ejemplos que hemos ido encontrando dan como resultado ecuaciones o sistemas de ecuaciones lineales, donde aparecen ciertas
incógnitas y sus derivadas respecto al tiempo, multiplicadas por constantes.
Además, pueden aparecer funciones del tiempo en términos adicionales (no
multiplicando a las incógnitas). Todos estos sistemas se pueden escribir de
la misma forma:
x̄˙ = Ax̄ + Bū
(86)
Por ejemplo, si consideramos la ecuación (1):
k
β
q̇ + q = u
m
m
e introducimos las variables de estado
q̈ +
x1 = q
x2 = q̇
es claro que
75
(87)
(88)
ẋ1 = x2
ẋ2 = u −
β
k
x1 − x2
m
m
(89)
que en formato matricial se puede escribir:
"
ẋ1
ẋ2
#
=
"
0
1
−k/m −β/m
#"
x1
x2
#
+
"
0
1
#
u
(90)
La técnica es general: una ecuación diferencial ordinaria lineal en coeficientes constantes de orden n puede sustituirse por un sistema de n ecuaciones
de primer orden, introduciendo n variables de estado. Por ejemplo:
d2 y
dy
d3 y
+
6
− 8 + 2y = u(t)
3
2
dt
dt
dt
se puede transformar introduciendo las tres variables de estado
x1 = y
x2 = ẏ
x3 = ÿ
(91)
(92)
con lo cual:







x1
0
ẋ1
0 1 0

 




x
0
0
1
ẋ
+
=
  2   0  u(t)
 2 

x3
−2 8 −6
ẋ3
1
(93)
Pues bien, encontraremos la solución general para este tipo de sistemas.
Ciertamente, hay muchos sistemas que no son lineales, pero también es cierto
que en muchos sistemas no lineales interesa el comportamiento en las cercanı́as de ciertos valores, y eso permite hacer aproximaciones lineales. La
técnica que emplearemos para resolver estos sistemas consta de dos pasos:
primero buscaremos la solución del sistema cuando ū = 0̄ y después modificaremos la solución encontrada para que sea válida para el caso general.
a) Paso 1. Consideramos x̄˙ = Ax̄. Si en el segundo miembro tomamos
aproximadamente x̄(t) ≈ x̄(0) podremos integrar fácilmente, y obtener x̄(t) =
(I+At)x̄(0). Ahora, podemos usar esta aproximación para buscar una mejor,
poniendo x̄˙ = (I + At)x̄(0), que se integra fácilmente de nuevo para dar
x̄(t) = (I + At + (1/2)A2 t2 )x̄(0) El procedimiento se puede iterar, dado la
serie:
76
x̄(t) = (I + At + (1/2)A2 t2 + (1/3!)A3 t3 + · · · + (1/n!)An tn + · · ·)x̄(0) (94)
La serie entre paréntesis es formalmente idéntica a la de la exponencial
de números reales, ex = 1 + x + x2 /2 + x3 /3! + · · · + xn /n! + · · ·, ası́ que
escribimos en forma abreviada
x̄(t) = eAt x̄(0)
(95)
b) Paso 2. Ahora vamos a la ecuación no homogénea: x̄˙ = Ax̄ + Bū y
tratamos de adaptarle la solución encontrada. Para ello, la idea consiste en
tomar no x̄(t) = eAt x̄(0), sino x̄ = eAt c̄(t), y elegir c̄(t) de forma adecuada
para que se satisfaga la ecuación no homogénea. En efecto, derivando esta
solución de prueba, y sustituyendo en la ecuación diferencial original:
x̄˙ = AeAt c̄(t) + eAt c̄˙
(96)
eAt c̄˙ (t) = Bū(t)
(97)
y
Ahora, es fácil convencerse de que
eAt
−1
= e−At
(98)
por ejemplo, escribiendo las series correspondientes, efectuando las multiplicaciones y comprobando que en efecto el producto de ambas matrices es
la identidad. Entonces, de (97)
c̄˙ (t) = e−At Bū(t)
(99)
que se integra fácilmente:
Z
c̄(t) = c̄(0) I +
t
0
(100)
eA(t−τ ) Bū(τ )dτ
(101)
e
−Aτ
Bū(τ )dτ
de donde ya, sin más
Z
At
x̄(t) = e c̄(0) +
t
0
a la vista de la cual, es obvio que c̄(0) = x̄(0), ası́ que
At
x̄(t) = e x̄(0) +
Z
t
0
77
eA(t−τ ) Bū(τ )dτ
(102)
Esta es una solución formal, que se basa en que sepamos calcular la matriz
exponencial, que a su vez es una serie infinita. En realidad, no es preciso
calcular la serie infinita. Si la matriz A tiene dimensiones de n×n, entonces la
exponencial, o en general cualquier polinomio en A, del grado que sea, tiene
como mucho n términos. Para demostrar este resultado, nos apoyaremos
en un teorema trascendental, que es el teorema de Cayley-Hamilton, que
pasamos a demostrar.
6
El teorema de Cayley-Hamilton
Demostraremos el teorema de Cayley-Hamilton, a partir del cual veremos
cómo es posible calcular una función analı́tica arbitraria f (A) de una matriz cuadrada, como por ejemplo la matriz exponencial. Dada una matriz
cuadrada A, la ecuación caracterı́stica |A − λI| = 0 es un polinomio p(λ); si
A es una matriz n×n, entonces p(λ) es un polinomio de grado n en λ. El teorema de Cayley-Hamilton afirma que si p(λ) = 0 es la ecuación caracterı́stica
de una matriz A, entonces A satisface su propia ecuación caracterı́stica, es
decir, que p(A) = 0.
Por ejemplo, si


1 2 3

A =  5 7 11 

13 17 19
entonces
p(λ) = −λ3 + 27λ2 + 77λ + 24
(103)
(104)
y se comprueba que
−A3 + 27A2 + 77A + 24I = 0
(105)
Para demostrar el teorema, comenzamos con un resultado del álgebra:
(A − λI)−1 =
(m(A − λI))T
|A − λI|
(106)
donde m(A − λI) es una matriz cuyo elemento mij es (−1)i+j κij (A),
siendo κij (A) el determinante de la matriz resultante de eliminar de A la fila
i y la columna j. Como |A − λI| = 0:
p(λ)I = (m(A − λI))T (A − λI)
78
(107)
Ahora bien, (m(A−λI))T es una matriz polinómica en λ de grando n−1,
es decir, existen matrices Bi tales que
(m(A − λI))T = Bn−1 λn−1 + Bn−2 λn−2 + · · · + B1 λ + B0
(108)
En efecto, cada elemento de (m(A − λI))T es un polinomio en λ de
grado n − 1, y es posible recolectar en una matriz todos los coeficientes
correspondientes a una misma potencia de λ. Por ejemplo, si
λ2 − 26λ − 54
2λ + 13
3λ + 1

5λ + 48
λ2 − 20λ − 20
11λ + 4 
E(λ) = 

13λ − 6
17λ + 9
λ2 − 8λ − 3


(109)
es posible escribir






1 0 0
−26 2
3
−54 13
1


 

2
E(λ) =  48 −20 4  +  5 −20 11  λ +  0 1 0 
 λ (110)
0 0 1
13
17 −8
−6
9 −3
Ası́ pues:
(m(A − λI))T (A − λI) =
(Bn−1 λn−1 + Bn−2 λn−2 + · · · + B1 λ + B0 )(A − λI)
= −Bn−1 λn + (Bn−1 A − Bn−2 )λn−1 + (Bn−2 A − Bn−3 )λn−2 + · · ·
· · · + (B2 A − B1 )λ2 + (B1 A − B0 )λ + B0 A
(111)
Pero al mismo tiempo sucede que
o
p(λ) = (−1)n λn + cn−1 λn−1 + · · · + c1 λ + c0
(112)
p(λ)I = (−1)n Iλn + cn−1 Iλn−1 + · · · + c1 Iλ + c0 I
(113)
Si ahora igualamos coeficientes:
−Bn−1 = (−1)n I
Bn−1 A − Bn−2 = cn−1 I
Bn−2 A − Bn−3 = cn−2 I
79
···
B2 A − B1
B1 A − B0
B0 A
=
=
=
=
···
c2 I
c1 I
c0 I
(114)
Sustituyamos Bn−1 de la primera en la segunda, Bn−2 de la segunda en
la tercera, y ası́ sucesivamente, y obtenemos:
−Bn−1
−Bn−2
−Bn−3
−Bn−4
···
−B2
−B1
=
=
=
=
=
=
=
(−1)n I
cn−1 I + (−1)n A
cn−2 I + cn−1 A + (−1)n A2
cn−3 I + cn−2 A + cn−1 A2 + (−1)n A3
···
c3 I + c4 A + c5 A2 + · · · + (−1)n An−3
c2 I + c3 A + c4 A2 + · · · + (−1)n An−2
(115)
y finalmente
−B0 = c1 I + c2 A + c3 A2 + · · · + (−1)n An−1
(116)
−(c1 A + c2 A2 + c3 A3 + · · · + (−1)n An ) = c0 I
(117)
c0 I + c1 A + c2 A2 + · · · + (−1)n An = 0
(118)
p(A) = 0
(119)
que se obtiene de sustituir B1 en la penúltima ecuación. Entonces, sustituyendo B0 en la última:
o
es decir:
como querı́amos demostrar.
7
Función de una matriz y matriz exponencial
En primer lugar, vemos que cualquier potencia de una matriz n × n se puede
escribir como una suma de potencias de, a lo sumo, grado n−1. Por ejemplo,
80
si
A=
"
1 2
3 4
#
(120)
tenemos que p(λ) = λ2 − 5λ − 2, luego, según el teorema de CayleyHamilton, A2 = 5A+2I; a partir de aquı́, A3 = 27A+10I, A4 = 145A+54I,
y ası́ sucesivamente. Cualquier polinomio f (A) puede escribirse entonces
como un polinomio de grado n − 1.
Pero hay un procedimiento mejor. En efecto, considérese una matriz
cuadrada A y un polinomio s(λ), y sea p(λ) el polinomio caracterı́stico de
A. Escribimos s(λ) en la forma
s(λ) = q(λ)p(λ) + r(λ)
(121)
donde q(λ) lo encontramos por división polinómica y r(λ) es a lo sumo
de grado n − 1 si p(λ) es de grado n. Ahora bien, cuando λj es precisamente
un valor propio, p(λj ) = 0 y queda
s(λj ) = r(λj )
(122)
s(A) = q(A)p(A) + r(A)
(123)
De la misma manera
Pero por el teorema de Cayley-Hamilton p(A) = 0 y por tanto
s(A) = r(A)
(124)
Como ejemplo, sea
A=
"
1 2
3 4
#
(125)
y supongamos que deseamos calcular s(A) = A4 + 3A3 + 2A2 + I. La
ecuación caracterı́stica es
λ2 − 5λ + 5 = 0
(126)
Dividiendo:
λ4 + 3λ3 + 2λ2 + 1
146λ − 184
= λ2 + 8λ + 37 + 2
2
λ − 5λ + 5
λ − 5λ + 5
El resto es por consiguiente r(λ) = 146λ − 184, ası́ que
81
(127)
s(A) = 146A − 184I
(128)
Pero, ¿qué ocurre si el grado del polinomio s(A) es muy grande? En
ese caso, puede ser sumamente tedioso, e incluso impracticable, efectuar la
división polinómica. De nuevo, hay un camino rápido. Supongamos que
deseamos calcular un polinomio de grado muy elevado, o incluso una serie
infinita de potencias
f (λ) =
∞
X
α k λk
(129)
k=0
Sabemos que podemos escribir
f (λ) = q(λ)p(λ) + r(λ)
(130)
Lo que hemos de ver aquı́ es que, para cada λ que sea valor propio, es
irrelevante cual sea q(λ), ya que viene multiplicado por un p(λ) = 0. Y de la
misma forma, es irrelevante cual sea r(λ), desde el momento en que sabemos
que tiene grado, a lo sumo, n − 1; luego se podrá escribir
f (λj ) = r(λj ) =
n−1
X
βk λkj
(131)
k=0
que constituye un sistema de n ecuaciones que nos permite encontrar
los n coeficientes de r(λ). Y si f (A) se define por la misma serie de f (λ),
entonces, aplicando nuevamente el teorema de Cayley-Hamilton, f (A) =
Pn−1
q(A)p(A) + r(A) = r(A) = k=0
βk Ak , donde los βk se obtienen del sistema
(131). Como ejemplo, calculemos sin(A), con
A=
"
−3 1
0 −2
#
(132)
La ecuación caracterı́stica es p(λ) = (3 + λ)(2 + λ) = 0, y los valores
propios λ1 = −3 y λ2 = −2. Como n = 2, a lo sumo r será un polinomio de
primer grado. De aquı́:
sin(λ1 ) = β0 + β1 λ1
sin(λ2 ) = β0 + β1 λ2
(133)
Se sigue que β0 = 3 sin(−2) − 2 sin(−3) y β1 = sin(−2) − sin(−3). Entonces, simplemente,
sin(A) = β0 + β1 A
82
(134)
Por consiguiente, el cálculo de la función matriz exponencial es un caso
particular a igual que lo es el cálculo de la función seno de una matriz. Por
ejemplo, para la matriz
A=
"
0
1
−2 −3
#
(135)
la ecuación caracterı́stica es p(λ) = λ2 + 3λ + 2 = 0 y los valores propios
λ1 = −1 y λ2 = −2. Sabemos que
eAt = β0 I + β1 A
(136)
y obtenemos los coeficientes del sistema
e−t = β0 − β1
e−2t = β0 − 2β1
(137)
β0 = e−t
β1 = e−t − e−2t
(138)
eAt = e−t I + (e−t − e−2t )A
(139)
f (λ) = q(λ)p(λ) + r(λ)
(140)
de donde
con lo cual
Queda por discutir el caso en que dos o más valores propios son iguales.
En ese caso, algunas de las ecuaciones (131) serán iguales, y el sistema no será
suficiente para determinar todos los coeficientes. Supongamos que un valor
propio λi está repetido m veces. Eso significa que el polinomio caracterı́stico
contendrá un factor (λ − λi )m . Si volvemos a
y como las m − 1 derivadas primeras de (λ − λi )m son cero en λ = λi , se
añaden a la ecuación anterior las m − 1 ecuaciones
f ′ (λ)
f ′′ (λ)
···
m−1
f
(λ)
=
=
=
=
83
r′ (λ)
r′′ (λ)
···
rm−1 (λ)
(141)
(evaluadas en λ = λi ). Estas ecuaciones, combinadas con el resto de
f (λj ) = r(λj ) para j 6= i forman el conjunto requerido de n ecuaciones para
las n incógnitas βk . Como ejemplo trivial, considérese la matriz
A=
"
2 3
0 2
#
(142)
de ecuación caracterı́stica p(λ) = (2 − λ)2 = 0. Los dos valores propios
valen 2. La matriz exponencial es
eAt = β0 I + β1 A
(143)
donde los coeficientes se siguen del sistema
e2t = β0 + 2β1
te2t = β1
8
(144)
Bibliografı́a
Prácticamente, la única fuente en español para el estudio de los sistemas
electro-mecánicos bajo el punto de vista de la mecánica de Lagrange es el
excelente y en muchos aspectos no superado ”Dinámica de Lagrange”, de
Dare A. Wells.
9
Resumen conceptual
1. Analogı́a entre sistemas mecánicos y eléctricos.
2. Necesidad de una formulación escalar de la mecánica.
3. Principio de D’Alembert y ecuaciones de Lagrange.
4. Energı́a cinética, potencial y función de Rayleigh para sistemas eléctricos.
5. Sistemas lineales. Teorema de Cayley-Hamilton y cálculo de la matriz
exponencial.
84
10
Ejercicios
1. Escribir la energı́a cinética de una masa m que se mueve en el espacio
tomando como coordenadas generalizadas las coordenadas polares de
su posición.
2. Encontrar la energı́a cinética de una barra uniforme de longitud l y
masa m que es lanzada al aire de forma arbitraria.
3. Escribir las funciones de Lagrange para los dos sistemas de la Figura
7.
Figura 7
4. Un solenoide muy largo de sección circular, con N1 espiras por unidad
de longitud, contiene en su interior otro solenoide circular, con N2 espiras por unidad de longitud, montado sobre apoyos lisos (sin rozamiento)
que puede girar como se muestra en la Figura 8a. Al giro se opone un
resorte espiral de constante k. Las bobinas se conectan a circuitos
independientes, como se muestra en 8b. Si la inducción mutua entre
bobinas es
M12 = bπr2 N1 N2 sin θ = a sin θ
siendo b y a ciertas constantes, demostrar que la Lagrangiana es
85
(145)
Figura 8
L =
1
1
1
M11 q̇12 + M22 q̇22 + I θ̇2
2
2
2
1
+aq̇1 q̇2 sin θ + u1 q1 + u0 q2 sin ωt − kθ2
2
(146)
y escribir las ecuaciones del movimiento. I es el momento de inercia
del solenoide interior, y su energı́a cinética es (1/2)I θ̇2 .
5. Encontrar las ecuaciones del movimiento del sistema de la Figura 9,
sabiendo que
L(x) = N 2 µ0
siendo A el área transversal del núcleo.
Figura 9
86
A
x2
(147)
IV
La máquina simple
1
Motivación
La máquina eléctrica más sencilla concebible consiste en un simple conductor en movimiento en un campo magnético. A pesar de su simplicidad, se
muestran los elementos básicos que rigen el comportamiento de cualquier
otra máquina, y de ahı́ el interés en estudiarla.
2
La máquina simple
La máquina simple consiste en dos conductores paralelos entre los que puede
establecerse una diferencia de potencial V. Un segmento conductor, que
desliza sobre los anteriores y se dispone perpendicular a los mismos, cierra
el circuito. El conjunto se considera sometido a la influencia de un campo
magnético que en la Figura 1 hemos establecido como entrante al plano del
dibujo.
Figura 1
Veamos qué ocurre al establecer la diferencia de potencial V con el circuito cerrado, y para ello aislamos mentalmente un electrón. Al iniciarse la
corriente, los electrones se mueve en sentido contrario al convencional de la
intensidad, en nuestro caso de P a Q. Al hacerlo, el electrón experimenta
una fuerza F̄1 = −e(ū × B̄). Como consecuencia, el segmento P Q inicia un
movimiento hacia la derecha. Al moverse, adquire una velocidad v̄, y aparece
la fuerza de Lorentz F̄2 = −e(v̄ × B̄) que está dirigida en sentido QP . Para
el electrón del conductor, éste está en reposo, ası́ que interpreta la fuerza F̄2
87
como procedente de un campo Ēc en sentido P Q. Aparece en el conductor,
de acuerdo con II.88, una fuerza electro-motriz
E=
Z
Q
P
ĒC · d¯l
(1)
que se opone a V. Esta fuerza electro-motriz, que depende de Ēc , que
depende de v̄, aumenta con v̄, hasta un punto en que ya no circulará corriente
en el segmento P Q, al ser E = V e
V −E
(2)
R
Esta es una descripción semicualitativa, porque descansa en ū, que es la
velocidad con que se mueve el electrón en el conductor al establecer V. Pero
esa velocidad no se puede medir. También, porque el razonamiento se refiere
a un único electrón, que puede aislarse mentalmente, pero no fı́sicamente. Lo
que procede por tanto es pasar el razonamiento a un contexto macroscópico,
con cantidades medibles. En primer lugar, para un pequeño segmento d¯l del
conductor P Q, la fuerza que aparece al conectar V es
i=
dF̄1 = −ρdV (ū × B̄)
(3)
donde ρ es la densidad volúmica de electrones y el signo ’–’ indica carga
negativa. Esto se puede poner
dF̄1 = −dV (ρū × B̄) = −dSdl(j̄ × B̄)
(4)
dF̄1 = −jdS(d¯l × B̄) = −i(d¯l × B̄)
(5)
y como j̄ y d¯l son paralelos:
e integrando desde P a Q,
F̄1 = −i¯l × B̄
(6)
Para nuestra geometrı́a, F1 = −ilB. Por otro lado Ēc , que es fuerza por
unidad de carga, es una constante para toda la longitud del segmento P Q,
ya que su valor es v̄ × B̄, ası́ que
E=
Z
Q
P
Ēc · d¯l = lv̄ × B̄
(7)
que para nuestra geometrı́a da E = lvB.
Si al movimiento de P Q se opone una fuerza de naturaleza mecánica, F̄m ,
se alcanzará un cierto equilibrio cuando |F1 | = |Fm |:
88
|F̄1 | = |F̄m | = ilB =
V −E
lB
R
(8)
y siendo E = lvB:
VlB l2 B 2
−
v
R
R
La velocidad a la que se alcanza este equilibrio es
|F̄1 | = |F̄m | =
v0 =
V
R|Fm |
− 2 2
lB
l B
(9)
(10)
A la velocidad de equilibrio ”en vacı́o”, es decir, cuando la máquina funciona sin resistencia mecánica, se le llama ”velocidad sincrónica”, y es
V
(11)
lB
En resumen: al suministrar corriente a la máquina mediante V, P Q
comienza a moverse. El sistema funciona entonces como motor. El motor acelera su velocidad, y al hacerlo aumenta E. Si no hay resistencia, lo
hace hasta el punto en que se compensa totalmente con V, y deja de circular
corriente, puesto que
vs =
V −E
(12)
R
se ha alcanzado entonces vs . Si hay fuerzas mecánicas que vencer, la
velocidad que se alcanza es la dada por (10). Al representar F1 en función de
la velocidad se obtiene una recta de ordenada en el origen VlB/R y pendiente
−l2 B 2 /R, que será cortada en algún punto por la curva que represente a
Fm . El punto de corte se produce precisamente a v0 . Como o bien Fm es
una constante, o bien una función creciente de la velocidad, al aumentar V,
que sólo afecta a la ordenada en el origen, se tiene una recta paralela a la
original, pero desplazada hacia arriba. Entonces, el punto de corte con Fm
se desplazará a la derecha, es decir, se incrementará la velocidad v0 .
Por otro lado, cuando V = 0 y se usa una fuerza mecánica para desplazar
al segmento P Q a una velocidad v, aparece una fuerza electromotriz inducida
E y por tanto una corriente
i=
E
R
El sistema funciona entonces como generador.
i=
89
(13)
3
Hacia el motor real
En la sección anterior hemos tratado con el motor más sencillo que nos ha
permitido ver la interrelación electro-magneto-mecánica. En esta nos acercamos más al funcionamiento de los motores reales, e introducimos nuevos
conceptos. Sin embargo, seguiremos tratando con sistemas muy simples. El
”motor” más simple que puede concebirse es aún más simple que el de la
sección anterior. Consiste en un imán que se mueve manualmente bajo la
superficie de una mesa de madera o cristal. Sobre la misma se coloca otro
imán. Se ve que al mover el imán bajo la mesa, éste arrastra al que está sobre
ella. En terminologı́a de motores, la pieza que arrastra se llama estator, y la
pieza arrastrada rotor. El estator se mueve algo por delante del rotor, pero
ambos a la misma velocidad. A los motores en que ambas partes se mueven
a la misma velocidad se les llama motores sı́ncronos.
Es evidente también que se obtiene el mismo resultado si en el ejemplo
anterior los imanes permanentes se sustituyen por electroimanes. Un sistema
ası́, en el cual el estator se mueve linealmente se denomina motor sı́ncrono
lineal, y se muestra en la Figura 2. Es importante el espacio de separación
entre las dos piezas. A esta separación g se le llama con su nombre anglosajón,
gap (Mind the gap!) y es un importante factor porque, como veremos, la
mayor densidad de energı́a magnética se encuentra ahı́. La versión rotativa
se muestra en la Figura 3. Los detalles constructivos de cómo se alimentan
estator y rotor cuando no están fijos, sino girando, podemos omitirlos. Aquı́,
la fuerza de arrastre del estator sobre el rotor depende del ángulo δ, en la
forma
Fm = Fmax sin δ
(14)
y es nula cuando δ = 0. En efecto, cuando ambas piezas están alineadas,
la fuerza se dirige a lo largo del eje principal y el momento de giro que se
ejerce sobre el rotor es nulo. Es máximo cuando δ = π/2.
Desde un punto de vista general, entre la energı́a eléctrica que se suministra al motor y la energı́a mecánica que se obtiene, o al revés cuando se
trata de un generador, lo que tenemos es el campo magnético. El campo
magnético es el intermediario en la conversión energı́a mecánica ↔ energı́a
eléctrica.
4
Energı́a del campo magnético
Consideremos un sistema de dos partes, tal y como se muestra en la Figura
4. La parte que llamamos ”primaria” se alimenta con una corriente i1 , y
90
Figura 2
Figura 3
permanece fija. La parte que llamamos ”secundaria” es móvil, y se encuentra
separada por una distancia g de la primaria. Supongamos que incrementamos
en el primario la intensidad desde 0 a un valor i1 . Como consecuencia, el
flujo magnético en el interior del primario aumenta desde 0 a Φ1 . Como Φ1
depende del número de vueltas del cable alrededor del primario, n, pongamos
Φ1 = nΦ = λ. En un caso ideal λ es proporcional a i (véase por ejemplo
II.99), con constante de proporcionalidad L. En un caso real la relación no
es lineal, sino que se parece a la de la Figura 5. En el circuito del primario
sabemos que
u1 = Ri + L
La potencia eléctrica suministrada es
91
di
dt
(15)
Figura 4
Figura 5
92
Figura 6
dWe
di
= u1 i = Ri2 + Li
(16)
dt
dt
El incremento de energı́a eléctrica suministrada a la bobina que rodea al
primario es
Pe =
di
dt = Lidi = idλ
(17)
dt
Este incremento se transforma en energı́a magnética, Wb , de forma que
dWe = dWb . Volviendo a la Figura 5, dWe es la banda rayada en negro. La
zona rayada en amarillo representa la energı́a suministrada a la bobina, que
es
dWe = Li
We =
Z
λ1
0
idλ
(18)
Es útil visualizar el flujo magnético como una ”corriente” que circula
enlazando primario y secundario. Y es evidente que esta corriente se interrumpe si g se hace muy grande. Si se incrementa un poco, habrá que
incrementar i en el primario para mantener el mismo flujo, lo cual significa
que la curva λ(i) se hace más plana, aproximándose a la lı́nea recta, como
se muestra en la Figura 6. El gap es una especie de resistencia al flujo, que
se vence aumentando la intensidad, de la misma forma que en un circuito
eléctrico una resistencia R limita la corriente eléctrica, y ésta se puede mantener aumentando el voltaje. Ası́ que, llegados a este punto, se puede hacer
un paralelismo entre los circuitos eléctricos y los circuitos magnéticos:
93
Figura 7
Circuito eléctrico
Corriente i
Voltaje u
Resistencia R
Ley de Ohm: i = u/R
Circuito magnético
Flujo Φ
Fuerza magneto-motriz ni
Reluctancia Rm
Ley de Ohm: Φ = in/Rm
El paralelismo se puede llevar más lejos aún, pues sabemos que la resistencia eléctrica (II.83) tiene la forma
l
(19)
σA
donde A es la sección del conductor, l su longitud y σ la inversa de la
resistividad. En un circuito magnético,
R=
Rm =
l
µA
(20)
donde l es su longitud, A su sección y µ la permeabilidad magnética. Este
planteamiento se puede considerar fenomenológico: se observa un efecto, que
se relaciona con una causa, y, como es costumbre, se supone la relación más
sencilla posible útil para explicar las observaciones. En nuestro caso, el efecto
es el flujo magnético, y la causa es la intensidad que circula por el primario.
La relación más sencilla es lineal, y la hemos escrito como Φ = ni/Rm .
Con esto, el sistema de la Figura 4 lo podemos representar como un
circuito magnético, tal como el de la Figura 7, donde Fb es la fuerza magnetomotriz, Rc y Rg las reluctancias del núcleo y del gap y Φ el flujo magnético.
Sabemos que Φ = BA, donde A es la sección transversal del circuito y que
94
Figura 8
ni = Rm Φ = Hl
(21)
ası́ que, en relación con el circuito de la Figura 7, escribimos
ni = Hc lc + Hg lg
(22)
y como λ = nΦ = nBA, tenemos
(Hc lc + Hg lg )
nAdB
n
en el gap, Hg = B/µ0 , y efectuando la integración
Wb =
Wb = V c
Z
Z
idλ =
Z
Hc dB + Vg
B2
= wbc Vc + wbg Vg
2µ0
(23)
(24)
donde Vc y Vg son los volúmenes del núcleo y del gap y wbc y wbg son
las densidades de energı́a respectivas. En el caso en que el núcleo sea lineal,
Hc = Bc /µc .
Volvamos a la Figura 4. Si el secundario se encuentra en la posición x1 y
pasa a la posición x2 , reduciendo el gap, en igualdad de las demás condiciones
la curva caracterı́stica pasa de λ(x1 ) a λ(x2 ). En el proceso, el incremento
en la energı́a eléctrica ha sido
dWe = i(λ2 − λ1 )
(25)
que se corresponde con el área abcd de la Figura 8. El incremento en la
energı́a del campo es la diferencia entre las áreas obc y oad. Como ha sido
preciso ejercer una cierta fuerza para mover el secundario desde x1 a x2 , se
ha realizado un trabajo mecánico también, ası́ que el incremento dWe se ha
95
invertido en dWb + dWm , donde Wm es el trabajo mecánico. En la Figura 8,
llamemos a1 al área cbed, a2 a bae, a3 a deo y a4 a eao. Como dWe = a1 + a2
y dWb = a1 + a3 − a4 − a3 = a1 − a4 , se sigue de dWe = dWb + dWm que
dWm = a2 + a4 , que es la zona rayada en la Figura.
Es útil introducir aquı́ el concepto de co-energı́a. En la Figura 5, la
co-energı́a es el área bajo la curva λ(i). La llamamos Wb′ , de forma que
Wb + Wb′ = iλ. En términos de co-energı́a, vemos que dWm = dWb′ , y si dWm
se ha producido por la acción de una fuerza f en el incremento dx, entonces
f dx = dWb′ , lo cual quiere decir que
∂Wb′
(26)
∂x
y este es el enlace entre la fuerza mecánica y el campo eléctrico, ya que
Wb′ depende a través de la curva λ(i) de la energı́a eléctrica suministrada
mediante i. Aquı́ se ve cuantitativamente lo que afirmábamos antes: que el
campo magnético es el intermediario en la conversión de energı́a mecánica en
eléctrica y viceversa.
Una vez introducidos todos los elementos necesarios, volvemos al sistema
lineal de la Figura 2. Despreciamos la reluctancia del núcleo y asumimos
comportamiento lineal, con λ = Li; como además
f=
λ = nΦ = n
ni
n2 Aµ0
i
=
Rm
g
(27)
n2 Aµ0
g
(28)
se sigue que
L=
es decir, que L depende del gap y es por tanto una función de x: λ = L(x)i,
de donde calculamos la co-energı́a:
1
λdi = L(x)i2
2
0
Ahora podemos calcular la fuerza magnética sobre el secundario:
Wb′ =
Z
i
(29)
1 dL(x)
∂ 1
L(x)i2 = i2
(30)
∂x 2
2
dx
Nótese que, si el sistema es lineal, entonces Wb = Wb′ : energı́a y co-energı́a
son iguales.
Podemos usar los resultados anteriores para calcular la fuerza de arrastre
del estator sobre el rotor en el motor sı́ncrono lineal. Ahora g depende del
retraso que lleve el rotor respecto al estator. Se comprende entonces que si
fb =
96
el ”rotor” es infinitamente largo, no importa lo intenso que sea el campo del
estator que no se generará ningún arrastre.
4.1
Corrientes en estator y rotor
Ampliemos los razonamientos anteriores al caso en que circula corriente
también por el secundario. Suponemos que ambas partes están en reposo
y que la energı́a eléctrica suministrada se almacena en el campo magnético.
Entonces
dWb = dWe = e1 i1 dt + e2 i2 dt = i1 dλ1 + i2 dλ2
(31)
Si el sistema es lineal:
λ1 = L1 i1 + L12 i2
λ2 = L12 i1 + L2 i2
(32)
y en estos sabemos que la energı́a es igual a la co-energı́a, luego
1
1
λ1 di1 + λ2 di2 = L1 i21 + L2 i22 + L12 i1 i2
(33)
2
2
0,0
Nótese cómo esta expresión es un caso particular de III.58. De aquı́
Wb =
Wb′
=
Z
i1 ,i2
∂Wb′
1 dL1 1 2 dL2
dL12
= i21
+ i2
+ i1 i2
(34)
∂x
2 dx
2 dx
dx
Si reunimos las ecuaciones para la parte eléctrica y para la parte mecánica,
teniendo en cuenta la presencia de las dos corrientes y la inducción mutua,
tenemos, para la parte eléctrica:
fb =
dλ1
dt
dλ2
= i2 R 2 +
dt
u1 = i 1 R 1 +
u2
(35)
donde ∂λ1,2 /∂t son las fuerzas electromotrices inducidas. Para la parte
mecánica, si m es la masa que ha de moverse:
d2 x
dx
− fr
(36)
=
f
−
β
m
dt2
dt
donde fm es la fuerza magnética, fr una resistencia a vencer (la máquina
se construye precisamente para vencer la resistencia fr ) y el término βdx/dt
m
97
la fricción que se opone al movimiento. En cuanto a las derivadas, si el
sistema es lineal:
dλ1
d
d
= e1 = (L1 (x)i1 ) + (L12 (x)i2 )
dt
dt
dt
di1
dL1 dx
di2
dL12 dx
= L1 (x)
+ i1
+ L12
+ i2
dt
dx dt
dt
dx dt
(37)
con una expresión similar para λ2 . Y en cuanto a fm , es la derivada de
la co-energı́a, que es igual a la energı́a si el sistema es lineal.
5
Motores rotatorios sencillos
Si vamos a la definición de fuerza generalizada en III.9:
Qj =
X
j
F̄i ·
∂r̄i
∂qj
(38)
vemos que la fuerza generalizada que corresponde a una coordenada generalizada angular tiene dimensiones de fuerza por distancia, es decir, de
par. Pero en III.17 vemos que Qj tiene a su vez las mismas dimensiones que
∂T /∂qj . Luego la derivada de una energı́a respecto a una variable angular es
un par. Como la energı́a y la co-energı́a tienen las mismas dimensiones, se
concluye que el par entregado por una máquina rotatoria es
∂Wb′
Π=
∂θ
(39)
En general, será
dL12
1 dL1 1 2 dL2
+ i2
+ i1 i2
(40)
Π = i21
2 dθ
2 dθ
dθ
En el sistema de la Figura 9, la autoinducción L1 no depende de la posición
del rotor, luego para esto motor:
1 dL2
dL12
Π = i22
+ i1 i2
(41)
2 dθ
dθ
En un motor en el que el estator y el rotor son cilı́ndricos y por construcción las autoinducciones son independientes del ángulo θ del rotor respecto a una dirección de referencia, no hay más que término de inducción
mutua, y el par es
98
Figura 9
dL12
(42)
dθ
con L12 = M cos θ si M es el pico de inducción mutua, que se alcanza
cuando están alineados los ejes magnéticos del estator y del rotor y θ es el
ángulo que forman ambos ejes. Se entiende entonces que como dirección de
referencia se toma el eje magnético del estator. Si las corrientes son
Π = i1 i2
i1 = I1 cos ω1 t
i2 = I2 cos(ω2 t + α)
(43)
θ = ωm t + δ
(44)
y
donde ωm es la velocidad angular del rotor y δ es la posición del rotor en
t = 0, entonces
Π = −I1 I2 M cos ω1 t cos(ω2 t + α) sin(ωm t + δ)
(45)
Hay dos casos prácticos:
a) ω2 = 0, α = 0, ω1 = ωm . El estator se alimenta con corriente alterna y
el rotor con corriente continua. El rotor gira a la misma frecuencia angular a
la que se excita el primario. Estos son los motores monofásicos sincrónicos.
Particularizando:
Π = −I1 I2 M cos ω1 t sin(ω1 t + δ)
99
(46)
Aplicando la identidad trigonométrica
sin x cos y =
1
1
sin(x + y) + sin(x − y)
2
2
(47)
tenemos
I1 I2 M
[sin(2ω1 t + δ) + sin δ]
2
El promedio del primer término es nulo, y queda sólo el segundo:
Π=−
I1 I2 M
sin δ
2
Se ve que el promedio es máximo cuando δ = π/2.
Πm = −
(48)
(49)
b) ωm = ω1 − ω2 . La frecuencia angular del rotor no coincide ni con la de
excitación del estator ni con la del rotor. Por esta razón estos motores se llaman monofásicos asincrónicos. Aplicando la misma identidad trigonométrica
que hemos usado antes dos veces podemos poner la expresión general para
el par como la suma de cuatro términos sinusoidales. En efecto:
1
1
sin[(ωm + ω2 )t + α + δ] + sin[(ωm − ω2 )t + δ − α]
2
2
(50)
y ahora desarrollamos el producto de cada uno de ellos por cos ω1 t y
obtenemos los cuatro términos:
sin(ωm t + δ) cos(ω2 t + α) =
1
sin[(ωm + ω1 + ω2 )t + α + δ] +
4
1
sin[(ωm − ω1 + ω2 )t + α + δ] +
4
1
sin[(ωm + ω1 − ω2 )t − α + δ] +
4
1
sin[(ωm − ω1 − ω2 )t − α + δ]
(51)
4
de los cuales, el único cuyo promedio temporal es distinto de cero es el
segundo, resultando
I1 I2 M
sin(α + δ)
(52)
4
Se observa también que cuando ωm = 0 el par medio es cero: el motor
necesita ser llevado en un proceso de arranque a una ωm 6= 0 para que pueda
dar par.
Πm = −
100
6
Ecuaciones generales
Recapitulamos los resultados más importantes y agrupamos las ecuaciones
relevantes. Consideramos la parte eléctrica y la parte mecánica.
Para la parte eléctrica, el voltaje suministrado a estator y rotor se iguala
con la caı́da de potencial en las resistencias y la fuerza electro-motriz inducida. Esta última viene dada por la derivada temporal del flujo λ, que es
esencialmente el flujo debido a una espira por el número de espiras: λ = nΦ.
En los modelos lineales λ es una función lineal de la intensidad i. Esta
relación funcional λ(i), sea lineal o no, permite encontrar la co-energı́a Wb′ ,
de donde por derivación encontramos las fuerzas y pares magnéticos:
Wb′
=
Z
λ(i)di;
fm =
∂Wb′
∂q
!
(53)
donde q puede representar una coordenada lineal, o angular. El procedimiento es más sencillo cuando λ(i) es lineal. Si escribimos:
λ1 = L1 i1 + L12 i2
λ2 = L12 i1 + L2 i2
(54)
tenemos, cuando los coeficientes de inducción dependen del giro θ del
rotor:
dλ1
di1
dL1
= L1
+ i1
ωm
dt
dt
dθ
di2
dL12
+L12
+ i2
ωm
dt
dθ
di1
dL12
dλ2
= +L12
+ ii
ωm
dt
dt
dθ
dL2
di2
+ i2
ωm
+L2
dt
dθ
(55)
En cuanto a la parte mecánica, dado que la única parte móvil es el rotor:
dθ
d2 θ
+ β + Πl
(56)
2
dt
dt
donde Π es el par aplicado, y depende del tipo de motor y la forma
de alimentarlo, como hemos visto en la sección anterior, β el coeficiente de
rozamiento y Πl la carga que el motor ha de vencer.
Π=J
101
7
Bibliografı́a
Hemos seguido aquı́ más o menos ”Electromechanical energy conversion”, de
Ernest Mendrela. Como se ve, todo depende de dos puntos: a) la existencia de una relación λ(i), que si es lineal facilita mucho el análisis, y b) la
posibilidad de calcular los coeficientes de autoinducción e inducción mutua
Lij . Este punto se puede estudiar, por ejemplo, en ”Campos y ondas electromagnéticos” de P. Lorrain y D.R. Corson. En la página 368 y siguientes
de la edición española se pueden encontrar algunos ejemplos para geometrı́as
sencillas.
8
Resumen conceptual
1. Se plantea y discute la máquina simple, y se introducen la velocidad de
equilibrio y la velocidad sincrónica, ası́ como los regı́menes de generador
y motor.
2. Motores sincrónicos con diseño lineal y rotatorio.
3. Se introduce un modelo sencillo de primario-secundario y se analiza
el balance energético. Se introduce la relación λ(i) y se estudia la
influencia del ”gap”. Se introducen los circuitos magnéticos.
4. Energı́a y co-energı́a.
5. Ecuaciones generales para el modelo primario-secundario anterior cuando circula intensidad por las dos partes. Ecuaciones de la parte eléctrica
y de la parte mecánica.
6. Obtención del par como derivada de la co-energı́a.
7. El motor rotatorio monofásico sincrónico y asincrónico.
8. Ecuaciones generales.
9
Ejercicios
Los siguientes ejercicios están tomados de Fitzgerald, ”Electromechanical
energy conversion principles”, capı́tulo 3 de ”Electric machinery”.
1. Sea un rotor cilı́ndrico de 30 cm de longitud y 5 cm de radio (Figura
10). Este rotor se encuentra en un campo magnético uniforme B̄ de
102
Figura 10
Figura 11
0.02T que es perpendicular al eje del rotor. En la superficie del mismo,
siguiendo lı́neas paralelas al eje diametralmente opuestas, hay dos conductores por los que circulan corrientes de sentidos opuestos de 10A.
Si α es el ángulo que forma la lı́nea AB con el eje x, demostrar que el
par que experimenta el rotor es
Π = −0.006 sin α
N ·m
(57)
2. En el dispositivo de la Figura 11, calcular la energı́a magnética almacenada en el ”gap” suponiendo que N = 1000 vueltas, i = 10 A, g = 2.0
mm d = 0.15 m y l = 0.1 m. Se supone que la permeabilidad magnética
del núcleo tiende a ∞. Solución: de (27) y (29) Wb′ = 236(1 − x/d) J.
3. La inductancia de un solenoide fue medida en varias posiciones a lo
103
largo del eje x, resultando la tabla siguiente:
x cm
0.0
0.2
0.4
0.6
0.8
1.0
1.2
1.4
1.6
1.8
2.0
L(x)
2.80
2.26
1.78
1.52
1.34
1.26
1.20
1.16
1.13
1.11
1.10
Para i = 0.75 A, encontrar la fuerza que experimenta el solenoide.
Sugerencia: usando polyfit de Matlab ajustar un polinomio (de cuarto
orden es suficiente), de forma que se pueda expresar L(x) = a0 + a1 x +
a2 x2 + a3 x3 + a4 x4 y luego calcular la fuerza usando (30).
4. En el sistema de la Figura 12, el rotor es ovalado, lo que hace que el
”gap” sea variable. Cuando el eje del rotor forma un ángulo θ con el
eje del estator, L(θ) = L0 + L1 cos(2θ), con L0 = 10.6 mH y L1 = 2.7
mH. Demostrar que para una corriente de 2 A, el par que experimenta
el rotor es
1
Π(θ) = i2 (−2L1 sin θ) = −1.08 × 10−2 sin(2θ)
2
N ·m
(58)
5. En el segundo problema, si i(x) = i0 (x/d) A, demostrar que la fuerza
actuante sobre la pieza móvil es
f =−
i0 µ 0 N 2 l
4g
2
x
d
N
(59)
Encontrar la co-energı́a y comprobar que si calculamos la fuerza a partir
de ella como
f=
∂Wb′
∂x
no obtenemos el resultado (59), que proviene de (30). ¿Por qué?
104
(60)
Figura 12
Figura 13
6. En el sistema de la Figura 13, calcular el par sobre el rotor como una
función de θ. La longitud del rotor es h = 1.8 cm, con r1 = 2.5 cm y
g = 3 mm. Se supone que la reluctancia del núcleo y del propio rotor
es nula, con lo que la energı́a magnética se encuentra en el ”gap”, cuyo
volumen depende del ángulo θ. El flujo máximo a través del ”gap”
está limitado a 1.65 T, para evitar saturación. Sugerencia: obtener
una expresión para el volumen del ”gap” y tomar de (24) la densidad
de energı́a magnética. Luego obtener el par derivando respecto a θ.
105
V
La máquina generalizada
1
Motivación
El objeto de este capı́tulo es generalizar los resultados del anterior, presentando un modelo generalizado de máquina rotatoria, del cual los distintos
tipos de máquinas son casos particulares. Al hacerlo, plantearemos un sistema de seis ecuaciones diferenciales no lineales cuya resolución nos da la
evolución temporal de las variables eléctricas y mecánicas.
2
La máquina rotatoria generalizada
En general, las máquinas eléctricas tienen diseños rotatorios. El estator es
una carcasa cilı́ndrica, fija, y en su interior y concéntrico con él gira el rotor,
sujeto a un eje que se apoya en rodamientos. Hay varias razones para este
tipo de diseño, unas teóricas y otras prácticas. Si vamos a la Figura 1 de
IV, vemos que la fuerza magnética sobre un conductor y el campo inducido
son máximos cuando la velocidad v̄ del movimiento del conductor, el campo
magnético y el elemento de corriente son mutuamente perpendiculares. En
el diseño cilı́ndrico por tanto es preciso hacer que el campo magnético sea
perpendicular al movimiento del rotor, y como el movimiento del rotor es
circular, se sigue que el campo ha de ser radial, o lo más cercano a eso que
se pueda conseguir. Por otro lado, como ∇ · B̄ = 0, si aplicamos el teorema
de la divergencia al cilindro del rotor, la integral de superficie B̄ · dS̄ será
nula. Esto significa que habrá tantas lı́neas entrantes como salientes en el
cilindro. Esto significa a su vez que si hacemos un recorrido que dé la vuelta
al cilindro, desde ϕ = 0 hasta ϕ = 2π y registramos B̄ como función de
ϕ, ha de ocurrir: 1) que en la gráfica correspondiente el área bajo el eje ϕ
sea igual al área sobre la misma; 2) que B̄ sea función periódica de ϕ. Una
representación de las lı́neas de campo es la de la Figura 1.
El punto en que B̄ entra perpendicularmente a la sección normal al cilindro se denomina ”polo sur”, y el punto en que B̄ sale perpendicularmente
”polo norte”. Al ser B̄ periódico, lo será cualquiera de sus componentes, luego
se podrá escribir como un desarrollo en serie de Fourier, luego podemos hacer
el análisis para la frecuencia fundamental. Si la componente principal de B̄ es
sinusoidal, esto significa que existen dos ejes, que llamaremos α y β, perpendiculares entre sı́, de forma que B̄ = B̄α + B̄β , como muestra la Figura 2. Es
decir, que B̄ se puede conseguir como superposición o suma vectorial de dos
106
Figura 1
Figura 2
campos perpendiculares. Entonces, el campo creado por el estator se puede
representar por dos bobinas mutuamente perpendiculares, cuyos campos, al
variar en el tiempo, hacen rotar a B̄ en el plano (α, β). Con un razonamiento
similar para el campo del rotor, podemos modelar la máquina rotatoria como
un sistema de dos pares de campos creados por dos pares de bobinas, como
se muestra en la Figura 3, alimentadas por intensidades (ieα , ieβ , irα , irβ ) donde
los subı́ndices ’e’ y ’r’ significan respectivamente ”estator” y ”rotor”.
Colineal con el eje común a ambos cilindros está el eje mecánico, que se
mueve con velocidad angular θ (la del rotor). Si escribimos en forma vectorial
las relaciones entre λ e i, poniendo λ̄ = Lī, donde
107
Figura 3

λeα
λeβ
λrα
λrβ

(1)

ieα
ieβ
irα
irβ

(2)



λ̄ = 
e

ī = 










y L es la matriz de inducciones, tenemos para la parte eléctrica
d
dλ̄
= Rī + (Lī)
(3)
dt
dt
donde R es la matriz de resistencias. Como la resistencia en el circuito
que alimenta a la bobina j depende sólo de la intensidad que circula por ese
circuito, la matriz R es diagonal. Por otro lado
ū = Rī +
dī
dL
d
(Lī) = L + θ̇ī
dt
dt
dθ
Ahora, calculamos la co-energı́a
108
(4)
Wc′ =
Z
C
λ̄ · dī =
Z
ī
0̄
Lī′ dī′
(5)
donde el camino de integración lleva desde ī′ = 0̄ hasta ī′ = ī. Como L
no depende de las intensidades,
1
Wb′ = īT Lī
2
Y, finalmente, el par entregado por el motor es
1
dL
∂Wb′
= īT ·
· ī
Π=
∂θ
2
dθ
2.1
(6)
(7)
La matriz de inductancias
Falta darle forma a la matriz L. Los coeficientes no dependen de las intensidades, sino de la geometrı́a. Se puede ver esto considerando dos casos
extremos. En el primero tenemos dos bobinas situadas en planos paralelos.
El flujo que atraviesa una de ellas debido a la corriente que circula por la
otra, es máximo. Pero si las bobinas están en planos perpendiculares, el flujo
que atraviesa una de ellas es debido a la corriente que circula por la otra es
mı́nimo, como se ve en la Figura 4.
Figura 4
Con esto en mente, se ve que en la matriz L: 1) los elementos diagonales
son constantes, ya que la autoinducción de una bobina no depende de su
109
orientación respecto a otros cuerpos; 2) la influencia entre las bobinas del
rotor es mı́nima, ya que son perpendiculares. En nuestro modelo, damos
a estos elementos el valor 0; 3) Las inducciones mutuas de una bobina del
estator (rotor) con las otras dos del rotor (estator) dependen del coseno del
ángulo que forman (para que sea máxima si este ángulo es cero y mı́nima si
es de π/2). En definitiva:




L=
Lee
0
Ler cos θ −Ler sin θ
0
Lee
Ler sin θ Ler cos θ
er
er
L cos θ L sin θ
Lrr
0
er
er
−L sin θ L cos θ
0
Lrr





(8)
donde hemos supuesto además que las dos bobinas del estator son iguales
y que las dos bobinas del rotor también son iguales (L11 = L22 y L33 = L44 ).
A partir de aquı́ calculamos:

dL 

=

dθ
0
0
−Ler sin θ −Ler cos θ
0
0
Ler cos θ −Ler sin θ
−Ler sin θ Ler cos θ
0
0
−Ler cos θ −Ler sin θ
0
0
y el par es entonces





(9)
∂Wc′
dL
Π =
= īT ·
· ī
∂θ
dθ


= [ieα ieβ irα irβ ] 


0
0
−Ler sin θ −Ler cos θ
0
0
Ler cos θ −Ler sin θ
−Ler sin θ Ler cos θ
0
0
−Ler cos θ −Ler sin θ
0
0
= Ler sin θ(−ieα irα − ieβ irβ ) + Ler cos θ(−ieα irβ + ieβ irα )





ieα
ieβ
irα
irβ





(10)
Debido a los productos cruzados, si las corrientes del estator son nulas, o
las corrientes del rotor son nulas, entonces Π = 0. Además, si las corrientes
son todas constantes, el par serı́a
Π = Ler (p sin θ + q cos θ)
(11)
con p y q constantes, cuya media en una revolución completa es nula. Por
tanto, un motor no puede funcionar si por sus bobinas circula sólo corriente
continua. En general, calculamos el par promedio en una vuelta como
110
1 Z 2π er
L (j1 sin θ + j2 cos θ)dθ
Π=
2π 0
donde j1 = −ieα irα − ieβ irβ y j2 = −ieα irβ + ieβ irα .
3
(12)
Planteamiento y solución numérica del problema
Las ecuaciones que determinan el movimiento del sistema son entonces:
ū = Rī + L
J
dī
dL
+ θ̇ ī
dt
dθ
d2 θ
dθ
= Π − Πr − β
2
dt
dt
(13)
siendo Πr el par resistente que se ha de vencer mediante Π y β el coeficiente de fricción. Π viene dado por
Π=
∂Wb′
∂θ
(14)
y a su vez
1
(15)
Wb′ = īT Lī
2
La primera ecuación es una ecuación vectorial con cuatro componente
escalares. La segunda ecuación, por ser de segundo orden, se puede desdoblar
en dos ecuaciones de primer orden. El acoplamiento entre la parte eléctrica
y la parte mecánica viene a) por el hecho de que L es función de θ y b) en
la parte mecánica, el par Π es función de las corrientes. Juntas las partes
eléctrica y mecánica forman un sistema de seis ecuaciones diferenciales no
lineales de primer orden. Introduzcamos las variables de estado:





x̄ = 




x1 = ieα
x2 = ieβ
x3 = irα
x4 = irβ
x5 = θ
x6 = θ̇
y en función de ellas, nuestro sistema:
111










(16)
ueα = Rαe x1 + Lee ẋ1 + Ler ẋ3 cos x5 − Ler ẋ4 sin x5
−Ler x3 x6 sin x5 − Ler x4 x6 cos x5
ueβ = Rβe x2 + Lee ẋ2 + Ler ẋ3 sin x5 + Ler ẋ4 cos x5
Ler x3 x6 cos x5 − Ler x4 x6 sin x5
urα = Rαr x3 + Ler ẋ1 cos x5 + Ler ẋ2 sin x5 + Lrr ẋ3
−Ler x1 x6 sin x5 + Ler x2 x6 cos x5
urβ = Rβr x4 − Ler ẋ1 sin x5 + Ler ẋ2 cos x5 + Lrr ẋ4
−Ler x1 x6 cos x5 − Ler x2 x6 sin x5
ẋ5 = x6
Ler
Ler
(−x1 x3 − x2 x4 ) sin x5 +
(−x1 x4 + x2 x3 ) cos x5
ẋ6 =
J
J
Πr
−
− βx6
J
(17)
El problema con este sistema, escrito tal como está, es que los métodos
numéricos habituales, por ejemplo los métodos de Runge-Kutta, tratan con
sistemas de ecuaciones donde cada ecuación es de la forma ẋi = fi (x1 , x2 , · · ·).
A esta forma se ajustan las dos últimas ecuaciones, pero no las cuatro
primeras, donde aparecen combinaciones de las derivadas. Para reescribir
las cuatro primeras ecuaciones en forma adecuada, vemos que, tal y como
están, se pueden reordenar en la forma





Lee
0
Ler cos x5 −Ler sin x5
0
Lee
Ler sin x5 Ler cos x5
er
er
L cos x5 L sin x5
Lrr
0
er
er
−L sin x5 L cos x5
0
Lrr





ẋ1
ẋ2
ẋ3
ẋ4






=


f1
f2
f3
f4





(18)
donde
f1
f2
f3
f4
=
=
=
=
ueα − Rαe x1 + Ler x3 x6 sin x5 + Ler x4 x6 cos x5
ueβ − Rβe x2 − Ler x3 x6 cos x5 + Ler x4 x6 sin x5
urα − Rαr x3 + Ler x1 x6 sin x5 − Ler x2 x6 cos x5
urβ − Rβr x4 + Ler x1 x6 cos x5 + Ler x2 x6 sin x5
(19)
Entonces, las cuatro primeras ecuaciones, escritas en la forma adecuada
para su resolución numérica aparecen como
112





ẋ1
ẋ2
ẋ3
ẋ4






=


Lee
0
Ler cos x5 −Ler sin x5
ee
0
L
Ler sin x5 Ler cos x5
Ler cos x5 Ler sin x5
Lrr
0
er
er
−L sin x5 L cos x5
0
Lrr
−1 








f1
f2
f3
f4





(20)
La inversa de la matriz existe siempre que se cumpla la condición de que
Ler Ler 6= Lee Lrr , y viene dada por
1
er
er
L L − Lee Lrr





−Lrr
0
Ler cos x5 −Ler sin x5
0
−Lrr
Ler sin x5 Ler cos x5
Ler cos x5 Ler sin x5
−Lee
0
er
er
−L sin x5 L cos x5
0
−Lee





(21)
Ahora ya podemos escribir un sistema adecuado para su resolución numérica:
Lrr
Ler
Ler
f1 +
f3 cos x5 −
f4 sin x5
∆
∆
∆
Lrr
Ler
Ler
−
f2 +
f3 sin x5 +
f4 cos x5
∆
∆
∆
Ler
Lee
Ler
f1 cos x5 +
f2 sin x5 −
f3
∆
∆
∆
Ler
Ler
Lee
−
f1 sin x5 +
f2 cos x5 −
f4
∆
∆
∆
f5
f6
ẋ1 = −
ẋ2 =
ẋ3 =
ẋ4 =
ẋ5 =
ẋ6 =
(22)
donde hemos introducido
∆ = Ler Ler − Lee Lrr
f 5 = x6
Ler
Ler
f6 =
(−x1 x2 − x2 x4 ) sin x5 +
(−x1 x4 + x2 x3 ) cos x5
J
J
Πr
− βx6
−
J
3.1
(23)
Método de Runge-Kutta de cuarto orden
Existen muchos tratados de cálculo numérico donde se explican los métodos
de integración de sistemas de ecuaciones diferenciales. Aquı́ damos la explicación de uno de estos métodos, probablemente el más popular, no por
113
añadir nada a lo ya escrito en otros lugares, sino por hacer estas notas en lo
posible auto-contenidas y facilitar el camino al estudiante.
El método de Runge-Kutta de cuarto orden es un método popular, sencillo
de programar, relativamente rápido y en la mayor parte de las ocasiones de
suficiente precisión, que permite resolver sistemas de ecuaciones diferenciales
de primer orden de la forma:
ẋ1
ẋ2
ẋ3
..
.
= f1 (x1 , x2 , · · ·)
= f2 (x1 , x2 , · · ·)
= f3 (x1 , x2 , · · ·)
.
= ..
(24)
No vamos a discutir la forma en que se obtiene dicho método, sino simplemente describir el algoritmo. Antes de eso, conviene aclarar la naturaleza de
todos estos métodos. Una integración numérica no nos proporciona la función
x(t), sino una serie de valores de x para instantes t1 , t2 , t3 ...tn . Aunque existen métodos de paso variable donde los intervalos ti+1 − ti dependen de i, en
la mayorı́a de las ocasiones, para todos los i, la diferencia ti+1 −ti es una constante h, de manera que si partimos desde un instante inicial t0 , ti = t0 + ih.
Todos estos métodos requieren el conocimiento de un estado inicial a partir
del cual calcular estados sucesivos.
En primer lugar, para ecuaciones simples de la forma ẋ = f (x, t). El
método de Runge-Kutta parte de un valor xk (indicamos ası́ x(tk )) y calcula
el valor xk+1 . Si fijamos h (por ejemplo, h = 0.1 cuando deseamos conocer x
de décima en décima de segundo) el algoritmo sigue los siguientes pasos:
1. Calcular k1 = hf (xk , tk )
2. Calcular k2 = hf (xk + k1 /2, tk + h/2)
3. Calcular k3 = hf (xk + k2 /2, tk + h/2)
4. Calcular k4 = hf (xk + k3 , tk + h)
5. Calcular xk+1 = xk + 61 [k1 + 2k2 + 2k3 + k4 ]
En general, los sistemas dinámicos vienen descritos no por una sola variable, sino por varias. Por consiguiente, necesitamos generalizar el algoritmo
para el caso en que queremos integrar no una ecuación sino un conjunto de
ellas. Daremos el algoritmo explı́cito para un sistema de dos ecuaciones.
114
La generalización para un número cualquiera es inmediata y se deja como
ejercicio al lector. Sea el sistema:
ẋ = f (x, y, t)
ẏ = g(x, y, t)
(25)
Dados unos valores xk e yk , el algoritmo sigue los siguientes pasos:
1. Calcular k1 = hf (xk , yk , tk )
2. Calcular n1 = hg(xk , yk , tk )
3. Calcular k2 = hf (xk + k1 /2, yk + n1 /2, tk + h/2)
4. Calcular n2 = hg(xk + k1 /2, yk + n1 /2, tk + h/2)
5. Calcular k3 = hf (xk + k2 /2, yk + n2 /2, tk + h/2)
6. Calcular n3 = hg(xk + k2 /2, yk + n2 /2, tk + h/2)
7. Calcular k4 = hf (xk + k3 , yk + n3 , tk + h)
8. Calcular n4 = hg(xk + k3 , yk + n3 , tk + h)
9. Calcular xk+1 = xk + 61 [k1 + 2k2 + 2k3 + k4 ]
10. Calcular yk+1 = yk + 16 [n1 + 2n2 + 2n3 + n4 ]
4
Transformación de coordenadas
Es evidente la complejidad del sistema de ecuaciones anterior, lo que motiva
a la búsqueda de una transformación que conduzca a un sistema más sencillo.
En general, buscamos una transformación lineal definida por una matriz A,
de forma que, en función de nuevas corrientes j̄ y tensiones v̄, las originales se
puedan escribir como ī = Aj̄ y ū = Av̄. Impondremos la condición de que la
potencia eléctrica suministrada al sistema no dependa de la transformación,
es decir
P = īT ū = j̄ T AT Av̄ = j̄ T v̄
(26)
lo que implica que ha de ser AT A = I, es decir, que la matriz traspuesta
de A coincida con la inversa, lo cual sabemos que es cierto, en particular,
115
para las matrices de rotación. Procedemos a escribir en función de las nuevas
variables las ecuaciones para la parte eléctrica:
Av̄ = RAj̄ + θ̇
dL
dA
dj̄
Aj̄ + L
θ̇j̄ + LA
dθ
dθ
dt
(27)
o
dL
dA
dj̄
Aj̄ + θ̇A−1 L
j̄ + A−1 LA
dθ
dθ
dt
Introduciendo las nuevas matrices
v̄ = A−1 RAj̄ + θ̇A−1
R′ = A−1 RA
L′ = A−1 LA
dA
H = A−1 L
dθ
dL
T = A−1 A
dθ
(28)
(29)
la parte eléctrica se escribe como
dj̄
+ θ̇ (H + T) j̄
(30)
dt
En cuanto a la parte mecánica, la única parte afectada es el par Π, que
se escribe en función de las nuevas variables como
v̄ = R′ j̄ + L′
1 dL
1
1
dL
Π = īT
Aj̄ = j̄ T Tj̄
ī = j̄ T AT
(31)
2 dθ
2
dθ
2
Como se ve, todo depende de la elección de la matriz A. ¿De dónde
proviene la complejidad de la máquina? Proviene de la dependencia de L
con θ, y en última instancia del giro del rotor. Es obvio que un ”motor”
en que el rotor estuviese en reposo, al igual que el estator, serı́a mucho más
sencillo. Con esta guı́a, elegiremos la matriz A como una matriz de giro que
compense el giro del rotor, de tal forma que, en el nuevo sistema, el rotor
se encuentre fijo y sus ejes sean colineales con los del estator. La matriz de
transformación, de dimensiones 4 × 4, ha de dejar inalterados los valores de
corrientes y tensiones del estator. Como habı́amos tomado



ī = 

ieα
ieβ
irα
irβ
116





(32)
la matriz A se puede particionar como
A=
"
I 0
0 Ar
#
(33)
donde Ar es un giro en sentido inverso al del rotor:
r
A =
"
cos θ sin θ
− sin θ cos θ
#
(34)
Ahora se pueden calcular las nuevas matrices introducidas en (27). En
primer lugar,
R′ = AT RA = R
(35)
siempre que sea Rαr = Rβr . En general, por simetrı́a, consideraremos que
se cumple esta condición, Rαr = Rβr = Rr , ası́ como la condición Rαe = Rβe =
Re .
La nueva matriz de inductancias es



L′ = 

Además
T = A−1
y
Lee 0 Ler 0
0 Lee 0 Ler
Ler 0 Lrr 0
0 Ler 0 Lrr


dL

A=

dθ
H = A−1 L





(36)
0
0
0 −Ler
0
0 Ler
0
er
0
L
0
0
−Ler 0
0
0

dA 
=


dθ
0
0
0
0
0
0
Ler
er
0 −L
0
0
0
Lrr
0 −Lrr 0





(37)





(38)
Y ahora se puede escribir la parte eléctrica en las nuevas coordenadas:



v̄ = 


Re
0
0
0
e
0
R
0
0
0
θ̇Ler
Rr
θ̇Lrr
−θ̇Ler
0
−θ̇Lrr Rr





 j̄ + 




117
Lee 0 Ler 0
0 Lee 0 Ler
Ler 0 Lrr 0
0 Ler 0 Lrr

 dj̄


 dt
(39)
Falta calcular el par:
1 dL
1
Π = īT
ī = j̄ T Tj̄
(40)
2 dθ
2
Hemos dicho antes que elegı́amos A de forma que las variables ligadas
al estator quedasen inalteradas. Escribimos ahora explı́citamente el nuevo
vector de corrientes:



j̄ = 

ieα
ieβ
ird
irq





(41)
Las intensidades ligadas al nuevo sistema se denominan habitualmente
con los subı́ndices ’d’ (de ”directo”) y ’q’ (de ”quadrature”), y al nuevo
sistema se le suele llamar (αβdq). Pues bien, en las nuevas variables el par
viene dado por
Π = Ler (ieβ ird − ieα irq )
(42)
y la ecuación para la parte mecánica se escribe entonces:
J
5
d2 θ
dθ
= Ler (ieβ ird − ieα irq ) − β − Πm
2
dt
dt
(43)
Resumen conceptual
1. Se razona a partir del teorema de Gauss que el campo en el que se
encuentra el rotor es una función periódica del ángulo, en un instante
dado. De ahı́ que se pueda hacer el análisis de la frecuencia fundamental
y que el campo B̄ se pueda considerar como la composición de dos
campos perpendiculares, B̄α y B̄β , lo que motiva el modelo de máquina
generalizada.
2. Se escriben las ecuaciones para la parte eléctrica y se calcula el par a
partir de la co-energı́a y en la hipótesis lineal λ̄ = Lī.
3. Al hacer explı́cita una forma de L es posible escribir un conjunto de seis
ecuaciones que incluyen la parte eléctrica y la parte mecánica. Se manipulan ligeramente para ponerlas en una forma apta para la resolución
numérica y se presenta uno de los muchos algoritmos disponibles para
integrar este tipo de sistemas.
118
4. A la vista de la complejidad del sistema anterior, se introduce una
transformación de coordenadas que simplica notablemente el sistema,
y se re-escribe en las nuevas coordenadas.
6
Ejercicios
No se proponen ejercicios para este tema, dada su orientación. Sin embargo,
y con vistas al trabajo computacional, se recomienda la implementación del
algoritmo de Runge-Kutta.
119
VI
La máquina de corriente continua
1
La máquina de corriente continua
Al comentar la ecuación V.11, decı́amos que la máquina no puede funcionar
si por las bobinas del rotor y del estator circula corriente continua. Pero
una máquina puede ser alimentada con corriente continua y, sin embargo,
circular corriente no continua internamente. Además, eso es algo que se puede
conseguir con facilidad. En la Figura 1 la bobina se encuentra integrada en
una pieza circular, discontinua, cuyas partes p y q se ponen en contacto con
la fuente de alimentación a través de dos escobillas, A y B. En la posición de
la Figura 1, la corriente circula por la bobina de derecha a izquierda. Pero
con un pequeño giro adicional la escobilla B pasa a estar en contacto con la
parte p y la escobilla A con la parte q, y la corriente en la bobina se invierte.
Figura 1
De esta forma, desde una posición inicial, el rotor gira buscando alinearse
con el estator. Si cuando se produce este alineamiento se conmuta la corriente
en el rotor, cambia la polaridad de su campo y eso fuerza el giro de media
vuelta buscando la nueva alineación. Al completarse esta media vuelta vuelve
a cambiar la polaridad, y ası́ sucesivamente.
En la Figura 1, donde hay una sola bobina, aparece dos escobillas. Si
tuviésemos más bobinas, necesitarı́amos, en principio, una pareja de escobillas por cada bobina. Pero hay disposiciones ingeniosas de las bobinas,
de forma que sólo se necesita un par de escobillas. Omitiremos aquı́ estos
120
detalles constructivos. Sin embargo, el flujo de la corriente es relevante para
la operación de la máquina, y es preciso tenerlo en cuenta. Por ejemplo, si el
rotor y el estator se alimentan de forma independiente tenemos una configuración. Si estator y rotor se encuentran en serie alimentados por una misma
fuente, tenemos otra. Si se encuentran en paralelo, otra. Incluso puede haber
una parte en serie y otra en paralelo. Las Figuras 2a, b, c y d muestran estas
posibilidades.
Figura 2
2
2.1
Modelo
Configuración independiente
La máquina de continua conmutada mecánicamente se puede modelar mediante un par de bobinas, una para el estator y otra para el rotor. Si en
la máquina generalizada nos quedamos sólo con la bobina β del estator y la
bobina ’d’ del rotor, las ecuaciones para la parte eléctrica quedan como
121
"
vβe
vdr
#
=
"
Re + Lee d/dt
0
er
r
θ̇L
R + Lrr d/dt
#"
jβe
jdr
#
(1)
y para la parte mecánica
d2 θ
dθ
= Ler jβe jdr − β − Πm
(2)
2
dt
dt
Estamos asumiendo implı́citamente la configuración independiente de la
Figura 2a. Este sigue siendo un sistema no lineal, aunque muy simple. Se
puede simplificar todavı́a más si se considera el régimen permanente, en cuyo
caso las derivadas respecto al tiempo se anulan. La parte eléctrica se reduce
entonces a
J
vβe = Re jβe
vdr = θ̇Ler jβe + Rr jdr
(3)
donde ahora las tensiones e intensidades son constantes, ası́ como θ̇, la
velocidad de giro de la máquina. Para la parte mecánica:
Ler jβe jdr = Πm + β θ̇
(4)
Si usamos las ecuaciones de la parte eléctrica para obtener las corrientes
y sustituimos en la parte mecánica:
vβe
Re
θ̇Ler vβe
vdr
−
=
Rr
Rr Re
!
e
vdr
θ̇Ler vβe
er vβ
= L
− r e − β θ̇
Re Rr
R R
jβe =
jdr
Πm
(5)
Ası́, Πm es una función lineal de θ̇, de ordenada en el origen
vβe vdr
L
Re Rr
er
(6)
y pendiente
Ler vβe
−β −
Re
122
!2
1
Rr
(7)
mientras que el par eléctrico es
Π=
Ler jβe jdr
ve
= L βe
R
er
vdr
θ̇Ler vβe
−
Rr
Rr Re
!
(8)
que es también una función lineal de θ̇, de ordenada en el origen
Ler
vβe vdr
Re Rr
(9)
y pendiente
1
− r
R
Ler vβe
Re
!2
(10)
Se ve que el par se puede modificar de dos formas: o bien modificando
vdr , y entonces tenemos una familia de lı́neas caracterı́sticas paralelas, como
se muestra en la Figura 3, o bien modificando vβe , en cuyo caso al aumentar
vβe aumenta la pendiente, como se muestra en la Figura 4. Aquı́ se ve una
diferencia esencial entre el motor de explosión interna y este tipo de motor
eléctrico, en el cual el par es una función monótona decreciente de θ̇, mientras
que en el primero es creciente hasta alcanzar un máximo y luego decrece.
Figura 3
2.2
Configuración en paralelo
Cuando el rotor y el estator se alimentan en paralelo con la misma fuente,
entonces vβe = vdr = v, y seguimos teniendo una dependencia lineal del par
eléctrico con la velocidad angular, con ordenada en el origen
123
Figura 4
Ler v 2
Re Rr
(11)
y pendiente
1 Ler v 2
(12)
− r
R
Re
En la configuración independiente, cuando la fuerza electromotriz inducida iguala a vdr , cesa el par, y esto ocurre para
θ̇ =
vdr Re
Ler vβe
(13)
En la disposición en paralelo, ocurre para
θ̇ =
2.3
Re
Ler
(14)
Configuración en serie
La situación es distinta cuando la configuración es en serie, porque en ese
caso
jβe = jdr = j
(15)
vβe + vdr = v
(16)
y
Para la parte eléctrica tenemos:
124
vβe = (Re + Lee
d
)j
dt
vdr = (θ̇Ler + Rr + Lrr
d
)j
dt
(17)
Ası́ que
v = vβe + vdr = (Re + Rr )j + θ̇Ler j + (Lee + Lrr )
dj
dt
(18)
y para la parte mecánica
d2 θ
= Ler j 2 − β θ̇ − Πm
(19)
dt2
En régimen estacionario, las derivadas respecto al tiempo se anulan, y
queda
J
v = (Re + Rr )j + θ̇Ler j
0 = Ler j 2 − β θ̇ − Πm
(20)
Despejando j de la primera y sustituyendo en la segunda, tenemos para
el par:
Π = Ler
v2
(Re + Rr + θ̇Ler )2
(21)
La caracterı́stica de estos motores es que tienen un par de arranque elevado. En efecto, si θ̇ = 0:
Π(0) =
Ler v 2
(Re + Rr )2
(22)
y vemos cómo el par de arranque crece con el cuadrado de la tensión
aplicada. Es por eso que esta configuración se usa en motores de tracción.
Por ejemplo, se necesita un par muy elevado para poner en marcha a un
vehı́culo, o para poner en movimiento un montacargas.
Muchos otros aspectos del funcionamiento de la máquina alimentada por
corriente continua no serán tratados aquı́, donde nos hemos limitado a extraer las caracterı́sticas básicas del modelo de máquina generalizada que fue
propuesto en el capı́tulo anterior.
125
3
Resumen conceptual
1. Se presenta un modelo constructivo sencillo que muestra cómo una
máquina puede ser alimentada por corriente continua. Se presentan
cuatro configuraciones posibles.
2. Se analiza la máquina de corriente continua particularizando la máquina
generalizada al caso en que se consideran sólo jβe y jdr .
3. Para las configuraciones independiente, serie y paralelo, se estudia el
régimen estacionario, y en particular las curvas de par.
126
VII
La máquina de inducción
El principio de la máquina de inducción fue establecido en IV.5. En este
capı́tulo vamos a desarrollar con mayor amplitud la teorı́a de este tipo de
máquinas.
1
La máquina n-fásica
En primer lugar, veamos que la máquina generalizada que presentamos en V
se base en que el campo B̄ se puede descomponer en dos campos perpendiculares. Esto no quiere decir que si B̄ es la resultante de un número arbitrario
de polos, no podamos considerarlos a cada uno en particular. Si tenemos
n bobinas en el estator y otras tantas en el rotor, tenemos un vector de n
corrientes īel y un vector de n corrientes īrl , con l = 1, · · · , n. En total, 2n
componentes de corriente y 2n componentes de tensión, v̄le y v̄lr . En cuanto
a la matriz de resistencias, tendrá la forma
"
Re 0
0 Rr
#
(1)
donde Re y Rr son matrices diagonales. Falta la matriz de inducciones,
de dimensiones 2n × 2n, que se puede considerar subdividida en cuatro submatrices:
L=
"
Le Ler
Lre Lr
#
(2)
Le contendrá en su diagonal las autoinducciones de las bobinas del estator,
y fuera de la diagonal la inducciones mutuas entre las bobinas del estator, que
dependen del coseno del ángulo que forman entre sı́. Como hay n bobinas,
se encuentran separadas por un ángulo 2π/n, de manera que la inducción
mutua entre la bobina i y la bobina j será de la forma
Le (i, j) = M e cos(2π(i − j)/n)
(3)
Lr (i, j) = M r cos(2π(i − j)/n)
(4)
Por el mismo razonamiento, Lr contendrá en su diagonal las autoinducciones de las bobinas del rotor, y fuera de la diagonal
Faltan las submatrices Ler y Lre . Supondremos que Ler (i, j) = Lre (j, i),
por simetrı́a. Si θ es el ángulo del rotor respecto al estator:
127
Ler (i, j) = M er cos(θ + 2π(i − j)/n)
(5)
Siguen siendo válidas las ecuaciones V.13, en las cuales el par eléctrico se
obtiene de V.7.
Como se ve, no hay nada nuevo, y una rutina de integración numérica que
resuelva el problema puede parametrizarse en función del número de fases n.
2
La máquina trifásica
Por su relevancia en la industria, vamos a tratar con una máquina trifásica,
que es una particularización de lo dicho hasta ahora, con n = 3. Otra
particularidad es que las tensiones no son cualesquiera, sino tensiones alternas
desfasadas entre sı́. La idea es que si excitamos los polos del estator con un
cierto desfase entre sı́, es como si tuviésemos un sólo polo giratorio que en
su movimiento arrastra al rotor tras de sı́. En el caso más simple posible,
tendrı́amos una bobina de rotor y una bobina de estator, excitada con una
frecuencia angular igual a la de rotación del rotor, de forma que en el recorrido
ABC en la Figura 1 las bobinas se repelen, y en el recorrida CDA se atraen.
Es evidente que podemos seguir añadiendo bobinas, pero también que es
preciso encontrar un equilibrio entre las caracterı́sticas electro-mecánicas y
la complejidad constructiva y robustez de la máquina. Parece que, para la
industria de las máquinas eléctricas, este equilibrio se encuentra en n = 3.
Figura 1
En lo que sigue, usaremos un modelo como el de la Figura 2, donde
el estator y el rotor están compuestos por tres bobinados de dos polos, en
128
disposición simétrica. Nos referiremos con los subı́ndices (a, b, c) a cada bobinado y con los superı́ndices (e, r) al estator y al rotor. Supondremos que el
campo es radial en el ”gap”. Supondremos relaciones lineales entre el flujo
y las intensidades, escribiendo λ̄ = Lī y partiremos de las ecuaciones básicas
V.13.
Figura 2
Como la resistencia de cada bobina depende sólo de la intensidad que
atraviesa esa bobina, la matriz de resistencias será diagonal:
R=
"
Re 0
0 Rr
#





=




Re 0 0 0 0 0
0 Re 0 0 0 0
0 0 Re 0 0 0
0 0 0 Rr 0 0
0 0 0 0 Rr 0
0 0 0 0 0 Rr
En cuanto a la matriz de inductancias:
L=
"
Le Le r
Lre Lr
#










(6)
(7)
Le da cuenta de las inducciones mutuas y autoinducciones en las bobinas
del estator:
Leaa Leab Leac
 e
e
L =  Lba Lebb Lebc 

Leca Lecb Lecc


129
(8)
Si suponemos que las autoinducciones son iguales entre las tres bobinas,
Leaa = Lebb = Lecc = Le . En cuanto a las inducciones mutuas, llamaremos M e
al valor máximo de la inducción mutua entre las bobinas del estator, que
ocurrirá cuando el flujo que atraviesa a una de ellas producido por otra es
máximo, y dependerá de la orientación relativa de ambas, como se discutió
en V.2.1. Entonces
Le
− 12 M e − 12 M e
Le
M e cos 2π/3 M e cos 2π/3



Le
M e cos 2π/3  =  − 12 M e
Le
− 12 M e 
Le =  M e cos 2π/3

M e cos 2π/3 M e cos 2π/3
Le
− 12 M e − 21 M e
Le
(9)
y por el mismo razonamiento




Lr
− 21 M r − 12 M r

r
1
r
Lr
− 12 M r 
L =  −2M

Lr
− 21 M r − 12 M r


(10)
Pasamos a Ler y Lre . Por simetrı́a, estas matrices han de ser la una
traspuesta de la otra. Si θ es el ángulo que forman el estator y el rotor:
M er cos θ
M er cos(θ − 4π/3) M er cos(θ − 2π/3)

er
M er cos θ
M er cos(θ − 4π/3) 
Ler =  M er cos(θ − 2π/3)
 = M R(θ)
er
er
er
M cos(θ − 4π/3) M cos(θ − 2π/3)
M cos θ
(11)
con




cos θ
cos(θ − 4π/3) cos(θ − 2π/3)

cos θ
cos(θ − 4π/3) 
R(θ) =  cos(θ − 2π/3)

cos(θ − 4π/3) cos(θ − 2π/3)
cos θ
(12)
Las ecuaciones para la parte eléctrica son entonces:
ū =
"
Re 0
0 Rr
#
d
ī +
dt
"
Le
M er R(θ)
er T
M R (θ)
Lr
# !
ī
(13)
y el par, como sabemos, viene dado por
1 dL
ī
(14)
Π = īT
2 dθ
Como sólo las submatrices superior derecha e inferior izquierda de L dependen de θ, se produce el siguiente desacoplo:
130

1
Π = [(īe )T , (īr )T ] 

2
M er dR/dθ
0
er
T
M dR /dθ


0
Es decir
1
dR r
dRT e
Π = M er (īe )T
ī + (īr )T
ī
2
dθ
dθ
"

"
īe
īr
#
(15)
#
(16)
dRT e
dR r
ī = M er (īr )T
ī
dθ
dθ
(17)
y es fácil comprobar que
Π = M er (īe )T
con


sin θ
sin(θ − 4π/3) sin(θ − 2π/3)
dR

sin θ
sin(θ − 4π/3) 
= −  sin(θ − 2π/3)

dθ
sin(θ − 4π/3) sin(θ − 2π/3)
sin θ
2.1
(18)
Transformación de Park
En IV.5 discutimos los motores monofásicos y vimos que habı́a dos casos
prácticos importantes, el de los motores sı́ncronos y el de los ası́ncronos. En
los primeros, la frecuencia angular mecánica coincide con la eléctrica, y en los
segundos no. Esto motiva la búsqueda de una transformación genérica a unos
ejes rotatorios (d, q), cuya frecuencia angular después se pueda particularizar
para diversos casos. En la Figura 3 se representan tres ejes eléctricos desfasados en 2π/3, que llamaremos (a, b, c), y dos ejes rotatorios (d, q). Proyectando
cada uno de los ejes eléctricos sobre d y sobre q, vemos que la relación entre
las coordenadas de un vector x̄ en (a, b, c) y las coordenadas en (d, q) es la
siguiente:
x̄dq =
"
cos θ
cos(θ − 2π/3)
cos(θ − 4π/3)
− sin θ − sin(θ − 2π/3) − sin(θ − 4π/3)
#
x̄abc
(19)
Si vamos a V.4, donde presentamos la teorı́a general de las transformaciones de coordenadas, vemos que allı́ se precisa la matriz inversa de la matriz de transformación, cosa que es imposible en nuestro razonamiento actual
porque tenemos una matriz que no es cuadrada. Para solucionar este problema formal, introducimos una tercera componente en el sistema (d, q), que,
de acuerdo con la costumbre, llamaremos ’0’. Ası́, en el sistema (d, q, 0), la
transformación que deseamos es
131
Figura 3
x̄dq0


cos θ
cos(θ − 2π/3)
cos(θ − 4π/3)

=  − sin θ − sin(θ − 2π/3) − sin(θ − 4π/3) 
 x̄abc
?
?
?
(20)
La idea es que la transformación, representada por la matriz A, ha de ser
tal que la potencia suministrada a la máquina sea la misma en un sistema y
en otro, es decir
P = īTdq0 v̄dq0 = (Aīabc )T (Av̄abc ) = īTabc AT Av̄abc
(21)
y eso implica que ha de ser AT A = I. Como la matriz I se caracteriza
por dos condiciones: a) que los elementos de la diagonal sea iguales a 1 y b)
que los elementos de fuera de la diagonal sean nulos, vamos a intentar como
matriz de transformación una que dependa de dos parámetros, k1 y k2 , y
después ajustaremos esos parámetros para tratar de que se cumplan a) y b).
Ası́ pues, intentamos con


cos θ
cos(θ − 2π/3)
cos(θ − 4π/3)

−
sin
θ
−
sin(θ
−
2π/3)
−
sin(θ − 4π/3) 
A = k1 

k2
k2
k2
(22)
de donde
k22 + 1 k22 − 1/2 k22 − 1/2
k22 + 1 k22 − 1/2 
AT A = k12 

 k22 − 1/2
2
2
2
k2 − 1/2 k2 − 1/2 k2 + 1


132
(23)
q
√
y como esta matriz debe ser igual a la identidad, k2 = 1/ 2 y k1 = 2/3.
En definitiva:
A=
q


cos θ
cos(θ − 2π/3)
cos(θ − 4π/3)

− 2π/3) − sin(θ √
− 4π/3) 
2/3  − sin

√ θ − sin(θ √
1/ 2
1/ 2
1/ 2
(24)
Las intensidades, flujos y voltajes en ambos sistemas se relacionan entre
sı́ a través de esta matriz. A esta transformación se la conoce como ”transformación de Park” (Park, 1929). En lo sucesivo, y como esta transformación
tiene nombre propio, a su matriz la llamaremos P en lugar de A.
2.2
Utilidad de la transformación de Park
Si volvemos a (13), aquéllas son, obviamente, las ecuaciones en el sistema
(a, b, c), aunque no las distinguiésemos ası́ explı́citamente. Ahora necesitamos
hacerlo. A las cantidades en el sistema (a, b, c) las distinguiremos con el
subı́ndice ’a’, y a las cantidades en el sistema (d, q, 0) con el subı́ndice ’0’.
d
λ̄a = ūa − Ra īa
dt
(25)
Figura 4
Para pasar al sistema (d, q, 0), tengamos en cuenta que para el rotor la
transformación es P(θr ), y para el estator, P(θe ). Además, en la Figura 4 se
ve que, si θ es el ángulo relativo entre estator y rotor, θ = θe − θr . Ası́ que
133
desdoblamos la ecuación anterior en dos: una para el estator y otra para el
rotor:
d e
λ̄ = ūea − Rea īea
dt a
d r
λ̄ = ūra − Rra īra
dt a
(26)
y escribiendo las cantidades (a, b, c) en función de las cantidades (d, q, 0):
d −1
(P (θe )λ̄e0 ) = P−1 (θe )ūe0 − Rea P−1 (θe )īe0
dt
d −1
(P (θr )λ̄r0 ) = P−1 (θr )ūr0 − Rra P−1 (θr )īr0
dt
(27)
Efectuando las derivadas de la izquierda y premultiplicando por P:
dP−1 (θe )
dλ̄e0
+ P(θe )
= ūe0 − Rea īe0
dt
dt
dλ̄r0
dP−1 (θr )
+ P(θr )
= ūr0 − Rra īr0
dt
dt
(28)
Ahora, se comprueba sin dificultad que


0 −1 0
dP (θ)

P(θ)
= θ̇  1 0 0 

dt
0 0 0
−1
(29)
con lo cual, podemos escribir explı́citamente las componentes de (28):
dλed /dt − θ̇e λeq = ued − Re ied
dλeq /dt + θ̇e λed = ueq − Re ieq
dλe0 /dt = ue0 − Re ie0
dλrd /dt − θ̇r λrq = urd − Rr ird
dλrq /dt + θ̇r λrd = urq − Rr irq
dλr0 /dt = ur0 − Rr ir0
Consideremos ahora los flujos:
134
(30)
λ̄ea = Le īea + Ler īra
λ̄ra = (Ler )T īea + Lr īra
(31)
P−1 (θe )λ̄e0 = Le P−1 (θe )īe0 + M er R(θ)P−1 (θr )īr0
P−1 (θr )λ̄r0 = M er RT (θ)P−1 (θe )īe0 + Lr P−1 (θr )īr0
(32)
al pasar a (d, q, 0):
Premultiplicando la primera por P(θe ) y la segunda por P(θr ), tenemos:
"
λ̄e0
λ̄r0
#
=
"
P(θ)Le P−1 (θe )
M er P(θe )R(θ)P−1 (θr )
er
T
−1
M P(θr )R (θ)P (θe )
P(θr )Lr P−1 (θr )
#"
īe0
īr0
#
(33)
Y ahora pasamos a calcular las submatrices. En primer lugar
0
0
Le + 21 M e


e −1
1
e
e
0
L + 2M
0
P(θe )L P (θe ) = 

e
e
0
0
L −M
(34)
Lr + 12 M r
0
0


r −1
1
r
r
0
L + 2M
0
P(θr )L P (θr ) = 

0
0
Lr − M r
(35)


y análogamente:


En cuanto a las otras dos submatrices, veamos que


1 0 0
3

M er P(θe )R(θ)P−1 (θr ) = M er 
 0 1 0 
2
0 0 0
(36)
simplificación que se alcanza teniendo en cuenta que θ = θe − θr . Como
ésta es una matriz diagonal, coincide con su traspuesta, pero vemos que
[P(θe )R(θ)PT (θr )]T = P(θr )RT (θ)PT (θe )
(37)
y si tenemos en cuenta que PT = P−1 :


1 0 0
3 er 
er
T
−1
M P(θr )R (θ)P (θe ) = M  0 1 0 

2
0 0 0
135
(38)
Por fin es posible apreciar qué extraordinaria simplificación produce la
transformación de Park. En primer lugar, los coeficientes de la matriz de
inducciones son constantes. En segundo lugar, las intensidades están desacopladas.
2.3
Par
El par se calcula a partir de (17). Aplicando la transformación de Park:
Π = M er (īea )T
dR r
dR T
P (θr )īr0
īa = M er (īe0 )T P(θe )
dθ
dθ
(39)
pero


0 −1 0
dR T
3

P(θe )
P (θr ) =  1 0 0 
dθ
2
0 0 0
(40)
ası́ que, finalmente
3
Π = M er (ieq ird − ied irq )
2
2.4
(41)
Casos particulares
Como el sistema (d, q, 0) es arbitrario, hemos obtenido unas ecuaciones generales que ahora es posible particularizar. Teniendo en cuenta que θ = θr − θe ,
tenemos tres casos de interés:
a) Cuando el sistema (d, q, 0) se hace coincidir con el estator, es θe = 0 y
por tanto θr = θ, y las ecuaciones (30), teniendo en cuenta (34), (35), (36) y
(37), se pueden escribir como





ū = 




Re + pl1
0
0
pm
0
0
e
0
R + pl1
0
0
pm
0
e
0
0
R + pl2
0
0
0
pm
−θ̇m
0
Rr + pl3
−θ̇l3
0
r
θ̇m
pm
0
θ̇l3
R + pl3
0
r
0
0
0
0
0
R + pl4
donde
136





 ī (42)









ū = 




ued
ueq
ue0
urd
urq
ur0






;








ī = 




ied
ieq
ie0
ird
irq
ir0










(43)
p es el operador derivada temporal (p = d/dt) y l1 = Le + 12 M e , l2 =
Le − M e , l3 = Lr + 21 M r , l4 = Lr − M r , m = 23 M er .
b) Cuando el sistema se hace coincidir con el rotor, es θr = 0 y por tanto
θe = −θ. Se tiene:





ū = 




Re + pl1
θ̇l1
0
pm
θ̇m
0
e
−θ̇l1
R + pl1
0
−θ̇m
pm
0
e
0
0
R + pl2
0
0
0
pm
0
0
Rr + pl3
0
0
r
0
pm
0
0
R + pl3
0
0
0
0
0
0
Rr + pl4





 ī (44)




c) Cuando el sistema (d, q, 0) se hace girar con la velocidad sincrónica,
θe = θr





ū = 





3
Re + pl1 −θ̇e l1
0
pm
−θ̇e m
0
e
θ̇e l1
R + pl1
0
θ̇e m
pm
0
0
0
Re + pl2
0
0
0
pm
−θ̇e m
0
Rr + pl3 −θ̇e l3
0
r
θ̇e m
pm
0
θ̇e l3
R + pl3
0
0
0
0
0
0
Rr + pl4






 ī (45)




Bibliografı́a
Parte del material contenido en este capı́tulo proviene del capı́tulo 2, ”Dynamic modeling of Induction machines”, de ”Vector control of induction
machines”, B. Robyns et al. Puede consultarse también ”Matrix analysis
of electric machinery”, de N. N. Hancock. Gran parte de la bibliografı́a
disponible basa la discusión en el formalismo de fasores en el plano complejo, que hemos omitido aquı́ completamente. Otras referencias que pueden
137
ser útiles: ”d, q reference frames for the simulation of induction motors”,
de R.J. Lee, P. Pillay y R.G. Harley; En ”High performance drives”, de E.
Levi, el capı́tulo ”Mathematical modelling of an induction machine and the
supply”. Rara vez se considera la parte mecánica, por eso puede ser interesante ”Analysis and modelling of an induction machine with a pulsating load
torque used for a washing machine application”, de Magnus Hedin y Linda
Lundström. Para una ilustración del uso de los distintos sistemas de referencia, con simulaciones numéricas, véase ”Transient analysis of three-phase
induction machine using different reference frames”, de Vivek Pahwa y K.
S. Sandhu.
4
Resumen conceptual
1. Se razona sobre una máquina hipotética de un número arbitrario de
fases, y se ve cual serı́a la forma de la matriz L. Al considerar una
máquina de tres fases, se escriben las matrices R y L.
2. A partir de las formas especı́ficas para las matrices, se obtienen las
ecuaciones de la parte eléctrica y el par.
3. Al poner en relación las variables en el sistema (a, b, c) con las variables
(d, q) que usamos en la máquina generalizada, vemos que la matriz de
transformación es de 2 × 3, lo que es un inconveniente formal ya que
al poner en relación a ambos sistemas necesitamos la matriz inversa
de la transformación, que en este caso no existe. Por eso, se amplia
el sistema (d, q) introduciendo un eje adicional (d, q, 0) y se especula
sobre cómo la matriz de transformación original deberı́a ampliarse.
4. Se obtiene finalmente la relación entre los sistemas (a, b, c) y (d, q, 0).
Se trata de la transformación de Park.
5. Se usa la transformación de Park para encontrar las ecuaciones generales de la máquina en el sistema (d, q, 0), y se muestra la gran simplificación conseguida, que puede ser aún más si se consideran, lo que se
hace en la última sección, velocidades angulares particulares.
5
Ejercicios
Dado el carácter algebraico de este capı́tulo, recomendamos al estudiante que
se ayude de un programa de cálculo simbólico para verificar algunas de las
relaciones que hemos usado. Los ejercicios propuestos van en este sentido.
138
1. Verificar la ecuación (29).
2. Verificar (34).
3. Verificar (36).
4. Verificar (40).
139
Descargar