Teorı́a de perturbaciones Idea básica. El objetivo es estudiar la solución x(t) = x(t; ) del PVI x0 = f (t, x, ), x(t0 ) = x̂0 , que depende de un pequeño parámetro 0 < 1, suponiendo que conocemos la solución x0 (t) del PVI “no perturbado” que se obtiene al tomar = 0. Cuando el sistema es de clase C r , r ≥ 1, podemos considerar los desarrollos de Taylor f (t, x, ) = f 0 (t, x) + · · · + r f r (t, x) + o(r ), x(t) = x0 (t) + · · · + r xr (t) + o(r ). En muchos casos el sistema no perturbado es autónomo: f 0 = f 0 (x). Pr Al imponer que la serie de potencias x(t; ) = j=0 j xj (t) cumpla el PVI original obtenemos unos PVIs recursivos con una estructura común. El primer PVI es el problema no perturbado x00 = f 0 (t, x0 ), x0 (t0 ) = x̂0 , cuya solución ya conocemos. Todos los demás requieren resolver unos sistemas lineales no homogéneos de matriz común A(t) = Dx f 0 (t, x0 (t)) dotados de unas condiciones iniciales homogéneas: x0j = A(t)xj + bj (t), xj (t0 ) = 0, j = 1, . . . , r. Es importante resaltar que cada término no homogéneo bj (t) se puede calcular a partir de los términos f 0 (t, x), . . . , f j (t, x), x0 (t), . . . , xj−1 (t). Por ejemplo: b1 (t) = f 1 (t, x0 (t)), b2 (t) = 21 Dx2 f 0 (t, x0 (t))[x1 (t), x1 (t)] + Dx f 1 (t, x0 (t))x1 (t) + f 2 (t, x0 (t)). Si supieramos resolver todos los PVIs que aparecen, podrı́amos calcular recursivamente todos los términos de la solución buscada. Primer ejemplo. Queremos calcular los primeros términos del desarrollo en potencias del pequeño parámetro m de las soluciones del PVI 0 x(0) = 1 x = −yz, y 0 = xz, y(0) = 0 . 0 z = −mxy, z(0) = 1 Se sabe que las soluciones de este PVI son las funciones elı́pticas de Jacobi. En particular, podemos encontrar los siguientes desarrollos en los libros clásicos de variable compleja: m 1 x(t) = cn(t|m) = cos t + t − sin 2t sin t + O(m2 ) 4 2 m 1 y(t) = sn(t|m) = sin t + t − sin 2t cos t + O(m2 ) 4 2 m 2 z(t) = dn(t|m) = 1 − sin t + O(m2 ). 2 El objetivo de este ejemplo consiste en obtener estos desarrollos mediante la teorı́a de perturbaciones, sin usar conocimientos de variable compleja. P P P Al imponer que los desarrollos x(t) = j≥0 mj xj (t), y(t) = j≥0 mj yj (t) y z(t) = j≥0 mj zj (t) cumplan el PVI original, obtenemos los siguientes PVIs recursivos: Igualando los términos O(m0 ) de la tercera ecuación, queda z00 = 0 y z0 (0) = 1, luego z0 (t) ≡ 1. Igualando los términos O(m0 ) de la primeras ecuaciones, vemos que 0 x0 x0 x0 (0) 1 0 −1 = A , = , A = . y0 y0 (0) 0 1 0 y00 Es decir, necesitamos resolver un sistema lineal homogéneo 2 × 2 a coeficientes constantes. En el siguiente tema veremos que la solución de este PVI lineal es x0 (t) = cos t y y0 (t) = sin t. 1 2 Depositado en http://www.ma1.upc.edu/∼edos/perturbaciones.pdf Igualando los términos O(m1 ) de la tercera ecuación, vemos que z10 = −x0 y0 = − cos t sin t, Rt − 12 z1 (0) = 0, 2 sin t. luego z1 (t) = 0 − 0 sin s cos s ds = Igualando los términos O(m1 ) de las primeras ecuaciones, vemos que 0 x1 x1 x1 (0) 0 −y0 (t) − sin t =A + b1 (t), = , b1 (t) = = . y10 y1 y1 (0) 0 x0 (t) cos t Es decir, necesitamos resolver un sistema lineal no homogéneo 2 × 2 a coeficientes constantes. En el siguiente tema veremos que x1 (t) = 41 t − 12 sin 2t sin t y y1 (t) = 14 t − 21 sin 2t cos t. En general, igualando los términos O(mj ) de la tercera ecuación, queda zj0 =− j−1 X xi (t)yj−i−1 (t), zj (0) = 0. i=0 Pj−1 R t Este PVI es de integración inmediata: zj (t) = − i=0 0 xi (s)yj−i−1 (s) ds. Finalmente, igualando los términos O(mj ) de las primeras ecuaciones, vemos que 0 j−1 X xj xj xj (0) 0 −yi (t)zj−i (t) = A + b (t), = , b (t) = . j j yj0 yj yj (0) 0 xi (t)zj−i (t) i=0 La estructura de las ecuaciones obtenidas no cambia. Por ejemplo, todas las matrices 2 × 2 son iguales a A. Aplicando recursivamente las fórmulas anteriores podemos calcular tantos términos como queramos de los desarrollos, aunque la complejidad de los cálculos aumenta rápidamente. Eso sı́, debemos realizar los cálculos en el siguiente orden: z0 , (x0 , y0 ), z1 , (x1 , y1 ), z2 , (x2 , y2 ), z3 , (x3 , y3 ), . . .. Ejercicio. Probar que las funciones cn(t) y dn(t) son pares, mientras que sn(t) es impar. (Indicación: Usar la unicidad de soluciones.) Ejercicio. Probar que cn2 (t|m)+sn2 (t|m) ≡ 1 y m sn2 (t|m)+dn2 (t|m) ≡ 1. Deducir que las soluciones x(t) = cn(t|m), y(t) = sn(t|m) y z(t) = dn(t|m) del PVI original están definidas para todo t ∈ R. Es decir, probar que su intervalo maximal es R. Ejercicio. Supongamos que m ≈ 1, luego m1 = 1 − m es un pequeño parámetro. En la teorı́a de funciones elı́pticas se dice que m1 es el parámetro complementario. Calcular los primeros términos del desarrollo en potencias de m1 de las soluciones del PVI original. No es fácil. Podeis comparar los resultados con los siguientes desarrollos publicados en el libro de Abramowitz & Stegun: cn(t|m) = sech t − (m1 /4) sinh t cosh t − t tanh t sech t + O(m21 ) sn(t|m) = tanh t + (m1 /4) sinh t cosh t − t sech2 t + O(m21 ) dn(t|m) = sech t + (m1 /4) sinh t cosh t + t tanh t sech t + O(m21 ). Segundo ejemplo. Lanzamos un proyectil de masa m desde el suelo verticalmente hacia arriba con velocidad inicial v. Suponemos que la fricción es proporcional a la velocidad, siendo k > 0 el coeficiente de fricción. Suponemos que la intensidad del campo gravitatorio es constante (o sea, que no depende de la altura) y notamos por g la aceleración debida a la gravedad. Queremos calcular el tiempo t∗ que tarda el proyectil en alcanzar su altura máxima h∗ . Sea h(t) la altura del proyectil en el instante t. Deducimos de la segunda ley de Newton que el PVI que modela el problema es d2h dh dh , h(0) = 0, (0) = v. = −mg − k 2 dt dt dt El instante t∗ se caracteriza por ser el único instante en que se anula la primera derivada de h(t). m Ejercicio. Probar que el cambio de variables independiente τ = gt/v, junto con el cambio de variables dependiente x = gh/v 2 y la notación = kv/mg, transforma el PVI anterior en el PVI normalizado d2x dx + = −1, dτ 2 dτ x(0) = 0, dx (0) = 1. dτ Depositado en http://www.ma1.upc.edu/∼edos/perturbaciones.pdf 3 Obviamente, x∗ = x(τ∗ ) = gh∗ /v 2 y τ∗ = gt∗ /v. Probar que τ∗ se caracteriza por ser el único momento en que se anula la primera derivada de x(τ ). Decimos que el PVI está normalizado pues ahora contiene un único parámetro. Además, si la fricción es pequeña, entonces el parámetro = kv/mg también es pequeño. Ejercicio. Comprobar que las cantidades τ , x y son adimensionales. Es decir, no tienen unidades. Queremos calcular los primeros términos del desarrollo en serie de potencias del pequeño parámetro de la solución del PVI normalizado x(τ ), del “instante” τ∗ y de la “altura máxima” x∗ . Este es un ejemplo académico, pues los desarrollos se pueden obtener de forma directa resolviendo el PVI. Concretamente, veremos en el siguiente tema que la solución del PVI normalizado es j+1 X τ τ τ j+2 1+ (−1)j − j . x(τ ) = 2 (1 − e−τ ) − = (j + 1)! (j + 2)! j≥0 P En particular, como ln(1 + ) = j≥1 (−1)j j /j, resulta que 0= 1 + −τ∗ 1 ln(1 + ) X (−1)j j dx − =⇒ τ∗ = (τ∗ ) = e = = 1 − /2 + 2 /3 + O(3 ). dτ j+1 j≥0 Finalmente, x∗ = x(τ∗ ) = τ∗ 1 ln(1 + ) X (−1)j j 1+ −τ∗ (1 − e ) − = − = = 1/2 − /3 + 2 /4 + O(3 ). 2 2 j+2 j≥0 El objetivo de este ejemplo es calcular los desarrollos anteriores mediante la teorı́a de perturbaciones, como preparación de las situaciones en que no es posible obtener una expresión explicita de la solución. En este caso tenemos una EDO de segundo orden. Vamos a trabajar directamente con la EDO, sin convertirla en un sistema 2D P de primer orden. Al imponer que x(τ ) = j≥0 j xj (τ ) cumpla el PVI normalizado, obtenemos unos PVIs recursivos: Igualando términos O(0 ) vemos que1 x000 = −1, x0 (0) = 0, x00 (0) = 1, cuya solución es Z τ Z τ Z s 0 0 00 x0 (τ ) = x0 (0) + x0 (s) ds = x0 (0) + x0 (0) + x0 (r) dr ds 0 0 0 Z Z τ s = x0 (0) + x00 (0)τ + x000 (r) dr ds = τ − τ 2 /2. 0 1 −x00 = τ − 1, x1 (0) = 0, x01 (0) = 0, cuya solución es Z τ (r − 1) dr ds = (s2 /2 − s) ds = τ 3 /6 − τ 2 /2. Igualando términos O( ) Z τ Z s x1 (τ ) = x001 (r) dr ds = 0 0 vemos que x001 = Z τ Z s 0 0 0 0 Igualando los términos O( ) vemos que = xj (0) = 0, x0j (0) = 0, cuya solución es Z j+1 Z Z τ Z τ s s τ rj τ j+2 rj+1 j 0 xj (τ ) = − − dr ds = (−1) − xj−1 (r) dr ds = . (j + 1)! j! (j + 1)! (j + 2)! 0 0 0 0 j x00j −x0j−1 , Al igual que antes, todos los PVIs correspondientes a los términos xj (τ ), j ≥ 1, son EDOs lineales no homogéneas con condiciones iniciales homogéneas. Para obtener los primeros términos de las expansiones enPpotencias de del “instante” τ∗ y la “altura máxima” x∗ , imponemos que la serie de potencias τ∗ = j≥0 τj j cumpla la ecuación x0 (τ∗ ) = 0 y agrupando los términos del mismo orden vemos que 0 = = x0 (τ∗ ) = x00 (τ0 + τ1 + 2 τ2 + · · · ) + x01 (τ0 + τ1 + · · · ) + 2 x02 (τ0 + · · · ) + O(3 ) 2 3 x00 (τ0 ) + x01 (τ0 ) + x000 (τ0 )τ1 + 2 x02 (τ0 ) + x001 (τ0 )τ1 + x000 (τ0 )τ2 + x000 0 (τ0 )(τ1 ) /2 + O( ). Igualando a cero cada término se obtienen los coeficientes τj de forma recursiva: 1En el resto de esta sección notamos x0 = dx y x00 = d 2 x . dτ dτ 2 Depositado en http://www.ma1.upc.edu/∼edos/perturbaciones.pdf 4 Igualando el término O(0 ) vemos que 0 = x00 (τ0 ) = 1 − τ0 , luego τ0 = 1. Igualando el término O(1 ) vemos que 0 = x01 (τ0 )+x000 (τ0 )τ1 = (τ0 )2 /2−τ0 −τ1 , luego τ1 = −1/2. Igualando el término O(2 ) vemos que 2 0 = x02 (τ0 ) + x001 (τ0 )τ1 + x000 (τ0 )τ2 + x000 0 (τ0 )(τ1 ) /2 = 1/3 − τ2 , pues x02 (τ0 ) = (τ0 )2 /2 − (τ0 )3 /6 = 1/2 − 1/6 = 1/3, x001 (τ0 ) = −x00 (τ0 ) = 0, x000 (τ ) ≡ −1 y x000 0 (τ ) ≡ 0. Por tanto, τ2 = 1/3. A continuación, calculamos los primeros términos de desarrollo de x∗ . x∗ = x(τ∗ ) = x0 (τ0 + τ1 + 2 τ2 + · · · ) + x1 (τ0 + τ1 + · · · ) + 2 x2 (τ0 + · · · ) + O(3 ) = x0 (τ0 ) + x1 (τ0 ) + x00 (τ0 )τ1 + 2 x2 (τ0 ) + x01 (τ0 )τ1 + x00 (τ0 )τ2 + x000 (τ0 )(τ1 )2 /2 + O(3 ) = 1/2 + − 1/3 + 0 + 2 1/8 + 1/4 + 0 − 1/8 + O(3 ) = 1/2 − /3 + 2 /4 + O(3 ). Finalmente, concluimos que la altura máxima a la que llega el proyectil lanzado verticalmente cuando el coeficiente de fricción k es pequeño se puede aproximar por el desarrollo de Taylor h∗ = v 2 x∗ /g = v 2 1/2 − /3 + 2 /4 + O(3 ) /g = v 2 /g − kv 3 /3mg 2 + k 2 v 4 /4m2 g 3 + O(k 3 v 5 /m3 g 4 ). Tercer ejemplo. Estamos cerca de un cuerpo celeste aproximadamente esférico y sólido sin atmósfera externa (por ejemplo, en la Luna) y dejamos caer una piedra desde una altura inicial h0 con velocidad inicial nula. Queremos calcular de forma aproximada el tiempo que tarda la piedra en caer al suelo. Sea R el radio del cuerpo celeste. Sea M la masa del cuerpo celeste. Sea G la constante de gravitación universal. Sea h(t) la altura a la que está la piedra en el instante t. Deducimos de la segunda ley de Newton que el PVI que modela el problema es GM dh d2h =− , h(0) = h0 , (0) = 0. 2 2 dt (R + h) dt La masa de la piedra no aparece en las ecuaciones. No hay fricción, pues no hay atmósfera. La fuerza de la gravedad es variable; es más débil a mayor altura. Buscamos el instante t∗ > 0 tal que h(t∗ ) = 0. Si aproximamos el campo gravitatorio a una altura arbitraria h por el valor que tiene ese campo a ras del suelo (o sea, si aproximamos la expresión variable GM/(R + h)2 por la constante g := GM/R2 , aproximación que tiene sentido cuando 0 < h < h0 R), obtenemos el PVI aproximado d2h dh = −g, h(0) = h0 , (0) = 0. 2 dt dt La constante g = GM/R2 denota la intensidad de la gravedad en la superficie del cuerpo celeste2. La solución de este PVI aproximadop es h(t) = h0 − gt2 /2 y resolviendo la ecuación cuadrática h(t) = 0, obtenemos la aproximación t∗ ≈ 2h0 /g. A continuación, vamos a mejorar esta aproximación. En primer lugar, teniendo p en cuenta que la fuerza de la gravedad disminuye cuando aumenta la altura, deducimos que t∗ > 2h0 /g. Es decir, la piedra tarda más en caer bajo la influencia del campo gravitatorio variable de lo que tardarı́a en caer bajo la influencia del campo gravitatorio constante. Ejercicio. Probar que si consideramos el pequeño parámetro = h0 /R 1, realizamos el cambio de p variables independiente τ = g/h0 t y el cambio de variables dependiente x = h/h0 , entonces el PVI anterior se transforma en el PVI normalizado X d2x −1 dx = = (−1)j+1 (j + 1)j xj = −1 + 2x − 32 x2 + · · · , x(0) = 1, (0) = 0. dτ 2 (1 + x)2 dτ j≥0 Comprobar que las cantidades τ , x y son adimensionales. Es decir, no tienen unidades. Decimos que el PVI está normalizado pues ahora contiene un único parámetro. Queremos calcular los primeros términos del desarrollo en serie de potencias de de la solución del PVI normalizado x(τ ) y del “instante” τ∗ tal queP x(τ∗ ) = 0. Al imponer que x(τ ) = j≥0 j xj (τ ) cumpla el PVI normalizado, obtenemos unos PVIs recursivos: 2En la Luna se tiene g ' 1,622 m/s2 , pues G ' 6,67384 × 10−11 N (m/kg)2 , M ' 7,3477 × 1022 kg y R ' 1738,14 km. Depositado en http://www.ma1.upc.edu/∼edos/perturbaciones.pdf 5 Igualando todos los términos O(0 ) del PVI normalizado, obtenemos el PVI x000 = −1, x00 (0) = 0. x0 (0) = 1, La solución de este PVI es Z s 0 00 x0 (0) + = x0 (0) + x0 (0) + x0 (r) dr ds 0 0 0 Z τ Z s x000 (r) dr ds = 1 − τ 2 /2. x0 (0) + x00 (0)τ + Z x0 (τ ) = = τ Z x00 (s) ds τ 0 0 1 Igualando los términos O( ) obtenemos el PVI x001 = 2x0 = 2 − τ 2 , x1 (0) = 0, x01 (0) = 0, cuya solución es Z τ Z s x1 (τ ) = 0 x001 (r) dr ds = τ 2 − τ 4 /12. 0 Igualando los términos O(2 ), obtenemos el PVI x002 = 2x1 − 3(x0 )2 = −3 + 5τ 2 − 11τ 4 /12, x2 (0) = 0, x02 (0) = 0, cuya solución es Z τ Z x2 (τ ) = 0 s x002 (r) dr ds = −3τ 2 /2 + 5τ 4 /12 − 11τ 6 /360. 0 Etcétera... Todas las EDOs que se obtienen mediante el proceso anterior tienen una forma relativamente simple. Concretamente, son de la forma x00j = Fj (x0 , x1 , . . . , xj−1 ), luego se pueden resolver de forma recursiva integrando dos veces las expresiones algebraicas Fj (x0 , x1 , . . . , xj−1 ). De cara a obtener los primeros términosPde las expansiones en potencias de del “instante” τ∗ , imponemos que la serie de potencias τ∗ = j≥0 τj j cumpla la ecuación x(τ∗ ) = 0 y agrupando los términos del mismo orden vemos que 0 = x(τ∗ ) = x0 (τ0 + τ1 + 2 τ2 + · · · ) + x1 (τ0 + τ1 + · · · ) + 2 x2 (τ0 + · · · ) + O(3 ) = x0 (τ0 ) + x1 (τ0 ) + x00 (τ0 )τ1 + 2 x2 (τ0 ) + x01 (τ0 )τ1 + x000 (τ0 )(τ1 )2 /2 + x00 (τ0 )τ2 + O(3 ). Igualando a cero cada término se obtienen los coeficientes τj de forma recursiva: √ Igualando el término O(0 ) vemos que 0 = x0 (τ0 ) = 1 − (τ0 )2 /2, luego τ0 = 2. Igualando el término O(1 ) vemos que 0 = x1 (τ0 ) + x00 (τ0 )τ1 , luego √ τ1 = −x1 (τ0 )/x00 (τ0 ) = (τ02 − τ04 /12)/τ0 = (1 − τ02 /12)τ0 = 5 2/6. Igualando el término O(2 ) vemos que 0 = x2 (τ0 ) + x01 (τ0 )τ1 + x000 (τ0 )(τ1 )2 /2 + x00 (τ0 )τ2 , luego τ2 = − x2 (τ0 ) + x01 (τ0 )τ1 + x000 (τ0 )(τ1 )2 /2 /x00 (τ0 ) = 3τ02 /2 + 5τ04 /12 − 11τ06 /360 + τ0 τ1 − τ03 τ1 /3 − τ12 /2 /τ0 √ √ = (3 + 5/3 − 11/45 + 5/3 − 10/9 − 25/36)/ 2 = 257 2/60. √ Ası́ pues, τ∗ = τ0 + τ1 + τ2 2 + O(3 ) = 2 1 + 5/6 + 2572 /60 + O(3 ) . En particular, el tiempo de caı́da en las variables originales es s s " s 3 !# h0 2h0 5 257 2 2h0 5h0 257h20 h0 3 = t∗ = τ∗ = 1+ + +O 1+ + +O . g g 6 60 g 6R 60R2 R 6 Depositado en http://www.ma1.upc.edu/∼edos/perturbaciones.pdf Figura 1. Esquema de un péndulo. Cuarto ejemplo. Tenemos un péndulo de masa m y longitud l bajo un campo gravitatorio de intensidad constante g. Supongamos que soltamos suavemente el péndulo desde la posición que forma un pequeño ángulo 1 con la posición de equilibrio inferior. Entonces el péndulo oscila alrededor de esa posición de equilibrio de forma periódica y el periodo T de sus oscilaciones depende de forma suave respecto al parámetro . Además, P T = T () es una función par en . Es decir, existe un desarrollo en serie de potencias de la forma T = j≥0 Tj 2j . Queremos calcular los primeros términos del desarrollo. En esta entrada de la Wikipedia se afirma que s l 2 114 1736 229318 131918310 23352646312 14 1+ + + + + + + O( ) . T = 2π g 16 3072 737280 1321205760 951268147200 2009078326886400 Sea θ(t) el ángulo formado por el péndulo con la posición vertical inferior en el instante t, ver la figura 1. Deducimos de la segunda ley de Newton que el PVI que modela el problema es d2θ dθ = −g sin θ, θ(0) = , (0) = 0. dt2 dt La masa del péndulo no aparece en las ecuaciones. En este problema el pequeño parametro no aparece en la EDO, si no en las condiciones iniciales. Para calcular el periodo T , primero buscaremos el primer instante t∗ > 0 tal que θ(t∗ ) = 0 y después usaremos que T = 4t∗ . p Ejercicio. 1. Probar que si realizamos el cambio de variables independiente τ = g/lt, entonces el PVI anterior se transforma en el PVI normalizado d2θ dθ = − sin θ, θ(0) = , (0) = 0. dτ 2 dτ Comprobar que el nuevo tiempo τ es adimensional; es decir, no tiene unidades. 2. Calcular los primeros términos del desarrollo en serie de potencias respecto de la solución θ(τ ) del PVI normalizado obtenido en el apartado anterior. Probar P que θ(τ ) = θ(τ ; ) es impar en , luego el desarrollo que buscamos es de la forma θ(τ ) = j≥0 θj (t)2j+1 . Por ejemplo, el primer término cumple el PVI θ000 = −θ0 , θ0 (0) = 1,Pθ00 (0) = 0, luego θ0 (τ ) = cos τ . 3. Calcular los primeros términos del desarrollo τ∗ = j≥0 τj 2j imponiendo que 0 = θ(τ∗ ) = θ0 (τ0 ) + θ1 (τ0 ) + θ00 (τ0 )τ1 3 + θ2 (τ0 ) + θ10 (τ0 )τ1 + θ000 (τ0 )(τ1 )2 /2 + θ00 (τ0 )τ2 5 + O(7 ). l Por ejemplo, τ0 = π/2 es la menor p raı́z positiva de la ecuación 0 = θ0 (τ0 ) = cos τ0 . 4. UsarP la identidad T = 4t∗ = 4 l/gτ∗ para obtener los primeros coeficientes del desarrollo T = j≥0 Tj 2j y comprobar que el resultado coincide con el dado en la Wikipedia.