CONTROL Y ESTABILIDAD. Javier Ruiz del Castillo. Física de los Procesos Biológicos. Abril 2001. CONTROL Y ESTABILIDAD. Índice 2.1. INTRODUCCIÓN A LA TEORÍA DE CONTROL. 2.1.1 Noción de control. 2.1.2 Estructura de un problema de control. 2.1.3 Clasificación de los problemas de control. 2.1.4 Control por realimentación. 2.1.5 Los métodos de la teoría de control. 2.2. HISTORIA DEL CONTROL AUTOMÁTICO. 2.2.1 Antecedentes de la teoría de control. 2.2.2 El Nacimiento de la Teoría Matemática de Control. 2.3. PROBLEMAS CLÁSICOS DE CONTROL. 2.3.1 El péndulo centrífugo y la máquina de vapor. 2.3.1.1 Ecuaciones del péndulo centrífugo. 2.3.1.2 Modelo matemático para la máquina de vapor sin control automático. 2.3.1.3 Modelo matemático para la máquina de vapor con péndulo centrífugo como regulador automático. 2.3.2. Control del nivel de glucosa en sangre. 2.3.2.1. Test de tolerancia de glucosa. 2.3.2.2. Ecuación de control con término proporcional. 2.3.2.3. Ecuación de control con términos proporcional y derivativo. Apuntes personales para clase tomados de: Capítulo 6 (del volumen uno): Feedback, Control and Stability in Physical and Biological Systems, del libro de George B. Benedek, Felix M. H. Villars, “Physics with illustrative examples from medicine and biology” (Ed. Springer, Nueva York 2000, Segunda edición, tres volúmenes). Capítulo 8: Introducción a la Teoría de Control, del libro “Ecuaciones Diferenciales Ordinarias. Teoría de Estabilidad y Control”, de Miguel de Guzmán. Editorial Alhambra. Capítulo 1: Introduction to Modern Control Theory, del libro de F.L. Lewis, “Applied Optimal Control and Estimation” (Ed. Prentice-Hall, 1992). Disponible on-line en las direcciones electrónicas siguientes: 1. http://www.control-automatico.net/articulos/art054.htm 2. http://www.theorem.net/lewis1.html 3. http://www.ee.washington.edu/class/462/aut00/lewis1.html. Enciclopedia Britannica. Roger Brockett, New Issues in the Mathematics of Control, to appear in Mathematic Unlimited 2001, Springer. Capítulo 15: Homeostasia, del libro de A. S. Frumento, “Biofísica” (Ed. Mosby/Doyma Libros, 3ª ed. Madrid 1995). 2.1. INTRODUCCIÓN A LA TEORÍA DE CONTROL. 2.1.1 Noción de control. En este tema, vamos a estudiar la teoría del control. El campo del control ha emergido, especialmente en el siglo XX, como una parte indispensable de la tecnología y un elemento importante en la conceptualización de ideas científicas en una amplia variedad de disciplinas. Sin embargo, como veremos, desde tiempos remotos existen distintos dispositivos que muestran el interés del hombre de todos los tiempos por controlar determinados aspectos de su entorno. Aunque a veces tiende a confundirse “control” con el concepto más específico “control por realimentación” (feedback), es preferible dar al término control un significado más amplio. Volveremos posteriormente sobre el tema más concreto del control por realimentación. La teoría de control, considerada más globalmente, sería una disciplina científica que se ocupa del estudio de la evolución de las variables involucradas en el control de un proceso o sistema determinado (físico, biológico, social, en ingeniería, etc). El proceso o sistema “controlado” puede ser de muchos tipos: control y regulación de máquinas, metabolismo y coordinación muscular en organismos biológicos, control de la actividad económica por políticas gubernamentales, etc. Hablando más científicamente, la teoría moderna del control sería una rama de la teoría de sistemas que se ocupa del cambio de comportamiento de un sistema complejo mediante acciones externas. Si la física es la ciencia ocupada de la comprensión del entorno físico, el control sería la ciencia que estudia la modificación de este entorno, en sentido físico, biológico o incluso social. Un dispositivo de control es un método por el que se consigue que una variable (o conjunto de variables) evolucione de una forma preestablecida (bien porque las mantiene constantes, o porque hace que evolucionen según un criterio dado). Dicho sistema de control puede estar accionado eléctricamente, mecánicamente, gracias a la transmisión de una presión por un fluido, etc. Conviene, sin embargo, distinguir entre lo que es el dispositivo físico de control, y el sistema matemático que lo regula. La teoría de control es una ciencia matemática, más incluso que la física. Los principios de control se expresan siempre en una forma matemática, y son potencialmente aplicables a cualquier situación concreta. La teoría del control tiene conexiones profundas con otras áreas clásicas de la matemáticas, como el cálculo de variaciones y la teoría de ecuaciones diferenciales. Llegó a constituirse en una disciplina nueva en los años 1950-1960. Después de la Segunda Guerra Mundial, el estudio de determinados problemas aparecidos en ingeniería y economía condujo al descubrimiento de que, siendo variantes de otros problemas ya conocidos en cálculo de variaciones, eran problemas no estudiados suficientemente en sus rasgos específicos. El reconocimiento de una misma estructura matemática subyacente hizo que surgiese la teoría moderna del control. Es útil hacerse la pregunta de por qué un tema como éste en un curso introductorio de Física para biólogos. Este campo, enraizado en la Mecánica más tradicional, proporciona importantes principios organizativos para la fisiología y la biología molecular. La teoría del control proporciona una base para la comprensión cuantitativa de los sistemas de regulación biológicos. En los organismos vivos están resueltos multitud de problemas químicos, mecánicos, termodinámicos, eléctricos, de comunicación, de información, etc., cuya formulación y solución la ciencia está aún bien lejos de obtener. Prácticamente todo proceso microscópico y macroscópico en organismos vivos requiere la acción de algún principio de control y realimentación. Los ejemplos que se pueden enumerar son muy numerosos: el control on-off de la producción de proteínas a partir del ARN, el control bacteriófago viral de las enzimas bacteriales y ADN, el control neuromuscular del ojo al enfocar imágenes, el control de la temperatura corporal, el control del nivel de glocusa en sangre, etc. Por otro lado, una contribución fundamental de C. R. Darwin durante el siglo XIX fue la teoría de que el control por feedback en un período de tiempo largo es responsable de la evolución de las especies. En 1931, V. Volterra explicó el balance entre dos poblaciones de peces en un estanque cerrado usando la teoría del control por realimentación. En otro ámbito, el desarrollo tecnológico en campos como el transporte, las comunicaciones, la distribución energética y el procesado industrial requiere de métodos de medida precisa y de elementos de control de la salida de estos sistemas o dispositivos. La necesidad de regular de forma precisa la salida de esta gran variedad de dispositivos ha conducido al desarrollo de esta disciplina intelectual nueva, la teoría del control automático. 2.1.2 Estructura de un problema de control. Los procesos o sistemas a los que se aplica la teoría de control tienen siempre una misma estructura. Vamos en primer lugar a analizar los elementos fundamentales que aparecen en un problema de control. Se considera un sistema o proceso físico, biológico, mecánico, eléctrico, químico, industrial, social, etc., cuya evolución queremos estudiar. El estado dinámico interno del sistema en cada instante de tiempo t puede ser descrito por un conjunto de n cantidades, representadas como un vector x1(t), ..., xn(t), y denominadas variables de estado. En cada instante de tiempo t, la evolución de las cantidades x1(t), ..., xn(t) depende de las propias cantidades x1(t), ..., xn(t) y de los valores de k variables u1(t), ..., uk(t) denominadas variables de control, que son variables a nuestro arbitrio dentro de unos ciertos límites. Dichas variables de control gobiernan el comportamiento del sistema estudiado de una forma conocida. Nuestro objetivo es llevar el proceso desde un estado inicial a un estado final o meta. Los diversos modos de funcionamiento del sistema que lo llevan del estado inicial al final no son iguales. Los hay que nos proporcionan una mayor ventaja. Esta cualidad de los diversos modos de funcionamiento del proceso es cuantificada mediante la designación de un número a cada modo de funcionamiento. Esta asignación es el índice de funcionamiento J. Nuestro empeño es manejar los controles de tal modo que, al llevar el sistema del estado inicial al final, el índice J sea óptimo. Se llama dinámica al conjunto de estas leyes que establecen cómo cambian las variables de estado. Los valores para las variables de control son elegidos según un objetivo o criterio preestablecido. La naturaleza del sistema físico habitualmente impone limitaciones en los valores posibles para estas variables de control. La situación implica, obviamente, que la evolución futura está descrita en función del valor presente de las variables de control, y del valor futuro de las variables de control. Esta formulación acepta, implícitamente, que la acción de control en un tiempo dado puede escribirse en función del estado del sistema en ese instante de tiempo. Tal función del estado, que determina la acción de control que ha de tomarse sobre el sistema en cada instante se denomina ley de control. Este concepto engloba las leyes de control por realimentación, pero es más general. La formulación matemática de un problema general de control de un sistema regido por ecuaciones diferenciales ordinarias requiere varios tipos diferentes de información o elementos: a) Ley de evolución del sistema o ley del proceso. El comportamiento del sistema debe ser descrito de una forma matemáticamente precisa. La ley de evolución relaciona el estado, respuesta o salida (“output”) x(t), una variable ndimensional, que se pretende controlar con el control o entrada (“input”) u(t), una variable k-dimensional. Aquí supondremos que esta ley viene dada por una ecuación vectorial diferencial ordinaria x' (t ) f (t , x(t ), u(t )) La ecuación puede ser lineal o no lineal. El objetivo final consiste en controlar el proceso mediante un control de ciclo cerrado y de modo óptimo con respecto a un criterio que será señalado más adelante. b) Estado inicial y conjunto meta. Se señala un estado de partida mediante un valor inicial del estado del sistema x0 x(t 0 ) en el instante t0. Las diferentes componentes del estado x(t) que se pretende controlar pueden ser magnitudes tales como posición, velocidad, aceleración, velocidad angular, temperatura, intensidad de corriente, etc. El conjunto meta G(t) es un conjunto dado del espacio de estados que varía con el tiempo de modo continuo. Se trata de llevar el proceso del estado x0 a un estado x(t1) perteneciente a G(t1). El conjunto G(t) podría ser un punto g(t) y el problema podría consistir en controlar el error e(t)=x(t)-g(t) hacia cero. En este caso, el problema puede simplificarse escribiendo e(t ) f (t , e(t ) g (t ),u(t )) g (t )) f1 (t , e(t ),u(t )) y entonces el conjunto meta es en todo instante el origen. Como se ve, se trata del caso particular de control por realimentación o feedback. c) La clase de controles. Hasta ahora no hemos especificado qué funciones consideramos como posibles funciones de control. La elección de uno o varias acciones de control, entre las múltiples posibilidades disponibles, estará basada en la información respecto al objetivo del control y el conocimiento de las posibles perturbaciones sobre el sistema. d) Esta elección se llama optimización. Para ello, ha de establecerse el propósito del control (criterio de control) y ha de conocerse la respuesta del sistema frente a posibles perturbaciones del entorno de una forma matemática precisa. Además, es necesario conocer de forma precisa el efecto de cualquier control potencial que puede ser aplicado al sistema bajo todas las circunstancias posibles para el entorno. El índice de funcionamiento o funcional de coste. Se llama funcional porque es una función del control u(t), que es a su vez una función del tiempo. El funcionamiento del sistema bajo la acción de diferentes controles es, naturalmente, distinto. Su calidad se ha de medir mediante un criterio que hemos de señalar. En general, éste consiste en adoptar un coste dado por un funcional de la forma t1 J (u) f 0 (t , x(t ), u(t ))dt t0 f0 siendo una función escalar, y u(t) una función de control admisible, a la que a veces se la somete a algún tipo de condición o restricción propia del sistema que se estudia. Si, por ejemplo, f0 es idénticamente igual a uno, resulta J (u) t´t 0 , y el problema es un problema de control de tiempo óptimo. Un control será tanto mejor que otro cuando el coste correspondiente sea más bajo. Así, un control será óptimo cuando ninguno de entre los controles admisibles proporciona un coste más bajo. La minimización de un funcional, es decir, la búsqueda de la función o funciones u(t) de entre un conjunto de funciones que hacen mínimo el valor de un cierto funcional J es un problema bien clásico, objeto de una rama del análisis matemático con métodos propios denominada cálculo de variaciones, nacida en los albores del cálculo diferencial e integral. El objetivo de la teoría de control es, por tanto, la formulación matemática de toda esta información sobre el sistema, y, en segundo lugar, la deducción de los métodos matemáticos por los que pueda obtenerse una respuesta concreta a la optimización. La teoría matemática de control no trata con la realidad física sino sólo con su descripción matemática (modelos matemáticos). De esta forma, la teoría de control es aplicable a cualquier situación concreta (física, biología, economía,...), siempre que la situación pueda ser descrita, en un alto grado de precisión, por un modelo que pertenece a una clase para la que la teoría ha sido ya desarrollada. Una vez que ha sido deducida la acción de control apropiada mediante métodos matemáticos, la implementación del control pasa a ser una tarea tecnológica. La solución matemática de un problema de control no siempre existe. La determinación de las condiciones de existencia de solución de forma rigurosa ha tenido un efecto importante en la evolución de la teoría moderna del control, tanto desde el punto de vista teórico como desde el punto de vista aplicado. Tan importante como el estudio de la existencia de solución, es la controlabilidad, que expresa el hecho de que puede alcanzarse una solución determinada mediante algún tipo de control. Si esta condición se satisface, entonces, existirá algún método de optimización a partir de información acerca del criterio o propósito del control y de las perturbaciones del sistema. Los principales problemas asociados a sistemas de control son la controlabilidad, la observabilidad, la estabilización y el control óptimo. El problema de la controlabilidad, como ya se ha adelantado, es el siguiente. Supongamos que el sistema se encuentra inicialmente en el estado x1(t), ..., xn(t) = a1, ..., an. ¿Existe un conjunto de valores para las variables de control u1(t), ..., uk(t) de tal forma que el sistema alcance un estado predefinido b1, ..., bn en un tiempo finito? La observabilidad es el problema relacionado con la obtención de información acerca del estado del sistema x1(t), ..., xn(t) en un instante de tiempo t cuando no puede medirse de forma directa el estado del sistema, sino que sólo puede medirse una determinada función del estado. El problema de la estabilización es la elección del conjunto de controles u1(t), ..., uk(t) en cada instante de tiempo t de forma tal que el estado x1(t), ..., xn(t) del sistema se acerque más y más a un estado preasignado cuando avanza la variable t tiempo del sistema. Probablemente, el problema más importante de la teoría de control es el del control óptimo. El problema aquí es la elección de las variables de control de tal forma que el sistema alcance el estado deseado y lo haga de forma óptima en el siguiente sentido. Se trata de encontrar el valor para las variables de control u1(t), ..., uk(t) que llevan el estado del sistema al estado deseado final, haciendo simultáneamente mínima una cantidad que, de alguna forma, mide numéricamente el grado de operación del sistema. A esta cantidad se la denomina índice de funcionamiento o funcional de coste. 2.1.3 Clasificación de los problemas de control. Puede resultar útil recoger en primer lugar varios problemas clásicos en la teoría del control automático para fijar la mente en una serie de ideas básicas como punto de partida1. A. Problemas de regulación. Consideremos una variable, o un conjunto de variables, asociada a un sistema dinámico. Estas variables tienen que mantenerse a un nivel deseado frente a un conjunto de circunstancias cambiantes. Existe un segundo conjunto de parámetros, las variables de control, que pueden ser ajustados de forma tal que se consiga la deseada regulación. Las variables ajustables o de control se denominan a veces “inputs” frente a las variables reguladas o “outputs”. Lo que es central en este caso es que el valor de la variable de estado tenga un valor dado en todo instante de tiempo, es decir, lo esencial es la trayectoria, siendo ésta constante. Ejemplos específicos son la regulación de la velocidad de giro 1 Roger Brockett, New Issues in the Mathematics of Control, to appear in Mathematic Unlimited, 2001, Springer. de un molino de viento (o de la máquina de vapor), la velocidad de un avión controlando el flujo de combustible, la regulación del contenido en oxígeno de la sangre usando la velocidad respiratoria, temperatura corporal, nivel de glucosa en sangre, etc. B. Problemas de Control de Punto Final. Hay variables de estado, variables de control y trayectorias, al igual que en el caso anterior. En este caso, sin embargo, la forma de la trayectoria no es de gran interés; es el punto final el que tiene importancia. Ejemplos estándar incluyen problemas de “cita” como la exploración espacial, procesado en ingeniería química en el que los reactantes son introducidos y el proceso controlado de forma tal que se consigue el producto final con una pureza especificada, el control de espines nucleares en resonancia magnética nuclear aplicando campos magnéticos y pulsos de radiofrecuencia de tal forma que la el haz de electrones llegue finalmente a la posición especificada, etc. C. Problemas de servomecanismos. También hay variables de estado y de control y trayectorias, y un sistema dinámico asociado. En este caso, sin embargo, se desea que la salida siga una trayectoria especificada por la entrada. Por ejemplo, el control de una fresadora que ha de quitar metal según indica un molde, el control de un avión de tal forma que vuele en la trayectoria indicada por el controlador de vuelo, y el control de un telescopio para que siga el movimiento aparente de una estrella tal y como se ve desde la Tierra. D. Problemas de Modo Repetitivo. De nuevo tenemos variables asociadas a un sistema dinámico y variables de control que influyen en su evolución. El problema a regular consta de una serie de elementos que han de repetirse cíclicamente de forma eficiente. Un ejemplo común es el control de los cuatro ciclos de funcionamiento de un motor de combustión interna (entrada de combustible/compresión/combustión/salida de gases residuales). Ejemplos en Biología podrían ser el control de los procesos respiratorios, control de la acción de bombeo del corazón, etc. Esta clasificación, quizá no completa, sin embargo tiene la virtud de proporcionar un punto de partida con un detalle suficiente para nuestros propósitos. 2.1.4 Control por realimentación. Por “control automático” o “control por realimentación” (o retroalimentación) entendemos que el dispositivo alcanza de forma automática los valores establecidos para sus variables de estado (“output”) de forma muy precisa, a pesar de las variaciaciones que puedan producirse en la entrada (“input”) del dispositivo. El control por realimentación se llama también control de CICLO CERRADO, frente a los sistemas de control de CICLO ABIERTO, donde no hay comparación de las variables de estado con los valores deseados para las mismas. El sistema se realimenta a sí mismo, pues el control óptimo se obtiene como función del estado real del sistema. La misma variable que se desea regular retroalimenta el regulador o dispositivo de control. De esta forma, el control por feedback es autocorrectivo, por lo que si en el sistema se produce una perturbación imprevista, el sistema es capaz de corregirla. El “feedback” o control de realimentación es el mecanismo básico por el cual los sistemas, sean mecánicos, eléctricos, o biológicos, mantienen su equilibrio u homeóstasis. En las formas de vida superiores, las condiciones bajo las cuales la vida puede mantenerse son muy estrictas. Un cambio en la temperatura corporal de medio grado centígrado es normalmente un signo de enfermedad. La homeóstasis del cuerpo se mantiene gracias al uso del control por retroalimentación2. Los elementos esenciales que aparecen en un sistema de control por realimentación son: primero, un elemento que mide las variables de estado (“output”); segundo, un medio de comparar esa salida con el valor deseado para la misma; y tercero, un método de realimentar esta información a la entrada (variables de control) de tal forma que se minimiza la desviación de la salida respecto al nivel deseado. Los sistemas o procesos de control suelen ser representados de modo conveniente mediante diagramas funcionales en los que se visualiza el papel de cada uno de los órganos del sistema. Un ejemplo podría ser el de la figura siguiente: Se representa en la figura un proceso físico, mecánico, biológico, etc., con una entrada previsible dentro de ciertos límites, pero no exactamente, y una salida deseable D. El valor real de la salida 0 es detectado por una unidad de medida que envía una señal a un elemento diferenciador. Este mide la diferencia o error D-0 y transmite una señal a la unidad controladora, la cual actúa sobre el proceso de forma adecuada a fin de anular dicho error. Obviamente, la estabilidad es una cualidad deseable de cualquier sistema de control. Es necesario que la perturbación que se efectúa en los controles a fin de corregir el error de desviación en la salida no cause una alteración excesiva en sentido contrario al de dicha desviación. De ser así, el error del proceso pasaría alternativamente de un sentido al otro, desvirtuándose el sistema de control en su propia finalidad. Un sistema de control inestable puede ejemplificarse en la marcha de un aprendiz de 2 Wiener, N., Cybernetics: or Control and Communication in the Animal and the Machine, Cambridge: MIT Press, 1948. ciclista. Un pequeño error inicial de dirección y equilibrio es corregido con intensidad creciente, acabando inexorablemente el recorrido con una caída. El control por realimentación puede definirse como el uso de las propias variables de estado como medio de controlar el comportamiento del sistema. Un ejemplo de la vida diaria de un sistema de control por retroalimentación es el control de la velocidad de un automóvil, que usa la diferencia entre la velocidad real y la deseada para variar el flujo de combustible. Ya que la salida del sistema se usa para regular su entrada, tal dispositivo se dice que es un sistema de control de bucle cerrado. En este tema, no sólo trataremos con sistemas de control naturales, como aquellos que se presentan en organismos vivos o en la sociedad, sino también con sistemas de control diseñados por el hombre, como los usados para controlar aviones, automóviles, satélites, robots y procesos industriales. 2.1.5 Los métodos de la teoría de control. Los métodos de la teoría de control son extraordinariamente variados, dependiendo de la naturaleza de los problemas. Estos admiten una primera clasificación en dos grupos: problemas determinísticos y problemas estocásticos. Son problemas estocásticos aquellos en cuya formulación intervienen elementos regidos por leyes aleatorias, al menos a efectos de quien plantea el problema. Es decir, problemas en los que el estado del sistema es influenciado por perturbaciones aleatorias. Así, si se trata de plantear un nuevo sistema económico para el futuro, es claro que la evolución del sistema tendrá aspectos imprevisibles regidos por leyes aleatorias en gran parte. Quien fabrica tal plan ha de conjeturar, basado tal vez en su conocimiento previo de la trayectoria evolutiva de otros sistemas semejantes, la situación de éste y sus reacciones posibles a tal o cual manipulación. Los problemas determinísticos admiten una gran variedad. El proceso que se estudia puede regirse por un sistema de ecuaciones diferenciales ordinarias, o parciales, o en diferencias finitas. La formulación exacta de un proceso real conduce con frecuencia a problemas matemáticos intratables por su excesiva complicación. Caben entonces dos actitudes. Uno puede contentarse con una simplificación del problema que resulte asequible al tratamiento matemático, o bien, renunciando al tratamiento analítico completo del problema, se acude a su tratamiento numérico, ensayando obtener una solución aproximada mediante el uso de computadores y los métodos del análisis numéricos. Con frecuencia surgen problemas que ocasionan por su interés matemático y práctico el desarrollo de todo un nuevo campo con métodos propios. Así, por ejemplo, ha surgido el de las ecuaciones diferenciales con argumento retardado. Consideremos el sistema del diagrama funcional representado anteriormente para el control por realimentación. El proceso, que podemos pensar como una cadena de fabricación en serie, tiene una entrada y una salida. Es razonable pensar que, desde que el proceso comienza con la fabricación de una pieza hasta que ésta sale acabada, que es cuando pasa por la unidad de medida, transcurra un cierto tiempo . Mientras tanto, el proceso ha seguido funcionando en las mismas condiciones, y si éstas han sido defectuosas, el control no tiene oportunidad de actuar hasta un tiempo después. Esta situación, así como la posibilidad, también razonable, de que la acción de control no sea instantánea, sino diferida unos segundos, da lugar a la consideración de ecuaciones diferenciales del tipo F (t , x, x' (t ), x' (t )) 0 que se denominan de argumento retardado. Asimismo, los problemas con que se enfrenta la teoría de control son a menudo no lineales. Esto motiva la necesidad de utilización del análisis no lineal, rama que se encuentra hoy en día en plena expansión. Vamos ahora a examinar algunos de los principios básicos de la teoría de control. El modo de proceder en los problemas del cálculo de variaciones clásico se ha conservado en los modernos problemas de control en una buena medida. De entre las posibles funciones que es necesario considerar se logra, primeramente, descartar un buen conjunto de ellas, mediante condiciones necesarias que ha de satisfacer la solución, o soluciones al problema. Además, esta primera selección permite en muchos casos asentar la existencia de solución o soluciones al problema. En el cálculo de variaciones la ecuación de Euler era una de tales condiciones. En la teoría de control moderna el principio de optimalidad y el principio de máximo de Pontryagin representa un papel similar. El principio de optimalidad es la formulación del hecho obvio de que si una estrategia comprende varios estadios parciales, y es óptima, lo es necesariamente en cada uno de sus estadios. De otro modo, podría ser sustituida por una estrategia globalmente mejor. En otras palabras, si para ir de A a C existe un camino G, que es el mejor posible, y sabemos que pasa por B, es claro que el mejor camino posible para ir de A a B es el que sigue G. El principio máximo de Pontryagin es de formulación más complicada. Se refiere a sistemas de control regidos por ecuaciones diferenciales ordinarias y afirma que el control óptimo, si existe, ha de hacer máxima una cierta expresión de significado nada obvio. El principio es de gran aplicabilidad, y permite en muchas ocasiones resolver completamente el problema en cuestión. El principio de bang-bang se refiere a sistemas de control lineales regidos por ecuaciones diferenciales ordinarias en los que el índice de funcionamiento es el tiempo. Tales problemas se denominan problemas lineales de control óptimo de tiempo. Un control se llama de conmutación cuando los valores que toma son +1 y –1 alternativamente. Puede ser realizado, por ejemplo, mediante un conmutador eléctrico que solamente admite dos posiciones. Un control de conmutación se llama también en la literatura control bang-bang. El principio de bang-bang afirma que cualquier efecto realizable mediante un control medible puede ser realizado también mediante uno de conmutación en el mismo tiempo. Por tanto, si existe un control de tiempo óptimo, existe un control de conmutación óptimo. Y también, si un control de conmutación es de tiempo óptimo con respecto a los otros controles de conmutación, entonces es óptimo. El principio de bang-bang es de gran importancia práctica, pues un control de conmutación es mucho más sencillo de realizar efectivamente que un control de cambio continuo. 2.2. HISTORIA DEL CONTROL AUTOMÁTICO. Comenzaremos haciendo una breve historia de la teoría del control automático. Estudiando el progreso histórico de la teoría del control, es posible distinguir algunas tendencias fundamentales y señalar algunos avances clave. La teoría del control es una disciplina práctica. Como tal, su progreso ha estado muy ligado a los problemas prácticos que necesitaron ser resueltos en cualquier fase de la historia humana. Desde que existe la cultura humana, el control ha significado alguna clase de poder o dominación del hombre sobre su entorno. Determinados fragmentos cuneiformes sugieren que en el siglo veinte antes de Cristo, en la antigua Mesopotamia ya existían determinados sistemas de control de irrigación. Los desarrollos clave de la historia de la humanidad que han afectado al desarrollo del control por realimentación han sido: 1. La preocupación de los Griegos y los Árabes por controlar de forma precisa la evolución del tiempo. Esto representa un período comprendido entre los años 300 AC hasta el 1200 DC. 2. La Revolución Industrial en Europa. Generalmente se sitúa su comienzo en el tercer cuarto del siglo XVIII; sin embargo, sus raíces pueden encontrarse ya en los años 1600. 3. El comienzo de las comunicaciones de masas y la Primera y Segunda Guerras Mundiales. Esto representa el período entre 1910 y 1945. 4. El comienzo de la era espacial y del computador en 1957. En un punto intermedio entre la Revolución Industrial y las Guerras Mundiales, hubo un desarrollo extraordinariamente importante. La teoría del control comenzó a adquirir su lenguaje escrito, el lenguaje de las matemáticas. J. C. Maxwell proporcionó el primer análisis matemático riguroso de un sistema de control por retroalimentación o feedback en 1868. De esta forma, y en cuanto a su formulación matemática, se puede dividir la historia del desarrollo matemático de la teoría del control en varias etapas: 1. Prehistoria del control automático: sería el período anterior a 1868, hasta la publicación del primer trabajo matemático sobre la teoría del control por Maxwell. 2. Según Friedland3, podemos llamar al período comprendido entre 1868 y los primeros años del siglo XX el período primitivo del control automático. 3. Es habitual llamar al período desde entonces hasta 1960 el período clásico; 4. y al período posterior a 1960 hasta el presente el período moderno. 2.2.1 Antecedentes de la teoría de control. Estudiemos de forma rápida la historia de los dispositivos de control automático. Una referencia detallada para el período entre –300 hasta la Revolución Industrial puede encontrarse en la referencias citadas ( 4, 5). 3 Friedland, B., Control System Design: An Introduction to State-Space Methods, New York: McGraw-Hill, 1986. Relojes de agua de los Griegos y los Árabes. La primera motivación para el control en tiempos antiguos fue la necesidad de determinaciones precisas del devenir del tiempo. Así, alrededor de –270, el mecánico griego Ktesibios de Alejandría inventó un regulador de corcho (válvula de flotador) para un reloj de agua. La función de este regulador era mantener el nivel del agua en un tanque a una profundidad constante. Esta profundidad constante producía un flujo de agua a través de una tubería situada en la parte inferior del tanque que llenaba un segundo depósito a una velocidad constante. El nivel de agua en el segundo depósito era proporcional al tiempo transcurrido. De esta forma, el reloj de Ktesibios medía con precisión las horas, los días y los años. El regulador de Ktesibios consistía en un flotador para controlar el flujo de agua entrante a través de una válvula; cuando el nivel de agua bajaba, la válvula se abría y ponía el nivel del reservorio al nivel adecuado. Este regulador flotante tenía la misma misión que el flotador de la cisterna de los actuales WC. 4 Mayr, O., The Origins of Feedback Control, MIT Press, Cambridge 1970; Mayr O., The Origins of Feedback Control, Scientific American vol 1(4), pág. 110-118 (Octubre 1970). Disponible on-line en http://reserve.libraries.psu.edu/me/19010.htm. 5 Fuller, A.T., "The Early Development of Control Theory," Trans. ASME (J. Dynamic Systems, Measurement, & Control), vol. 98G, no. 2, pp. 109-118, June 1976. y no. 3 pp. 224-235, September 1976. Un regulador flotante fue usado por Filón de Bizancio en –230 para mantener el aceite de una lámpara a un nivel constante. Durante el primer siglo DC, Heron de Alejandría desarrolló reguladores flotantes y similares para propósitos tales como dispensadores de vino, diseños de sifones para mantener entre dos tanques de agua diferencias de nivel constantes, la apertura de puertas de templos, etcétera. Dispensador de vino. “Máquina” de aire caliente: Debajo de las puertas del templo, se sitúa una vasija esférica B que contiene agua. Una tubería FG conecta la parte superior de esta esfera con el pedestal del altar, un espacio hueco y herméticamente cerrado. Otra tubería conduce desde la esfera a otra vasija o cubo, colgada a través de una polea por la que pasan unas cuerdas atadas a los ejes que abren o cierran las puertas. Otras cuerdas sujetan un contrapeso a través de otra polea, atadas a los mismos ejes de forma tal que su movimiento produce el giro opuesto al de las cuerdas provinentes de la vasija colgada. Si se enciende un fuego en el altar, el aire calentado se expande, pasa por la tubería y empuja al agua de la esfera a través del sifón al cubo colgado. El peso de esta vasija hace que ésta descienda, girando los ejes de las puertas, y haciendo que éstas se abran. Cuando se extingue el fuego, el aire se condensa, el agua vuelve de nuevo a través del sifón del cubo a la esfera, el contrapeso cae y las puertas del templo se cierran. En la antigua China se han encontrado dispositivos como el regulador de pajita que se muestra en la figura inferior. Desde 800 hasta 1200, varios ingenieros árabes como los tres hermanos Musa, Al-Jazari y Ibn Al-Sa’ati usaron reguladores flotantes para relojes de agua y otras aplicaciones. Durante este período se usó el importante principio de control “on/off”, que volverá a surgir al tratar los problemas de tiempo mínimo en los 1950. Por fin, cuando Bagdad cayó ante los mongoles en 1258, todo este pensamiento creativo vió su fin. Además, la invención del reloj mecánico en el siglo XIV hizo obsoleto el reloj de agua y sus sistemas de feedback o retroalimentación. (El reloj mecánico no es un sistema de feedback). El regulador flotante no aparece otra vez hasta su uso en la Revolución Industrial alrededor de 1750. Además de situarse en el tiempo, el hombre se preguntó desde antiguo por su lugar en el espacio. Merece la pena mencionar un sistema de control de pseudo-retroalimentación que se desarrolló en China en el siglo XII (Wu Tejen, año 1107) para la navegación. Los carros de combate tenían una estatua que giraba gracias a un mecanismo ligado a las ruedas del carro de tal forma que la estatua siempre apuntaba al sur. Usando la información direccional proporcionada por la estatua, el conductor del carro podía seguir una línea recta. Llamamos a este mecanismo pseudo-feedback porque no involucra técnicamente un mecanismo de retroalimentación propiamente dicho, a menos que las acciones del conductor sean incluidas como parte del sistema. Por ello, no es un sistema de control automático. La Revolución Industrial. La Revolución Industrial en Europa fue consecuencia, entre otros factores, de la introducción de las primeras máquinas motrices, especialmente las máquinas de vapor. La historia comienza con la invención de los molinos para moler grano, y continúa con el diseño y construcción de hornos, calderas, y por fin, la máquina de vapor. Estos dispositivos no podían ser regulados de forma adecuada a mano, y de esa forma surgió la necesidad de desarrollar sistemas de control automático adecuados. Se inventaron en esta época una gran variedad de dispositivos de control, tales como reguladores flotantes, reguladores de temperatura, reguladores de presión, y dispositivos de control de velocidad. James Watt inventó su máquina de vapor en 1769, y esta fecha marca para los historiadores el comienzo aceptado de la Revolución Industrial. Sin embargo, las raíces de la Revolución Industrial pueden llevarse hasta los años 1600 o antes, con el desarrollo de los molinos y los hornos. Antes de Watt, hubo otros inventores que diseñaron y construyeron máquinas de vapor. Especialmente digna de mención es la máquina de vapor de balancín desarrollada por el herrero Thomas Newcomen en colaboración con John Cawley en Devon en 1712. En un extremo del balancín se encontraba la barra del émbolo de una caldera de vapor. Cuando el vapor penetra en el cilindro, el émbolo asciende. Ello da lugar a que el agua penetre en el cilindro, lo que a su vez produce la condensación del vapor, creando una región de vacío, y el retroceso del émbolo por el interior del cilindro hasta la posición inicial debido a la presión atmosférica exterior. En el otro extremo del balancín había una bomba capaz de extraer 540 litros de agua por minuto con doce oscilaciones del balancín. La eficacia de esta máquina de vapor era muy baja (alrededor de un uno por ciento de la energía utilizada para calentar la caldera), porque era necesario estar calentando permanentemente la caldera (muy pesada, y por tanto con un valor alto para la capacidad calorífica) pues ésta continuamente se enfriaba en el momento de la condensación del vapor (al retroceder el émbolo). El hecho de que estas máquinas de vapor tempranas fueran energéticamente ineficientes y su funcionamiento fuera regulado a mano, las hacía poco adecuadas al uso industrial. Es importante darse cuenta de que la Revolución Industrial no comenzó realmente hasta la invención de máquinas mejoradas y sistemas de control automático para regularlas. La denominación “Revolución Industrial” puede resultar exagerada. Sin embargo, es indudable que el cambio producido en las sociedades industriales tras la invención de la máquina de vapor ha sido enorme. Antes de 1783 (primera venta de una máquina de vapor), la disponibilidad energética de un hombre era la que podía producir por sí mismo o con ayuda del trabajo animal. Un granjero con un caballo o dos disponía de una potencia promedio de 0.1 kW. En la actualidad, al comienzo del siglo XXI, el consumo energético per cápita en el mundo desarrollado es de alrededor de 10 kW. Este incremento ha revolucionado la forma de vida de una forma extraordinaria. Los molinos de viento. Los constructores de molinos de viento, por su parte, desarrollaron una gran variedad de sistemas de control por realimentación. El “fantail” o “ventilador de cola”, inventado en 1745 por el herrero británico Edmund Lee, consistía en un pequeño ventilador montado a ángulo recto de la rueda principal de un molino de viento. Su función era hacer girar el eje del molino de viento de forma continua para que éste quedase alineado en la dirección del viento, maximizando la eficiencia del mismo. La tolva (dispositivo colocado encima de la muela –piedra de molino- desde donde va cayendo la molienda al sitio en que es triturada) es un dispositivo que regula el flujo de grano en un molino, dependiendo de la velocidad de rotación de la muela. Estaba en uso en una forma refinada en 1588. Y finalmente, eran necesarios también dispositivos para medir y regular la velocidad de rotación de los molinos. Para construir un controlador de realimentación que mantenga estable la velocidad, es necesario en primer lugar disponer de dispositivos de medida de la misma. Los constructores de molinos desarrollaron varios dispositivos para medir la velocidad de rotación. Usando estos sensores, fueron inventados varios dispositivos de regulación de velocidad, incluyendo velas para molinos de viento autorregulados. La mayor parte de la tecnología que desarrollaron los constructores de molinos fue más tarde desarrollada para su uso en la regulación de la máquina de vapor. Reguladores de Temperatura. Cornelius Drebbel, ingeniero holandés, vivió en Inglaterra algún tiempo, y también en la Praga del Emperador Rudolf II, junto a su contemporáneo J. Kepker. Alrededor de 1624, desarrolló un sistema de control de temperatura automático (termostato) para un horno, motivado por su creencia de que los metales básicos podían ser convertidos en oro manteniéndoles a una temperatura constante y precisa durante un período largo de tiempo. También usó este regulador de temperatura en una incubadora para gallinas ponedoras. Los reguladores de temperatura fueron estudiados por J. J. Becher en 1680, y se usaron de nuevo en una incubadora por el Principe de Conti y R.-A. F. De Réaumur en 1754. El “registro centinela” se desarrolló en América por W. Henry alrededor de 1771, quien sugirió su uso en hornos químicos, en la producción de acero y porcelana, y en el control de la temperatura de un hospital. No fue hasta 1777, sin embargo, cuando Bonnemain, un inventor parisino, mejoró estos sistemas desarrollando un regulador de temperatura adecuado para uso industrial, que fue patentado en 1783. Su termostato fue usado en una incubadora para el crecimiento de gallinas. Su dispositivo consistía en un sensor de temperatura compuesto por una varilla de hierro rodeada por un tubo de plomo. La dilatación o compresión de la longitud del tubo de plomo debido al cambio de temperatura constituía la variable que controlaba la temperatura. Este movimiento se acoplaba a una palanca de control de entrada de aire de un horno de tal forma que un aumento en la temperatura del horno reducía el flujo de entrada de aire al horno y viceversa. El control de temperatura permitió a Bonnemain, entre 1778 y 1794, dirigir una enorme granja a las afueras de París que abastecía de gallinas a la corte real y al mercado de París. Su dispositivo fue más tarde instalado en el horno de una planta productora de agua caliente. Reguladores flotantes. La regulación del nivel de un líquido era condición indispensable en dos áreas importantes en los últimos años del siglo XVIII: en la caldera de una máquina de vapor y en los sistemas de distribución de agua doméstica. Por tanto, el regulador flotante recibió un nuevo interés, especialmente en Gran Bretaña. En su libro de 1746, W. Salmon citaba precios para reguladores flotantes usados para mantener el nivel de depósitos de agua para viviendas. Este regulador fue usado en las primeras patentes de las cisternas de WC alrededor de 1775. La cisterna fue refinada posteriormente por Thomas Crapper, un fontanero londinense, que gracias a sus inventos, fue armado caballero por la Reina Victoria, y pasó por tanto a ser sir Thomas Crapper. El primer uso conocido de un regulador de válvula flotante en una caldera de vapor está descrito en una patente debida a James Brindley en 1758. El usó un regulador en una máquina de vapor diseñada y construida para bombear agua. S. T. Wood usó un regulador flotante para una máquina de vapor en su fábrica de cerveza en 1784. En la Siberia rusa, el minero de carbón Ivan I. Polzunov desarrolló en 1765 de forma independiente un regulador flotante para una caldera de vapor que impulsaba ventiladores para altos hornos. El esquema de regulador flotante de Polzunov se muestra en la figura adjunta. Cuando el nivel de agua cae por debajo de un nivel preseleccionado por la longitud del cable vertical unido al flotador, la válvula se abre y el agua entra en el depósito, hasta que el flotador alcanza el nivel preseleccionado y la válvula de entrada se cierra. En 1791, cuando se adoptó por la firma de Matthew Boulton y James Watt, el regulador flotante era ya de uso común en máquinas de vapor. Reguladores de Presión. Otro problema asociado a la máquina de vapor era el de la regulación de la presión de vapor en la caldera, persiguiendo que el vapor que movía la máquina estuviera a una presión constante. En 1674, el físico francés Denis Papin se percata de que la temperatura de ebullición del agua y otros líquidos depende de la presión a que están sometidos. Cuando las presiones son superiores a la atmosférica, las temperaturas correspondientes a los puntos de ebullición aumentan. Papin aprovecha su descubrimiento y comercializa en 1681 la primera olla a presión. En esta olla metálica herméticamente cerrada, equipada con una válvula de sobrepresión segura inventada por él mismo, la presión del vapor aumenta durante la cocción. Estos valores superiores permiten una cocción más rápida. En el año 1707, Papin usó esta válvula de sobrepresión como dispositivo de regulación de su máquina de vapor de alta presión destinada al bombeo de agua para las fuentes de Kassel. A partir de entonces, este dispositivo de regulación de la presión de vapor fue un dispositivo estándar en las máquinas de vapor. El regulador de presión fue refinado posteriormente en 1799 por R. Delap y también por M. Murray. En 1803, un regulador de presión se combinó con un regulador centrífugo por Boulton y Watt para uso en sus máquinas de vapor. Reguladores centrígugos. La máquina de vapor alcanzó su madurez en 1783 con la venta del primer prototipo de máquina de vapor del escocés James Watt. Dicha máquina, ya adecuada para su uso industrial, fue diseñada mucho antes del primer enunciado de la Primera Ley de la Termodinámica, que data de 1842. El incentivo principal para su desarrollo era evidentemente el deseo de introducir una máquina motriz en la molienda del grano. Usando la máquina de vapor rotatoria, el molino de vapor de Albion comenzó su operación en 1786. Fue en la Universidad de Glasgow donde Watt entró en contacto por vez primera con una máquina de vapor de balancín (inventada por Newcomen), que le había sido entregada para que reparase. Tres novedades esenciales en el diseño de la máquina de vapor de Watt fueron las que definitivamente introdujeron la máquina de vapor en la industria de la época. Dichas mejoras fueron el diseño de “doble acción” que permitió mejorar la eficiencia energética de la máquina de vapor, el “engranaje planetario” (y posteriormente la biela) para transformar el movimiento oscilante en movimiento rotatorio, y el “péndulo cónico” o centrífugo como regulador de la velocidad de salida. En 1765, el constructor Watt separó el condensador del cilindro (que en la máquina de Newcomen iban unidos), eliminando la necesidad de calentar el cilindro (muy pesado, y por tanto con un alto valor para la capacidad calorífica) de forma constante, con lo que se consiguió reducir un 75% de energía. Watt, además, aisló térmicamente el cilindro para evitar pérdidas térmicas. En lugar de la presión atmosférica para lograr el retroceso del émbolo, el modelo de Watt usaba la propia presión de vapor generada. Para ello, se conducía el vapor a ambos lados del émbolo, motivo por el cual esta máquina de baja presión se denominó de “doble acción”. De esta forma, al no condensarse el vapor (el retroceso lo realizaba el propio vapor, y no la entrada de presión atmosférica, que condensaba el vapor) la eficiencia energética era mucho mayor. En segundo lugar hay que considerar la mejora introducida debido al “engranaje planetario” y el volante, que introduce Watt por primera vez para adecuar el movimiento de subida y bajada del émbolo a movimiento rotatorio. Las primeras máquinas de vapor estaban provistas de un movimiento de salida oscilante que era regulado usando un dispositivo conocido como balancín, utilizado ya por Newcomen en su máquina de vapor diseñada para el bombeo de las minas de carbón de Cornwall. Ahora, a pesar de tener una estructura semejante a las de la máquina de vapor de balancín, el movimiento generado por la máquina de vapor es rotatorio. Y finalmente, el problema del control de la velocidad. Un problema asociado a la máquina de vapor rotatoria era la regulación de la velocidad de revolución. Parte de la tecnología de la regulación de velocidad de los constructores de molinos de viento y agua fue desarrollada para este propósito. En 1788, Watt completó el diseño del “regulador de bolas voladoras” (péndulo centrífugo o péndulo cónico) para la regulación de la velocidad de la máquina de vapor rotatoria. El dispositivo empleaba dos esferas metálicas pivotadas que eran desplazadas hacia fuera debido a la fuerza centrífuga. Cuando la velocidad de rotación se incrementaba, los pesos se separaban del eje de giro, accionando un mecanismo (“sistema de varillas en paralelogramo”) que estrangulaba la válvula de flujo de vapor, lo que ralentizaba el funcionamiento de la máquina. De esta forma, se garantizaba de forma automática una velocidad constante de giro. La historia, sin embargo, comienza algo antes. El péndulo centrífugo fue usado por primera vez para controlar la velocidad de giro en molinos de viento. En 1787, Thomas Mead patentó el uso de un péndulo centrífugo para controlar la velocidad de las aspas de un molino de viento. Las piedras de un molino de viento tenían tendencia a separarse (levantarse la superior frente a la inferior) cuando la velocidad angular de las piedras era muy elevada. Esto conducía a una molienda no muy fina. Para corregir esto, Mead dispuso el actuador de un péndulo centrífugo para controlar el grado de inclinación de las velas del molino de viento, de tal forma que cuando la velocidad de giro de las piedras se incrementase, el ángulo de inclinación de las velas decreciese, controlando de esta forma la salida (velocidad angular de las ruedas) constante, a pesar de pequeños cambios en la entrada (velocidad del viento). En 1784, Boulton y Watt se involucraron en la construcción de un molino que funcionase con ayuda de una máquina de vapor. Para supervisar la construcción del molino, ellos contrataron a un constructor de molinos de 23 años, John Rennie, que acababa de finalizar su aprendizaje bajo un famoso constructor de molinos escocés, Andrew Meikle. En mayo de 1788, Matthew Boulton visitó este molino, el Molino Albion, y descubrió que Rennie había instalado un péndulo centrífugo para detectar la velocidad de las piedras del molino. La salida del péndulo era aplicada a un dispositivo que presionaba hacia abajo las piedras del molino, para mantener constante el espaciado entre las piedras, a pesar de variaciones en su velocidad de giro, y asegurar de esta forma una molienda fina. Boulton y Watt se dieron cuenta de que el péndulo centrífugo podía servir como un medio para controlar de forma directa la velocidad de la máquina de vapor. Todo lo que necesitaban era aplicar la salida del péndulo centrífugo a la presión de entrada a los pistones de la máquina a través de la válvula de entrada. De hecho, Boulton y Watt acababan de mejorar el diseño de esta válvula, de tal forma que fue sencillo acoplar a dicha válvula el péndulo centrífugo. El diseño real del regulador centrífugo fue dejado en manos de John Southern, un ayudante de Watt que contaba treinta años. A finales de 1788, el regulador había sido diseñado y fue instalado en la máquina de vapor. De esta forma, el controlador de velocidad de los molinos de viento se convirtió el regulador de velocidad de la primera máquina de vapor de la Era Industrial. El péndulo centrífugo, girando en la parte superior de cada máquina de vapor capturó la imaginación de todo quien la observó, convirtiéndose en todo un símbolo de la rama del saber dedicada al control automático. Los dispositivos de control o realimentación utilizados hasta entonces permanecían como secundarios o no jugaban un papel fundamental como parte de la maquinaria que controlaban. Sin embargo, la operación del péndulo centrífugo fue claramente visible incluso para el ojo no entrenado, y su principio de funcionamiento tenía un gusto exótico que parecía a muchos encarnar la naturaleza de la nueva era industrial. Por ello, el regulador centrífugo alcanzó la conciencia del mundo industrial y pasó a ser un símbolo de toda una revolución en Europa. Este fue el primer uso del control por realimentación o feedback que tuvo un conocimiento popular y extendido. Merece la pena mencionar que la palabra griega para regulador es kußernan. En 1947, el matemático norteamericano Norbert Wiener en el MIT (Massachusetts Institute of Technology) estaba buscando un nombre para su nueva disciplina de teoría autómata de control y comunicación en el hombre y la máquina. Investigando el péndulo centrífugo de Watt, él investigó también la etimología de la palabra kußernan, y dio con la palabra griega para gobierno, kußerntV. De esta forma, seleccionó el nombre de cibernética para su nuevo campo. Wiener, partiendo del paralelismo empírico entre los sistemas de regulación orgánicos y técnicos, los estudia utilizando para ello modelos matemáticos y estadísticos, y acaba introduciéndolos en la descripción de nuevos procesos. Alrededor de 1790 en Francia, los hermanos Périer desarrollaron un regulador flotante para controlar la velocidad de una máquina de vapor, pero su técnica no igualaba los resultados del regulador centrífugo, por lo que fue pronto suplantado. Finalmente, en 1799 William Murdock inventó el distribuidor de vapor, que permite un control automático de las válvulas, así como la excéntrica, que simplifica el proceso de transformación del movimiento de ascenso y descenso del émbolo en otro giratorio. El péndulo simpático. Habiendo comenzado nuestra historia del control automático con los relojes de agua de la antigua Grecia, retomamos esta porción de la historia volviendo a la preocupación de la humanidad con el paso del tiempo. El reloj mecánico inventado en el siglo XIV no es un sistema de control de realimentación de bucle cerrado, sino un dispositivo oscilatorio de bucle abierto de precisión, cuya exactitud se asegura protegiendo el mecanismo de perturbaciones externas. En 1793, el franco-suizo Abraham-Louis Breguet, el constructor de relojes más famoso de su tiempo, inventó un sistema de retroalimentación de bucle cerrado para sincronizar relojes de bolsillo. El péndulo simpático de Breguet usaba un caso especial de regulación de velocidad. Consistía en un gran cronómetro de alta precisión con una montura para un reloj de bolsillo. El reloj de bolsillo a ser sincronizado se situaba en la montura ligeramente antes de las doce en punto, a la hora en que un alfiler emergía del cronómetro, se insertaba en el reloj, y comenzaba un proceso de ajuste automático regulando el brazo del muelle del reloj de bolsillo. Después de introducir el reloj en el péndulo simpático unas pocas veces, el brazo regulador se ajustaba automáticamente. En un sentido, este dispositivo se usaba para transmitir la precisión del gran cronómetro al pequeño reloj de bolsillo. El submarino de Isaac Peral. En 1885, el español Isaac Peral presentó un proyecto de “torpedero sumergible” a sus superiores del Observatorio de San Fernando donde trabajaba (el primer submarino torpedero eléctrico). El Ministro de la Marina le hizo acudir a Madrid, donde expuso su proyecto ante una comisión técnica , recibiendo un informe favorable y siendo autorizada la construcción del submarino. La aportación más importante de Isaac Peral al mundo submarino, más que la posibilidad de la navegación bajo el agua, problema resuelto con anterioridad por algunos inventores y especialmente por otro español, Narciso Monturiol, con el “Ictíneo”, fue la resolución de los problemas que el submarino presentaba para ser utilizado como arma, como torpedero sumergible en la terminología de la época. Ligado con ello, tuvo que resolver, entre otros, los problemas del mantenimiento de cota de inmersión (con su “aparato de profundidades”) y de la inclinación. Para ello, desarrolló un regulador automático de profundidad, basado en las propiedades elásticas de la flexión de una lámina, órgano vital destinado a mantener de forma automática la cota de inmersión; y un péndulo diseñado para el control de la inclinación. Se trataba del dispositivo que ponía en marcha, simultánea o independientemente, los motores eléctricos acoplados a las dos hélices de eje vertical, situadas en las cabezas del buque. El elemento sensible era un lámina flexible, en una de cuyas caras actuaba la presión del agua, en tanto que en la otra lo hacía un muelle, previamente regulado a la tensión correspondiente a la profundidad deseada. Cuando el submarino se encontraba a esa profundidad, la lámina no presentaba deformación alguna, por anularse ambas presiones. En este caso se mantenía cerrado un circuito secundario que hacía girar las hélices a poca velocidad, pero suficiente para compensar la flotabilidad positiva del submarino, que era de sólo 50 kg., para que llevando los tanques de lastre llenos y las citadas hélices paradas , la torreta quedara a flote. Por el contrario, cuando la tensión del muelle superaba la presión del agua, la lámina se curvaba cerrando el circuito principal y ambas hélices giraban a gran velocidad, impulsando la nave hacia el fondo, hasta quedar igualadas dichas presiones. Inversamente, cuando la presión del agua era mayor que la tensión del muelle, la lámina se curvaba hacia el otro lado y las hélices giraban en sentido contrario, haciendo subir al submarino. En la práctica, como existía la flotabilidad positiva antes indicada, la cota de inmersión se mantenía mediante la acción intermitente de las hélices, de acuerdo con las ligeras oscilaciones verticales que se producían en todo caso inferiores a 30 cm. de amplitud. Independiente del aparato de profundidades había un péndulo de nivelación que al inclinarse longitudinalmente el submarino, ponía en funcionamiento las hélices hasta colocarlo horizontal. Comunicaciones de Masas y el Teléfono de Bell. A finales de los años 1920 y principios de los 1930, el tema del control y la retroalimentación recibió un empuje extraordinario debido a la aparición de problemas relacionados con la ingeniería eléctrica de sistemas de comunicación. Un problema fundamental en el desarrollo de un sistema de comunicaciones de masas que pudiese extenderse a grandes distancias era la necesidad de amplificar de forma periódica la señal de voz en largas líneas telefónicas. Para que una señal de voz pudiese transmitirse a distancias transcontinentales, era necesario utilizar en la línea varios cientos de dispositivos amplificadores denominados “repetidores”. Fluctuaciones en la ganancia de salida de estos amplificadores producían una distorsión de la señal, por lo que al final, se producía una degradación de la señal que era proporcional al número de amplificadores presentes en la cadena. Desafortunadamente, a menos que se tome gran precaución, no sólo se amplifica la señal, sino también el ruido. Era, pues, absolutamente necesario controlar automáticamente la ganancia de estos amplificadores con una gran precisión. Para reducir la distorsión en amplificadores, Harold Stephen Black 6 demostró la utilidad de la realimentación negativa en 1927. En 1904 había sido inventado el “diodo” (tubo con dos electrodos por el que circula una corriente de electrones) por el británico Ambrose Fleming. En 1906, el físico norteamericano Lee de Forest había presentado el “triodo”. De Forest coloca entre los electrodos del diodo una rejilla metálica, y aplica una corriente 6 Black, H.S., "Stabilized Feedback Amplifiers," Bell Syst. Tech. J., 1934. continua. Mediante pequeñas modificaciones en esta tensión puede variar en gran medida la corriente de electrones en el interior del tubo. Este es el principio en que se basa la amplificación electrónica. Simultáneamente, el físico austríaco Robert von Lieben había presentado de forma independiente una patente para el “relé de rayos catódicos”, consistente en la introducción en el tubo amplificador de tres rejillas que tenían la misma finalidad. Finalmente, en 1927 se inventa el amplificador de realimentación de forma independiente por el neerlandés Klaas Posthumus y el norteamericano Harold Stephen Black, mejorando tanto la calidad de la recepción de las emisiones de radio como la estabilidad de los receptores. Las propiedades amplificadoras logran una notable independencia tanto de la temperatura como del acabado (tolerancias que se producen en la fabricación) de los componentes electrónicos empleados. El principio de amplificación por realimentación se basa en hacer pasar de nuevo una parte de la tensión de salida del amplificador por la entrada, donde se resta de la tensión que entra en el aparato. Estos amplificadores con acoplamiento negativo aplicados a las oscilaciones eléctricas muestran un comportamiento mucho más estable que los amplificadores convencionales. Control de navegación de barcos y Control Clásico. Durante las Guerras Mundiales, el desarrollo de los sistemas de control llegó a ser cuestión de supervivencia. Un problema militar importante durante este período fue el control aplicado a navegación de barcos, que eran cada vez más avanzados en su diseño. Entre los primeros desarrollos estuvo el diseño de sensores para control de bucle cerrado. En 1910, Elmer Ambrose Sperry concibió y desarrolló distintos dispositivos de control basados en la idea del giróscopo. Un giróscopo es un disco montado en una base de tal forma que el disco puede girar libremente alrededor de sus ejes. Por ello, cuando el disco está girando, permanecerá con una orientación fija, independientemente de los movimientos de la base. Sperry se dió cuenta de que ello le confería la posibilidad de convertirse en un dispositivo de control en barcos construidos en metal, en los que las brújulas magnéticas no funcionaban correctamente. El giroestabilizador de Sperry, patentado en 1908, consiste en un giróscopo con una gran inercia, y cuyo eje vertical estaba montado en la bodega del barco. El primer giroestabilizador data de 1912, y conseguía minimizar el cabeceo del barco en su movimiento, con lo que se evitaban las tensiones en la estructura del barco y los daños al cargo, además que se mejoraba el confort en los pasajeros. Durante la Segunda Guerra Mundial, Sperry diseñó un avión sin piloto que podía transportar hasta 450 kg de explosivos a una distancia de 160 km bajo control giroscópico (la primera bomba volante V-1). Más tarde, otros dispositivos inventados por Sperry fueron utilizados para distintos objetivos, entre ellos, el control de barcos de vapor, y para el piloto automático de aviones, etc. N. Minorsky7 introdujo su controlador de tres términos para la conducción de barcos, llegando a ser el primero en usar un controlador PID (proportional-integral-derivative). Él consideró los efectos no lineales en un sistema de bucle cerrado. Desarrollo de Armamento y Apuntamiento de Proyectiles. Otro problema importante en el período de las Guerras Mundiales fue el del apuntamiento preciso de armas a bordo de barcos y aviones dotados de movimiento. Con la publicación de su “Theory of Servomechanisms”, de H. L. Házen8, se inició el uso de la teoría matemática del control en tales problemas. En su artículo, Házen acuñó la palabra servomecanismo, que implica una relación principal/esclavo en los sistemas. La mira de bombardeo de Norden, desarrollada durante la Segunda Guerra Mundial, usaba repetidores síncronos para obtener información acerca de la altura de los aeroplanos, y perturbaciones de velocidad y viento sobre la mira, asegurando alcances precisos de las armas. 2.2.2 El Nacimiento de la Teoría Matemática de Control. El diseño de sistemas de control por feedback fue una historia de prueba y error junto a una gran cantidad de intuición práctica de los personajes de la historia. De esta forma, podría decirse que se trató más bien de un arte que de una ciencia. Los ingenieros del siglo XIX encontraron experimentalmente que cuando el “feedback” del regulador centrífugo aumentaba (esto es, se reducía más y más la presión de vapor para un incremento fijo de la velocidad de salida), se alcanzaba un punto donde el regulador dejaba de controlar, y la salida (velocidad) comenzaba a oscilar. El regulador se volvía inestable. El regulador, diseñado para superar el efecto de las perturbaciones externas, podía, bajo ciertas circunstancias, generarlas. El responsable de este cambio de comportamiento es el “tiempo de respuesta” finito desde que el regulador detecta hasta que se genera la salida de retroalimentación. Este tiempo de respuesta hace que la retroalimentación negativa (las perturbaciones a la 7 Minorsky, N., "Directional Stability and Automatically Steered Bodies," J. Am. Soc. Nav. Eng., vol. 34, p. 280, 1922. 8 Házen, H.L., "Theory of Servo-mechanisms," J. Franklin Inst., 1934. salida se reducen) puede pasar a ser retroalimentación positiva (las perturbaciones son amplificadas). En la mitad del siglo XIX fue cuando por primera vez se analizó la estabilidad de los sistemas de control por realimentación. Ya que las matemáticas constituyen el lenguaje formal de la teoría del control automático, podríamos llamar al período anterior a esta época la teoría prehistórica del control. Ecuaciones diferenciales. En 1840, el astrónomo del Observatorio Astronómico Británico en Greenwich, G. B. Airy, desarrolló un dispositivo de realimentación para el apuntamiento de un telescopio. Su dispositivo era un sistema regulador de velocidad que giraba el telescopio de forma automática para compensar la rotación de la tierra, permitiendo de esa forma el estudio de una estrella dada durante un intervalo largo de tiempo. Desafortunadamente, Airy descubrió que debido al diseño erróneo del bucle de control automático, se introducían oscilaciones salvajes en el sistema. De esa forma, fue el primero en discutir las inestabilidades de sistemas de bucle cerrado, y el primero en usar ecuaciones diferenciales en su análisis9. La teoría de las ecuaciones diferenciales estaba por entonces bien desarrollada, debido al descubrimiento del cálculo infinitesimal por I. Newton (1642-1727) y G. W. Leibnitz (1646-1716), y el trabajo de los hermanos Bernoulli (últimos años del siglo XVII y primeros del XVIII), J. F. Riccati (16761754), y otros. El uso de las ecuaciones diferenciales en el análisis del movimiento de sistemas dinámicos fue establecido por J. L. Lagrange (17361813) y W. R. Hamilton (1805-1865). Teoría de la Estabilidad. El trabajo inicial en el análisis matemático de los sistemas de control fue en términos de ecuaciones diferenciales. James Clerck Maxwell10 fue el primero en analizar la estabilidad del regulador centrífugo de Watt, en su pionero trabajo de 1868. Su técnica consistió en linealizar las ecuaciones diferenciales de movimiento para encontrar la ecuación característica del sistema. Estudió el efecto de los parámetros del sistema en la estabilidad, mostrando que el sistema es estable si las raíces de la ecuación característica tienen partes reales negativas. De esta forma, el problema de la estabilidad se redujo a la localización de las raíces de las ecuaciones diferenciales que rigen el movimiento del regulador. La teoría mostró que las oscilaciones aparecidas cuando el comportamiento del regulador se hace inestable podían ser evitadas con una elección adecuada de los parámetros del regulador. Con el trabajo de Maxwell podemos decir que la teoría de los sistemas de control fue firmemente establecida. 9 Airy, G.B., "On the Regulator of the Clock-Work for Effecting Uniform Movement of Equatorials," Memoirs of the Royal Astronomical Society, vol. ll, pp. 249-267, 1840. 10 Maxwell, J.C., "On Governors," Proc. Royal Soc. London, vol. 16, pp. 270-283, 1868. E. J. Routh11 proporcionó una técnica numérica para determinar cuándo la ecuación característica tenía raíces estables. El ruso I. I. Vishnegradsky12 analizó la estabilidad de los reguladores usando ecuaciones diferenciales de forma independiente a Maxwell. En 1893, A. B. Stodola estudió la regulación de una turbina de agua usando las técnicas de Vishnegradsky. Modeló la dinámica de los actuadores, incluyendo en su análisis el problema de los retrasos de los mecanismos de actuación. Fue el primero en introducir la noción de “constante de tiempo del sistema”. Desconocedor de los trabajos de Maxwell y Routh, planteó el problema de la determinación de la estabilidad de la ecuación característica a A. Hurwitz 13, quien lo resolvió de forma independiente. El trabajo de A. M. Lyapunov fue la base de toda la teoría de control posterior. Estudió la estabilidad de ecuaciones diferenciales no lineales usando una noción generalizada de la energía en 1892 14. Desafortunadamente, aunque su trabajo fue aplicado y continuó en Rusia, los tiempos no estaban maduros en el mundo occidental para su elegante teoría, y permaneció desconocida allí hasta aproximadamente 1960, cuando su importancia fue realmente reconocida. El ingeniero británico O. Heaviside inventó el cálculo operacional en 1892-1898. Estudió el comportamiento transitorio de sistemas, introduciendo una noción equivalente a la de función transferencia. La culminación de esta fase de desarrollo de la teoría de control podría situarse en la publicación en 1921 del libro de M. Tolle, donde exponía las ecuaciones diferenciales que describen el movimiento de varios tipos distintos de máquinas y sus reguladores. Teoría de Sistemas. Es en el estudio de sistemas dinámicos donde la teoría de control por retroalimentación tiene su lugar en la organización del conocimiento humano. Así, la introducción del concepto de sistema como una entidad dinámica con entradas (“input”) y salidas (“output”) definidas que se ligan a otros sistemas y al entorno fue un requisito previo para un desarrollo ulterior de la teoría del control. La historia de la teoría de sistemas dinámicos requiere un estudio completo en sí mismo, pero haremos aquí un breve resumen. Durante los siglos XVIII y XIX, el trabajo de A. Smith 15 en Economía, los descubrimientos de C. R. Darwin16 en Biología, y otros desarrollos en Medicina, Política, Psicología, Sociología, etc. evidencian la importancia de la teoría de control en campos tan distintos como los mencionados, que por otro lado estaban teniendo un gran impacto en la conciencia humana. El estudio de 11 Routh, E.J., A Treatise on the Stability of a Given State of Motion, London: Macmillan & Co., 1877. 12 Vyshnegradsky, I.A., "On Controllers of Direct Action," Izv. SPB Tekhnolog. Inst., 1877. 13 Hurwitz, A., "On the Conditions Under Which an Equation Has Only Roots With Negative Real Parts," Mathematische Annalen, vol. 46, pp. 273-284, 1895. 14 Lyapunov, M.A., "Problème général de la stabilité du mouvement," Ann. Fac. Sci. Toulouse, vol. 9, pp. 203-474, 1907. (Translation of the original paper published in 1892 in Comm. Soc. Math. Kharkow and reprinted as Vol. 17 in Ann. Math Studies, Princeton University Press, Princeton, N.J., 1949.) 15 The Wealth of Nations, 1776. 16 On the Origin of Species by Means of Natural Selection, 1859. la Filosofía Natural superó el trabajo de los filósofos griegos y árabes, con contribuciones de Nicolas de Cusa (1463), Leibniz y otros. Los desarrollos del siglo XIX, unidos a la Revolución Industrial y un sentido expansivo de la conciencia de geopolítica global y astronomía tuvieron una influencia profunda en esta Filosofía Natural. En los primeros años del siglo XX, A. N. Whitehead17, con su filosofía de “mecanismos orgánicos”, L. Von Bertalanffy18, con sus principios jerárquicos de organización, y otros, habían comenzado a hablar de una “teoría general de sistemas”. En este contexto, la evolución de la teoría de control podía proseguir. Análisis en el Dominio de Frecuencias. El análisis matemático de los sistemas de control había sido desarrollado hasta aquí usando ecuaciones diferenciales en el dominio del tiempo. En los Laboratorios Bell, durante los años 1920 y 1930, fueron exploradas y usadas en sistemas de comunicación las aproximaciones en el dominio de la frecuencia desarrolladas por P.-S. de Laplace (1749-1827), J. Fourier (1768-1830), A. L. Cauchy (1789-1857), y otros. El amplificador (triodo) diseñado por H. S. Black era, de hecho, la expresión electrónica del principio de control usado previamente en sistemas mecánicos. La cuestión que surgió a continuación era si este amplificador sería estable en todo el rango de frecuencias representado en la comunicación oral. La respuesta a esta cuestión requería un análisis matemático de la estabilidad más complejo que el que había sido desarrollado hasta entonces para sistemas mecánicos. El diseño de Black consistía en en introducir un desfase en el sistema en la frecuencia correcta. La Teoría de Regeneración para el diseño de amplificadores estables fue desarrollada por el sueco Harry Nyquist 19, derivando su criterio de estabilidad basado en la representación polar de una función compleja. Nyquist establece los fundamentos científicos de la cibernética, mediante el desarrollo de la teoría que sirve como base a los procesos estables de oscilación con realimentación negativa. Nyquist toma la idea para el tratamiento de procesos con realimentación negativa de esta experiencia previa en las técnicas de amplificación mediante válvulas ya descrita. El acoplamiento positivo hace que la oscilación se vea reforzada, motivo por el cual se emplea con frecuencia en los osciladores. Por el contrario, la realimentación negativa tiene un efecto amortiguador, siendo adecuado para la estabilización de las oscilaciones. Finalmente, H. W. Bode20 usó en 1938 las representaciones de respuesta en magnitud y fase de una función compleja (imaginaria), investigando la estabilidad de bucles cerrados utilizando las nociones de ganancia y margen de fase. 17 Whitehead, A.N., Science and the Modern World, Lowell Lectures (1925), New York: Macmillan, 1953. 18 Bertalanffy, L. von, "A quantitative theory of organic growth," Human Biology, vol. 10, pp. 181-213, 1938. 19 Nyquist, H., "Regeneration Theory," Bell Syst. Tech. J., 1932. 20 Bode, H.W., "Feedback Amplifier Design," Bell System Tech. J., vol. 19, p. 42, 1940. Laboratorio de Radiación del M.I.T. Para estudiar los problemas de procesado de información y control asociados con el recién inventado radar, fue creado el Laboratorio de Radiación en el Massachusetts Institute of Technology en 1940. La mayor parte del trabajo en la teoría de control de los años 1940 provino de aquel laboratorio. Durante su trabajo en un proyecto del M.I.T. en 1941, A. C. Hall se dio cuenta de los efectos perniciosos que tenía el ignorar el ruido en el diseño de sistemas de control. Se dió cuenta de que la tecnología del dominio de frecuencias desarrollado en los Laboratorios Bell podía ser usada para confrontar los efectos del ruido, y utilizó esta aproximación para diseñar un sistema de control para un radar aerotransportado. El éxito demostró de forma definitiva la importancia de las técnicas del dominio de frecuencias en el diseño de sistemas de control21. Usando aproximaciones basadas en la función de transferencia, el diagrama de bloques y métodos del dominio de frecuencias, hubo un gran éxito en el diseño de controles en el Laboratorio de Radiación. En 1947, N. B. Nichols desarrolló su Carta para el diseño de sistemas de realimentación. Con el trabajo del M.I.T., la teoría de servomecanismos lineales fue establecida firmemente. Un resumen del trabajo de este laboratorio puede encontrarse en Theory of Servomechanisms22. Trabajando en la Aviación Norteamericana, W. R. Evans23 presentó su técnica de localización de raíces, que proporcionó una forma directa de determinar la situación de los polos de bucle cerrado en el plano-s. Durante los 1950, la mayor parte del trabajo sobre teoría de control se concentró en el plano-s, obteniendo características de respuesta deseables. La era del espacio y del ordenador y el Control Moderno. Con el advenimiento de la era espacial, el diseño del control abandonó las técnicas del dominio de frecuencias de la teoría clásica del control, volviendo al uso de las técnicas de las ecuaciones diferenciales de finales del siglo XIX en el dominio temporal. Estudiaremos brevemente las razones para este cambio de paradigma. El paradigma de la teoría clásica de control era muy adecuado para problemas de diseño de control durante las Guerras Mundiales. La aproximación en el dominio de frecuencias era apropiado para sistemas lineales invariantes en el tiempo. Esta aproximación tiene sus resultados óptimos cuando se aplica a sistemas de entrada única y salida única. Por otro lado, el diseño clásico de controles tuvo algún éxito en sistemas no lineales. Usando las propiedades de reducción de ruido de las técnicas del dominio de frecuencias, puede diseñarse un sistema de control estable frente a las variaciones en los parámetros del sistema, a los errores de medida y perturbaciones externas. Así, las técnicas clásicas pueden usarse en una 21 Hall, A.C., "Application of Circuit Theory to the Design of Servomechanisms," J. Franklin Inst., 1966. 22 James, H.M., N.B. Nichols, and R.S. Phillips, Theory of Servomechanisms, New York: McGraw-Hill, M.I.T. Radiation Lab. Series, Vol. 25, 1947. 23 Evans, W.R., "Graphical Analysis of Control Systems," Trans. AIEE, vol. 67, pp. 547-551,1948. versión linealizada de un sistema no lineal, dando buenos resultados en un punto de equilibrio cerca del cual el comportamiento del sistema es aproximadamente lineal. Las técnicas del dominio de frecuencias pueden ser aplicadas también a sistemas no lineales sencillos usando el criterio de Nyquist. Desafortunadamente, no es posible diseñar sistemas de control para sistemas multivariables altamente no lineales, como los que aparecen en aplicaciones aeroespaciales. De esta forma, fue necesario una vuelta al dominio temporal para el tratamiento de los sistemas no lineales aparecidos especialmente en la era espacial. La escuela rusa, siguiendo los pasos de Lyapunov, fue la avanzadilla en esta vuelta al dominio temporal. Control Óptimo en Sistemas Naturales. El más antiguo de los problemas de máximo y mínimo (los llamados problemas extremales) se considera el problema isoperimétrico clásico: hallar entre las curvas planas cerradas de una longitud dada, la curva que abarca la mayor superficie. Los filósofos griegos trataron de resolver este problemaaún en el siglo V adC. Sobre él escribía por ejemplo Aristóteles. Ya en el Renacimiento, Johann Bernoulli fue el primero que mencionó el Principio de Control Óptimo en conexión con el Problema de la Braquistócrona en 1696: encontrar la curva que une los puntos A y B, A más alto que B, tal que el tiempo empleado por un cuerpo masivo que cae bajo la acción de la gravedad de A a B a lo largo de la curva sea mínimo. Este problema fue resuelto por Leibniz, los hermanos Bernoulli, por Isaac Newton y L’Hôpital, y llegó a estar claro que la búsqueda del control óptimo es una propiedad fundamental del movimiento en los sistemas naturales. Se demostró que la braquistócrona coincide con un arco de cicloide que va de A a B. Esto representó el comienzo de un nuevo campo: el cálculo de variaciones, cuyos principios sistemáticos fueron establecidos sobre todo por Euler y Lagrange. Varios principios de control óptimo extremales fueron investigados con posterioridad, incluyendo el Principio de Tiempo Mínimo del francés Pierre De Fermat al comienzo del siglo XVII en Óptica (para explicar la ley de la refracción de la luz: el trayecto que sigue un rayo luminoso en un medio heterogéneo es el más corto posible, y corresponde a un tiempo mínimo); los trabajos de L. Euler en 1744; y el resultado de Hamilton de que un sistema se mueve de tal forma que minimiza la integral temporal de la diferencia entre la energía cinética y potencial (variable denominada Lagrangiano del sistema). Estos Principios Extremales son todos principios de mínimo. En los primeros años 1900, A. Einstein mostró que, en el sistema de coordenadas espacio-temporal cuadridimensional, el movimiento de sistemas ocurre de forma tal que el tiempo resulta ser un máximo y no un mínimo. Ya que los sistemas naturales exhiben control óptimo en su comportamiento (en sentido de que hacen extremal una cierta función), tiene sentido diseñar sistemas de control artificiales en una forma “optima” en este sentido. Una ventaja es que este diseño puede llevarse a cabo en el dominio temporal. En el contexto del diseño de control moderno, es usual minimizar el tiempo de tránsito, o un funcional de energía generalizada cuadrática, posiblemente con alguna ligadura en los controles permitidos. R. Bellman24 aplicó la programación dinámica al control óptimo de sistemas discretos en el tiempo, probando que la dirección natural de resolver problemas de control óptimo es hacia atrás en el tiempo, obteniendo esquemas de realimentación de bucle cerrado, generalmente no lineales. En 1958, L. S. Pontryagin 25 había desarrollado su principio de máximo, que resolvía problemas de control óptimo basándose en el cálculo de variaciones desarrollado por L. Euler (17071783). Resolvió el problema de tiempo mínimo, derivando una ley de control on/off como el control óptimo (bang-bang). 2.3. PROBLEMAS CLÁSICOS DE CONTROL. 2.3.1 El péndulo centrífugo y la máquina de vapor. En la figura de al margen se esquematizan los elementos básicos del mecanismo de la máquina de vapor sin regulador. El combustible se quema en un horno que calienta el agua encerrada en un depósito. La presión de vapor producida depende de la resistencia de las calderas disponibles, y de la efectividad de la transferencia de calor del horno al agua. Esta presión de vapor tenía unos valores típicos de unos 3.5 105 Pa en los días de los primeros prototipos de la máquina de vapor. En 1862, el desarrollo de la producción del acero permitió calderas más resistentes, por lo que las presiones pudieron llegar a los 1.8 106 Pa. En 1920, ya se alcanzaban presiones de 107 Pa. La presión de vapor p’ producida en la caldera pasa a través de una válvula que reduce la presión en una proporción determinada por la válvula. Cuando el regulador se introduce en el sistema, el nivel de actuación del 24 Bellman, R., Dynamic Programming, New Jersey: Princeton Univ. Press, 1957. 25 Pontryagin, L.S., V.G. Boltyansky, R.V. Gamkrelidze, and E.F. Mishchenko, The Mathematical Theory of Optimal Processes, New York: Wiley, 1962. péndulo centrífugo controla la configuración angular de la válvula de tal forma que reduce la presión de salida de la válvula cuandola velocidad de giro se incrementa y viceversa. La presión de salida p de la válvula se expande empujando al pistón de la máquina. El cuerpo de la máquina es, de hecho, un ingenioso dispositivo donde se transforma el empuje unidimensional contra el pistón en un movimiento oscilatorio. La transformación está producida con ayuda de una válvula deslizante representada en la figura. Cuando el pistón se encuentra en la posición (a), la presión de vapor empuja al pistón hacia la derecha. El gas a la derecha del pistón, que se encuentra a baja presión, es empujado y conducido a un condensador, y de nuevo al depósito de agua de la caldera por una conducción no representada en la figura. Cuando del pistón se mueve hacia la derecha, la válvula deslizante, activada por una rueda excéntrica ligada a la rueda principal activada por el pistón, lleva a la posición (b) de la figura. Entonces, comienza el movimiento del pistón en sentido contrario, cerrándose así un ciclo completo. En esencia, el pistón se desplaza de forma oscilatoria debido a la presión del gas, imprimiento un momento de fuerzas sobre el eje de la rueda principal, y convirtiendo de esta forma un movimiento oscilatorio unidimiensional en un movimiento circular. El valor promedio del momento que imprime el pistón sobre la rueda depende en general del valor de la presión de vapor p y de la velocidad angular del movimiento oscilatorio del pistón (o de la rueda o eje principal). Por tanto, podemos expresar el momento promedio de impulsión Mi de forma: M i M i ( p, ) La dependencia funcional precisa dependerá de los detalles técnicos de la construcción de la máquina de vapor. Sin embargo, en general, se puede esperar que el momento promedio aumente cuando aumenta la presión, y disminuya a velocidades angulares de giro muy altas. Este momento de fuerzas de impulsión tenderá a aumentar la velocidad de giro de la máquina de vapor, a lo que se opone el momento de fuerzas debido a la “carga” Mc, cuyo promedio temporal dependerá de la velocidad angular del eje principal. Por ejemplo, si el eje de la máquina de vapor se acopla a las paletas de propulsión de un barco, la resistencia del agua a la rotación de las paletas ofrecerá un momento de “carga” que se opondrá al aumento de la velocidad angular de giro. El momento de carga aumentará muy rápidamente con la velocidad angular (esto es, cuando aumenta la velocidad angular, aumenta el momento de fuerzas que se opone al movimiento de giro): M c M c ( ) El eje principal de la máquina de vapor está normalmente equipado con un regulador centrífugo con un valor muy grande para el momento de inercia. El propósito del regulador centrífugo es esencialmente proporcionar al eje de giro una cantidad muy grande de inercia rotacional, de tal forma que los pequeños cambios en los momentos de impulsión o de carga afecten a la velocidad angular del eje en una muy pequeña cantidad. Podemos considerar el péndulo centrífugo como un reservorio en el que se almacena energía cinética de rotación. Si hubiera un pequeño cambio en el momento de carga, que requiere más energía de la máquina de vapor, ésta podría ser proporcionada a partir de la acumulada en el regulador centrífugo sin necesidad de variar la velocidad angular de giro, ya que el regulador centrífugo tiene un gran momento de inercia. 2.3.1.1 Ecuaciones del péndulo centrífugo. El péndulo centrífugo, mostrado en la figura, consiste en una varilla vertical que gira a la velocidad angular proporcional a la velocidad de la máquina. Al final de la varilla, están montados dos brazos de longitud L que soportan en sus extremos dos masas M, las “bolas voladoras”, obligadas a girar con la varilla. Los brazos tienen la posibilidad de pivotar alrededor del eje en que están ligadas a la varilla vertical J en un plano vertical. Una extensión de los brazos porporciona un medio de desplazar un controlador cuya posición regula la presión y el flujo de vapor en la máquina. De esta forma, el péndulo cónico puede considerarse como un dispositivo que transforma velocidad angular en una lectura sobre una dirección vertical. El regulador centrífugo será el péndulo centrífugo al que se le une una varilla que actúa de control sobre la entrada de la máquina controlada, de tal forma que un aumento en la velocidad angular del dispositivo actúa finalmente reduciendo la entrada y viceversa. Nuestro objetivo será determinar la posición de equilibrio 0 de las masas a una velocidad angular dada de la varilla vertical. Posteriormente, veremos que las masas pueden oscilar alrededor de la posición de equilibrio, y encontraremos el período de esta oscilación. Comenzaremos dibujando un diagrama de fuerzas para una de las masas M y la trayectoria de esta masa. Las fuerzas sobre la masa M son su propio peso P, y la tensión T del brazo que la soporta. En el estado estacionario, la masa describe una trayectoria circular en un plano horizontal; el radio de esta circunferencia es: R Lsen 0 donde 0 es la posición de equilibrio de la varilla. La velocidad de M será por tanto: v R Lsen 0 Por estar tratando un equilibrio en un sistema no inercial de referencia, tenemos que introducir una fuerza de inercia, que en este caso será la llamada fuerza centrífuga, dirigida hacia el centro de la circunferencia en que se producel el movimiento, y cuyo valor será: Mv 2 Fcf Macf M 2 R M 2 Lsen 0 R Esta fuerza debe estar en un plano horizontal, dirigida hacia la varilla vertical central del péndulo. Por tanto, el equilibrio de fuerzas en este sistema no inercial de referencia, debe escribirse de la forma siguiente: T cos 0 Mg 0 Tsen 0 M 2 Lsen 0 0 Resolviendo el sistema de ecuaciones, se puede encontrar el resultado de las dos incógnitas del mismo, la tensión T en los brazos del péndulo centrífugo, y el ángulo de equilibrio 0. De la primera ecuación puede obtenerse que Mg T cos 0 (imponiendo que el coseno no se anula, es decir, que el ángulo 0 no puede ser igual a noventa grados). El sistema de ecuaciones tiene dos soluciones: Una primera solución, válida cuando el ángulo 0 es distinto de cero: T M 2 L 0 Sustituyendo T por su valor: Mg M 2 L 0 cos 0 g 2 L cos 0 g cos 0 2 L Y una segunda solución: sen 0 0 que implica que el ángulo 0 es igual a cero. En este caso, el valor para la tensión es: T Mg La primera situación se produce cuando 2 L g , mientras que la segunda se produce necesariamente cuando 2 L g . Por tanto, existe un valor umbral para la velocidad angular de la varilla horizontal, por debajo del cual el ángulo de equilibrio 0 es cero. Para valores de por encima de este valor umbral, el ángulo de equilibrio es finito y se incrementa al aumentar . Es curioso observar que precisamente el valor umbral para se produce a un valor que es igual que el valor de la frecuencia angular de oscilación de un péndulo de longitud L: g umbral L Supongamos que nos encontramos en una situación en la que g L , por lo que el ángulo 0 tiene un valor finito, dado por la ecuación anterior. Supongamos que la masa, en un momento dado, es empujada a una situación 0 , y se deja libre. Entonces, las fuerzas que actúan sobre la masa M tenderán a conducir de nuevo la masa M a su posición de equilibrio 0, sea mayor o menor que 0. Esto indica que la masa M oscilará alrededor de su posición de equilibrio 0, volviendo de nuevo a su posición de equilibrio cuando se amortigüe dicha oscilación. De forma opuesta, si la velocidad angular se incrementa repentinamente hasta un valor ' , se definirá una nueva posición de equilibrio 0 ' 0 0 , según la ecuación que obtuvimos con anterioridad. La masa M se encuentra por tanto en una posición fuera de “su” equilibrio, en una cantidad 0 , y se desplazará a su nueva posición de equilibrio 0’ por medio de oscilaciones amortiguadas. Es deseable tener una idea del valor del período T de esta oscilación. Para calcular dicho período, tomaremos la siguiente aproximación: Sea constante, y apliquemos a la masa M una pequeña fuerza “extra” F , perpendicular a T , lo que llevará la masa M a una nueva posición de equilibrio 0 (ver Figura adjunta). Estableceremos una relación entre F y el desplazamiento en la posición de equilibrio de la masa. Esta relación será lineal para pequeños F; la escribiremos de forma: F kL donde k es la constante de proporcionalidad que mide la proporción entre la fuerza F y el desplazamiento lineal L. Se trata formalmente de la misma ecuación que en un resorte armónico, por lo que la frecuencia y el período tendrán los valores siguientes: M T 2 k k M Escribamos las ecuaciones del equilibrio de fuerzas a la vista del diagrama de fuerzas de la figura: Mg Fsen T cos 0 F cos Tsen M 2 Lsen sistema de dos ecuaciones con dos incógnitas, F y T. Multiplicando la primera por cos, y la segunda por sen, y sumando, obtenemos: Mgsen F M2 Lsen cos Pero conociendo el valor de Mg obtenido anteriormente, Mg M2 L cos 0 se puede sustituir, obteniendo: F M2 Lsen (cos cos 0 ) Pero los ángulos y 0 difieren en una cantidad pequeña ( 0 ), por lo que: cos 0 cos( ) cos cos sensen cos sen (ya que sen , y cos 1 ). Finalmente, obtenemos: F M 2 Lsen2 con lo que obtenemos el valor buscado para la constante “elástica” k: k M 2 sen2 Cuando la oscilación de las “bolas” del péndulo centrífugo tiene una amplitud pequeña, k es prácticamente constante, y en el cálculo del período y la frecuencia, podemos sustituir por su valor medio 0. Entonces, la frecuencia angular de la oscilación de las bolas del péndulo centrífugo alrededor de su posición de equilibrio 0 está dada por: g sen 0 sen 0 L cos 0 y su período T por: 2 1 T sen 0 2.3.1.2 Modelo matemático para la máquina de vapor sin control automático. En la figura adjunta se muestra un diagrama de bloques de los diferentes elementos presentes en una máquina de vapor. La entrada a la máquina de vapor es la presión p que empuja al pistón. La salida de la máquina de vapor es la velocidad angular del eje. Carga p’ Caldera Mi(p,) p Válvula Pistón Mc() Eje de giro Vamos a hacer un análisis cuantitativo de la máquina de vapor sin regulador. Examinaremos cómo se acelera la máquina de vapor, qué determina la velocidad del estado estacionario, y cómo la velocidad de salida cambia al producirse cambios en el momento de impulsión (presión de entrada) o en el momento de carga. La ecuación que describe la velocidad angular está dada por: d I ( M i ( p, ) M c ( )) dt Cuando el dispositivo comienza su movimiento ( = 0), el momento de impulsión tiene un valor determinado exclusivamente por la presión del vapor Mi( = 0) = Mi(p, 0), mientras que el momento de carga tiene un valor que llamaremos Mc(0). La aceleración angular al comienzo será por tanto constante, por lo que el cambio en la velocidad angular será lineal en el tiempo. Si los momentos de impulsión y carga fuesen indenpendientes de la velocidad angular, entonces, este aumento de velocidad angular no se detendría nunca, y la máquina de vapor no alcanzaría ningún estado estacionario. Sin embargo, el momento de impulsión en general disminuye cuando aumenta la velocidad angular, y el momento de carga, por el contrario, aumenta con la velocidad angular, por lo que se alcanza un momento en que ambas cantidades se igualan, y a partir de este momento, ocurre que: d M i ( p 0 , 0 ) M c ( 0 ) 0 dt y la velocidad angular tenderá a acercarse al valor de en que esta igualdad se produce. Veamos ahora qué le pasa a la velocidad angular si se produce un cambio en la presión de vapor. Si la presión que proviene de la caldera disminuye ligeramente, la velocidad de giro también disminuirá. Para evitar esto es precisamente para lo que se introducen los reguladores centrífugos de control de velocidades angulares. En la figura vemos cómo determinar gráficamente el cambio en la velocidad angular estacionaria 0 cuando se incrementa la presión de vapor en una cantidad pequeña p0. Podemos expresar analíticamente este cambio cuando estos cambios son cantidades pequeñas. Esto puede hacerse escribiendo el desarrollo de Taylor para Mi(p0+p), y quedándonos sólo en el término lineal en p de la expansión: dM i p ... M i ( p 0 p ) M i ( p 0 ) dp p0 Haciendo lo propio para los valores del momento de carga Mc(0+): dM c M c ( 0 ) M c ( 0 ) ... d 0 Cuando la presión de vapor cambia de p0 a p0+p0, alcanzaremos un estado final de equilibrio en el que nuevamente el momento total es cero: M i ( p0 p0 ) M c (0 0 ) lo que implica que dM i dM c p 0 0 d 0 dp p0 es decir: dM i dp p0 0 p0 dM c d 0 de donde se deduce que el cambio en la frecuencia de la máquina de vapor cuando cambia la presión de vapor, en este modelo, es directamente proporcional a la velocidad de cambio del momento de impulsión respecto a la presión de vapor, e inversamente proporcional a la velocidad de cambio del momento de carga respecto a la frecuencia angular de giro. Ambas cantidades se supone que son conocidas, pues dependen de las características de la máquina de vapor y de la “carga”. Vamos a continuación a estudiar la respuesta temporal de la máquina de vapor no controlada a los cambios en la presión de vapor estudiados anteriormente. Estudiaremos cómo cambia la velocidad angular para aproximarse a su nueva velocidad angular estacionaria 0+. Para ello, utilizaremos la ecuación para la evolución temporal de la velocidad angular de giro, ya escrita con anterioridad: d I ( M i ( p, ) M c ( )) dt donde I es el momento de inercia del volante giratorio de salida. Inicialmente, d M i ( p 0 ) M c ( 0 ) I 0 0 dt Suponemos que el el instante de tiempo t=0, la presión de vapor de entrada aumenta de repente a un valor p0+p0. Sabemos de nuestro análisis anterior que la velocidad angular cambiará de 0 a 0+ cuando el sistema se asienta en el nuevo estado estacionario. Para ver la forma precisa en que se aproxima a 0+, hacemos uso de una expansión en serie de Taylor con la condición de que M i ( p0 ) M c ( 0 ) . Ello da una ecuación para la evolución de de forma: d dM i dM c p 0 I ( 0 ) dt dp p0 d 0 con las condiciones de contorno t = 0, = 0 dM i dp p0 t , f 0 0 0 dM c d 0 Reordenando escribirse: I términos, d dt La cantidad dentro de operación final f 0 la ecuación p0 diferencial anterior puede dM i dp p0 dM c p 0 0 d 0 dM c d 0 los paréntesis cuadrados es la frecuencia angular de 0 , por lo que obtenemos: d 1 dM c ( f ) dt I d 0 d dt f I (dM c d )0 Llamando tiempo característico a la cantidad: I t0 (dM c d )0 obtenemos finalmente la ecuación diferencial, escrita de forma simplificada: d dt f t0 Integrando, obtenemos: (t ) t d dt f 0 t 0 0 f (t ) t ln t0 0 f f (t ) e t / t 0 0 f f (t ) ( f 0 )e t / t0 (t ) f ( f 0 )e t / t 0 (t ) 0 ( f 0 )(1 e t / t ) 0 Esto es, la máquina de vapor se aproxima a su nuevo valor estacionario para la velocidad angular de forma exponencial, con una constante temporal t0 que es el tiempo característico definido antes, y que es el tiempo de respuesta de la máquina de vapor a un cambio en las condiciones de funcionamiento. Este tiempo es proporcional al momento de inercia del volante al que se aplican los momentos de impulsión y de carga, e inversamente proporcional al término lineal en la expansión del momento de carga respecto a la frecuencia angular alrededor del valor de la frecuencia angular estacionaria del estado inicial. Es claro por qué interesan volantes con valores altos para el momento de inercia. En este caso, fluctuaciones rápidas en los valores de la presión de vapor o momento de carga respecto al valor del tiempo propio no afectarán al funcionamiento de la máquina, que tendrá un comportamiento estable frente a estas oscilaciones muy rápidas. 2.3.1.3 Modelo matemático para la máquina de vapor con péndulo centrífugo como regulador automático. Hemos estudiado cómo los cambios en la presión de vapor produce cambios en la velocidad angular de operación de la máquina de vapor. Tales cambios son, en general, indeseables en la práctica. También hemos dicho que el uso de un regulador centrífugo con un gran momento de inercia era útil para suprimir los efectos en los cambios de presión cuando estos cambios ocurren rápidamente comparado con el tiempo de respuesta de la máquina. Sin embargo, para cambios de presión que se mantienen durante períodos largos de tiempo, estos cambios en la velocidad angular de la máquina se producen. En esta sección, examinaremos cómo es posible reducir las desviaciones en la velocidad angular del dispositivo mediante un mecanismo de regulación que modifica la presión de entrada en función de la velocidad angular de giro de la máquina de vapor. En la figura lateral, se muestra esquemáticamente cómo el péndulo centrífugo acopla mecánicamente la velocidad de giro de salida de la máquina de vapor a la presión aplicada al pistón a través de la válvula a la salida de la caldera. La velocidad ’ del péndulo cónico o centrífugo es directamente proporcional a la velocidad de salida del eje de giro principal de la máquina de vapor. La constante de proporcionalidad, que está fijada por la geometría de acoplo, debería tener un valor tal que cuando el eje de giro principal de la máquina de vapor girase a su velocidad normal o típica 0, la velocidad de giro ’ del péndulo centrífugo fuese ligeramente mayor que el valor umbral g L (Como ya vimos anteriormente, cuando ' g L , las bolas giran casi horizontalmente, y la altura no cambia mucho al cambiar la velocidad angular ’. Por otro lado, cuando ' g L , las bolas no vuelan). Cuando las bolas se mueven hacia arriba debido a un incremento de la velocidad angular de la máquina de vapor, el controlador del péndulo centrífugo cierra la válvula sobre la que actúa de forma tal que la presión de vapor que empuja el pistón disminuye. Se trata de un feedback entre la salida () y la entrada (p). Esta feedback es negativo en el sentido de que un incremento en la velocidad angular se traduce en una disminución en la presión de vapor. En la figura siguiente se muestra un diagrama de bloques de los varios componentes de la máquina de vapor controlada. Notamos, en comparación con el diagrama de bloques de la máquina de vapor no controlada, que se trata de un sistema de bucle cerrado (en contraposición de la máquina de vapor no controlada, que está representada por un diagrama de bloques de bucle abierto). El hecho de que la salida esté conectada a la entrada resulta en un diagrama de bocles de bucle cerrado. Con ayuda de este diagrama, podremos escribir las ecuaciones de evolución de la máquina de vapor regulada. Carga p=p’-p p’ Caldera Válvula Mi(p,) Mc() Eje de giro Pistón -p=ch h Péndulo centrífugo ’ Acoplo geométrico Como en el caso del péndulo no regulado, el cambio en el momento angular del péndulo cónico viene dado por la diferencia entre el momento de fuerzas de impulsión y el momento de fuerzas de “carga”: d I ( M i ( p, ) M c ( )) dt En el caso del feedback, el punto crucial es que la presión de vapor p en los pistones es ahora una función de la velocidad angular de salida , y por tanto, p = p(), y: M i ( p) M i ( p( )) Es importante darse cuenta de que al escribir que p = p(), estamos aceptando implícitamente que un cambio en la frecuencia de salida se sigue de forma inmediata por un cambio en la presión de entrada. Es decir, que la realimentación se realiza de forma inmediata, sin ningún tiempo de retraso o retardo. Obviamente, esto no puede físicamente ser así, porque al regulador centrífugo le cuesta un tiempo finito (no nulo) cambiar la posición de las masas voladoras, y por tanto, hay un retraso en la aplicación de la regulación a la válvula que hace disminuir la presión de vapor de entrada. Este retraso en la respuesta del regulador puede conducir a inestabilidades en el control de la máquina. Nosotros, sin embargo, supondremos que la respuesta del sistema controlado a los cambios en la carga de salida o presión de entrada es tan lenta que en comparación con este tiempo, el regulador centrífugo tiene una respuesta esencialmente instantánea. Estudiaremos a continuación los cambios en los momentos de impulsión y de carga en respuesta a cambios pequeños cerca del punto de operación estacionaria. Para ello, expanderemos en serie de Taylor alrededor de los puntos de equilibrio p0 y 0. Quedándonos con los términos lineales en p y : dM i ( p p 0 ) ... M i ( p 0 p ) M i ( p 0 ) dp p0 dM c M c ( 0 ) M c ( 0 ) ( 0 ) ... d 0 En el caso presente, sin embargo, debemos tener en cuenta que cualquier cambio en la presión de vapor p puede producirse por variaciones en la presión en la caldera (llamaremos p0 a este cambio), o debido a cambios en la frecuencia de salida 0 (la realimentación). Expresaremos este hecho de la siguiente forma: ( p p0 ) p0 k ( 0 ) Esta ecuación representa la diferencia crucial entre el caso del sistema sin control y regulado. Vemos que los cambios en la presión de vapor de entrada son proporcionales a los cambios en la velocidad angular de salida que proporciona la máquina de vapor. El cambio en la variable de entrada es directamente proporcional al cambio en la variable de salida. Este tipo de sistema de control se denomina por ello “sistema de control proporcional”. Existen otros dispositivos con control proporcional a la derivada temporal de la variable de salida (sistemas de control derivativo), o a la integral en el tiempo de la variable de salida (sistemas de control integral). También existen sistemas en los que la entrada y la salida pueden no estar relacionados de forma lineal. Tales sistemas se denominan sistemas de control no lineal. La matemática subyacente a tales sistemas es muy compleja. En la ecuación última, la cantidad k, que tiene dimensiones de presión por tiempo (ML-1T-1), es la constante de proporcionalidad que relaciona el cambio en velocidad angular y en la presión de entrada al pistón. El signo negativo representa el hecho de que el sistema es un dispositivo de feedback negativo. Sustituyendo en las ecuaciones para la evolución del sistema, tenemos: dM i d dM i dM c p0 k ( 0 ) I ( 0 ) dt dp p0 d 0 dp p0 Donde hemos usado que Mi(p0)= Mc(0). Los dos primeros términos de la derecha representan el cambio en el momento de impulsión asociados al cambio en la presión de vapor (p0) y en la frecuencia de salida (a través de la realimentación). El último término es el cambio en el momento de carga asociado al cambio en la velocidad angular de salida. Reordenando términos, tenemos al final la ecuación diferencial: dM dM i d dM i c p0 ( 0 ) I k dt dp p0 d 0 dp p0 formalmente equivalente a la encontrada en el caso no controlado. Sin embargo, ahora, el coeficiente del término (-0) incluye un término de realimentación negativa. Habitualmente, se degine el factor de ganancia G como una medida de la efectividad del regulador centrífugo en cambiar la frecuencia de la máquina de vapor: ( dM i dp ) p0 Gk ( dM c d ) 0 Siguiendo los mismos pasos que para el caso no regulado, obtenemos como solución: (t ) 0 ( f1 0 )(1 e t / t1 ) alcanzando una velocidad angular estacionaria modificada, con un valor: dM i dp p0 p0 0 f1 0 1 0 0 1 G dM c 1 G d 0 y con un tiempo de respuesta modificado que tiene un valor: I (dM c d )0 t t1 0 1 G 1 G Por ello, tanto el valor para la frecuencia angular del nuevo estado estacionario, como la forma en que se aproxima al nuevo estado estacionario son diferentes a los encontrados en el caso no controlado. En la representación gráfica adjunta se muestra el comportamiento típico de una misma máquina de vapor no regulada, y regulada, en la que se ve que para el caso de disponer de regulador centrífugo, el nuevo valor de equilibrio está más cerca del valor estacionario anterior, y que se alcanza el estado estacionario en un tiempo menor. El factor en que disminuyen tanto el desplazamiento en frecuencia angular como el tiempo de respuesta es precisamente el factor 1 1 G .