tema2bio - Departamento de Física Aplicada I

Anuncio
CONTROL Y ESTABILIDAD.
Javier Ruiz del Castillo.
Física de los Procesos Biológicos.
Abril 2001.
CONTROL Y ESTABILIDAD.
Índice
2.1. INTRODUCCIÓN A LA TEORÍA DE CONTROL.
2.1.1 Noción de control.
2.1.2 Estructura de un problema de control.
2.1.3 Clasificación de los problemas de control.
2.1.4 Control por realimentación.
2.1.5 Los métodos de la teoría de control.
2.2. HISTORIA DEL CONTROL AUTOMÁTICO.
2.2.1 Antecedentes de la teoría de control.
2.2.2 El Nacimiento de la Teoría Matemática de Control.
2.3. PROBLEMAS CLÁSICOS DE CONTROL.
2.3.1 El péndulo centrífugo y la máquina de vapor.
2.3.1.1 Ecuaciones del péndulo centrífugo.
2.3.1.2 Modelo matemático para la máquina de vapor sin
control automático.
2.3.1.3 Modelo matemático para la máquina de vapor con
péndulo centrífugo como regulador automático.
2.3.2. Control del nivel de glucosa en sangre.
2.3.2.1. Test de tolerancia de glucosa.
2.3.2.2. Ecuación de control con término proporcional.
2.3.2.3. Ecuación de control con términos proporcional y
derivativo.
Apuntes personales para clase tomados de:

Capítulo 6 (del volumen uno): Feedback, Control and Stability in Physical and Biological
Systems, del libro de George B. Benedek, Felix M. H. Villars, “Physics with illustrative
examples from medicine and biology” (Ed. Springer, Nueva York 2000, Segunda edición,
tres volúmenes).

Capítulo 8: Introducción a la Teoría de Control, del libro “Ecuaciones Diferenciales
Ordinarias. Teoría de Estabilidad y Control”, de Miguel de Guzmán. Editorial Alhambra.

Capítulo 1: Introduction to Modern Control Theory, del libro de F.L. Lewis, “Applied
Optimal Control and Estimation” (Ed. Prentice-Hall, 1992). Disponible on-line en las
direcciones electrónicas siguientes:
1. http://www.control-automatico.net/articulos/art054.htm
2. http://www.theorem.net/lewis1.html
3. http://www.ee.washington.edu/class/462/aut00/lewis1.html.

Enciclopedia Britannica.

Roger Brockett, New Issues in the Mathematics of Control, to appear in Mathematic
Unlimited 2001, Springer.

Capítulo 15: Homeostasia, del libro de A. S. Frumento, “Biofísica” (Ed. Mosby/Doyma
Libros, 3ª ed. Madrid 1995).
2.1. INTRODUCCIÓN A LA TEORÍA DE CONTROL.
2.1.1 Noción de control.
En este tema, vamos a estudiar la teoría del control. El campo del
control ha emergido, especialmente en el siglo XX, como una parte
indispensable de la tecnología y un elemento importante en la
conceptualización de ideas científicas en una amplia variedad de disciplinas.
Sin embargo, como veremos, desde tiempos remotos existen distintos
dispositivos que muestran el interés del hombre de todos los tiempos por
controlar determinados aspectos de su entorno.
Aunque a veces tiende a confundirse “control” con el concepto más
específico “control por realimentación” (feedback), es preferible dar al
término control un significado más amplio. Volveremos posteriormente sobre
el tema más concreto del control por realimentación.
La teoría de control, considerada más globalmente, sería una disciplina
científica que se ocupa del estudio de la evolución de las variables
involucradas en el control de un proceso o sistema determinado (físico,
biológico, social, en ingeniería, etc). El proceso o sistema “controlado” puede
ser de muchos tipos: control y regulación de máquinas, metabolismo y
coordinación muscular en organismos biológicos, control de la actividad
económica
por
políticas
gubernamentales,
etc.
Hablando
más
científicamente, la teoría moderna del control sería una rama de la teoría de
sistemas que se ocupa del cambio de comportamiento de un sistema complejo
mediante acciones externas. Si la física es la ciencia ocupada de la
comprensión del entorno físico, el control sería la ciencia que estudia la
modificación de este entorno, en sentido físico, biológico o incluso social.
Un dispositivo de control es un método por el que se consigue que una
variable (o conjunto de variables) evolucione de una forma preestablecida
(bien porque las mantiene constantes, o porque hace que evolucionen según
un criterio dado). Dicho sistema de control puede estar accionado
eléctricamente, mecánicamente, gracias a la transmisión de una presión por
un fluido, etc. Conviene, sin embargo, distinguir entre lo que es el dispositivo
físico de control, y el sistema matemático que lo regula.
La teoría de control es una ciencia matemática, más incluso que la
física. Los principios de control se expresan siempre en una forma
matemática, y son potencialmente aplicables a cualquier situación concreta.
La teoría del control tiene conexiones profundas con otras áreas
clásicas de la matemáticas, como el cálculo de variaciones y la teoría de
ecuaciones diferenciales. Llegó a constituirse en una disciplina nueva en los
años 1950-1960. Después de la Segunda Guerra Mundial, el estudio de
determinados problemas aparecidos en ingeniería y economía condujo al
descubrimiento de que, siendo variantes de otros problemas ya conocidos en
cálculo de variaciones, eran problemas no estudiados suficientemente en sus
rasgos específicos. El reconocimiento de una misma estructura matemática
subyacente hizo que surgiese la teoría moderna del control.
Es útil hacerse la pregunta de por qué un tema como éste en un curso
introductorio de Física para biólogos. Este campo, enraizado en la Mecánica
más tradicional, proporciona importantes principios organizativos para la
fisiología y la biología molecular. La teoría del control proporciona una base
para la comprensión cuantitativa de los sistemas de regulación biológicos. En
los organismos vivos están resueltos multitud de problemas químicos,
mecánicos, termodinámicos, eléctricos, de comunicación, de información,
etc., cuya formulación y solución la ciencia está aún bien lejos de obtener.
Prácticamente todo proceso microscópico y macroscópico en organismos vivos
requiere la acción de algún principio de control y realimentación. Los
ejemplos que se pueden enumerar son muy numerosos: el control on-off de la
producción de proteínas a partir del ARN, el control bacteriófago viral de las
enzimas bacteriales y ADN, el control neuromuscular del ojo al enfocar
imágenes, el control de la temperatura corporal, el control del nivel de
glocusa en sangre, etc. Por otro lado, una contribución fundamental de C. R.
Darwin durante el siglo XIX fue la teoría de que el control por feedback en un
período de tiempo largo es responsable de la evolución de las especies. En
1931, V. Volterra explicó el balance entre dos poblaciones de peces en un
estanque cerrado usando la teoría del control por realimentación.
En otro ámbito, el desarrollo tecnológico en campos como el
transporte, las comunicaciones, la distribución energética y el procesado
industrial requiere de métodos de medida precisa y de elementos de control
de la salida de estos sistemas o dispositivos. La necesidad de regular de forma
precisa la salida de esta gran variedad de dispositivos ha conducido al
desarrollo de esta disciplina intelectual nueva, la teoría del control
automático.
2.1.2 Estructura de un problema de control.
Los procesos o sistemas a los que se aplica la teoría de control tienen
siempre una misma estructura. Vamos en primer lugar a analizar los
elementos fundamentales que aparecen en un problema de control.
Se considera un sistema o proceso físico, biológico, mecánico,
eléctrico, químico, industrial, social, etc., cuya evolución queremos estudiar.
El estado dinámico interno del sistema en cada instante de tiempo t
puede ser descrito por un conjunto de n cantidades, representadas como un
vector x1(t), ..., xn(t), y denominadas variables de estado.
En cada instante de tiempo t, la evolución de las cantidades x1(t), ...,
xn(t) depende de las propias cantidades x1(t), ..., xn(t) y de los valores de k
variables u1(t), ..., uk(t) denominadas variables de control, que son variables
a nuestro arbitrio dentro de unos ciertos límites. Dichas variables de control
gobiernan el comportamiento del sistema estudiado de una forma conocida.
Nuestro objetivo es llevar el proceso desde un estado inicial a un
estado final o meta. Los diversos modos de funcionamiento del sistema que lo
llevan del estado inicial al final no son iguales. Los hay que nos proporcionan
una mayor ventaja. Esta cualidad de los diversos modos de funcionamiento del
proceso es cuantificada mediante la designación de un número a cada modo
de funcionamiento. Esta asignación es el índice de funcionamiento J.
Nuestro empeño es manejar los controles de tal modo que, al llevar el sistema
del estado inicial al final, el índice J sea óptimo.
Se llama dinámica al conjunto de estas leyes que establecen cómo
cambian las variables de estado. Los valores para las variables de control son
elegidos según un objetivo o criterio preestablecido. La naturaleza del
sistema físico habitualmente impone limitaciones en los valores posibles para
estas variables de control.
La situación implica, obviamente, que la evolución futura está descrita
en función del valor presente de las variables de control, y del valor futuro de
las variables de control. Esta formulación acepta, implícitamente, que la
acción de control en un tiempo dado puede escribirse en función del estado
del sistema en ese instante de tiempo. Tal función del estado, que determina
la acción de control que ha de tomarse sobre el sistema en cada instante se
denomina ley de control. Este concepto engloba las leyes de control por
realimentación, pero es más general.
La formulación matemática de un problema general de control de un
sistema regido por ecuaciones diferenciales ordinarias requiere varios tipos
diferentes de información o elementos:
a)
Ley de evolución del sistema o ley del proceso. El
comportamiento del sistema debe ser descrito de una forma
matemáticamente precisa. La ley de evolución relaciona el
estado, respuesta o salida (“output”) x(t), una variable ndimensional, que se pretende controlar con el control o
entrada (“input”) u(t), una variable k-dimensional. Aquí
supondremos que esta ley viene dada por una ecuación
vectorial diferencial ordinaria
x' (t )  f (t , x(t ), u(t ))
La ecuación puede ser lineal o no lineal. El objetivo final
consiste en controlar el proceso mediante un control de ciclo
cerrado y de modo óptimo con respecto a un criterio que será
señalado más adelante.
b)
Estado inicial y conjunto meta. Se señala un estado de
partida mediante un valor inicial del estado del sistema
x0  x(t 0 ) en el instante t0. Las diferentes componentes del
estado x(t) que se pretende controlar pueden ser magnitudes
tales como posición, velocidad, aceleración, velocidad
angular, temperatura, intensidad de corriente, etc.
El conjunto meta G(t) es un conjunto dado del espacio de
estados que varía con el tiempo de modo continuo. Se trata
de llevar el proceso del estado x0 a un estado x(t1)
perteneciente a G(t1). El conjunto G(t) podría ser un punto
g(t) y el problema podría consistir en controlar el error
e(t)=x(t)-g(t) hacia cero. En este caso, el problema puede
simplificarse escribiendo
e(t )  f (t , e(t )  g (t ),u(t ))  g (t ))  f1 (t , e(t ),u(t ))
y entonces el conjunto meta es en todo instante el origen.
Como se ve, se trata del caso particular de control por
realimentación o feedback.
c)
La clase de controles. Hasta ahora no hemos especificado
qué funciones consideramos como posibles funciones de
control. La elección de uno o varias acciones de control,
entre las múltiples posibilidades disponibles, estará basada en
la información respecto al objetivo del control y el
conocimiento de las posibles perturbaciones sobre el sistema.
d)
Esta elección se llama optimización. Para ello, ha de
establecerse el propósito del control (criterio de control) y ha
de conocerse la respuesta del sistema frente a posibles
perturbaciones del entorno de una forma matemática precisa.
Además, es necesario conocer de forma precisa el efecto de
cualquier control potencial que puede ser aplicado al sistema
bajo todas las circunstancias posibles para el entorno.
El índice de funcionamiento o funcional de coste. Se llama
funcional porque es una función del control u(t), que es a su
vez una función del tiempo. El funcionamiento del sistema
bajo la acción de diferentes controles es, naturalmente,
distinto. Su calidad se ha de medir mediante un criterio que
hemos de señalar. En general, éste consiste en adoptar un
coste dado por un funcional de la forma
t1
J (u)   f 0 (t , x(t ), u(t ))dt
t0
f0
siendo
una función escalar, y u(t) una función de control
admisible, a la que a veces se la somete a algún tipo de
condición o restricción propia del sistema que se estudia. Si,
por ejemplo, f0 es idénticamente igual a uno, resulta
J (u)  t´t 0 , y el problema es un problema de control de
tiempo óptimo.
Un control será tanto mejor que otro cuando el coste
correspondiente sea más bajo. Así, un control será óptimo
cuando ninguno de entre los controles admisibles proporciona
un coste más bajo.
La minimización de un funcional, es decir, la búsqueda de la
función o funciones u(t) de entre un conjunto de funciones
que hacen mínimo el valor de un cierto funcional J es un
problema bien clásico, objeto de una rama del análisis
matemático con métodos propios denominada cálculo de
variaciones, nacida en los albores del cálculo diferencial e
integral.
El objetivo de la teoría de control es, por tanto, la formulación
matemática de toda esta información sobre el sistema, y, en segundo lugar, la
deducción de los métodos matemáticos por los que pueda obtenerse una
respuesta concreta a la optimización.
La teoría matemática de control no trata con la realidad física sino sólo
con su descripción matemática (modelos matemáticos). De esta forma, la
teoría de control es aplicable a cualquier situación concreta (física, biología,
economía,...), siempre que la situación pueda ser descrita, en un alto grado
de precisión, por un modelo que pertenece a una clase para la que la teoría
ha sido ya desarrollada.
Una vez que ha sido deducida la acción de control apropiada mediante
métodos matemáticos, la implementación del control pasa a ser una tarea
tecnológica.
La solución matemática de un problema de control no siempre existe.
La determinación de las condiciones de existencia de solución de forma
rigurosa ha tenido un efecto importante en la evolución de la teoría moderna
del control, tanto desde el punto de vista teórico como desde el punto de
vista aplicado. Tan importante como el estudio de la existencia de solución,
es la controlabilidad, que expresa el hecho de que puede alcanzarse una
solución determinada mediante algún tipo de control. Si esta condición se
satisface, entonces, existirá algún método de optimización a partir de
información acerca del criterio o propósito del control y de las perturbaciones
del sistema.
Los principales problemas asociados a sistemas de control son la
controlabilidad, la observabilidad, la estabilización y el control óptimo.
El problema de la controlabilidad, como ya se ha adelantado, es el
siguiente. Supongamos que el sistema se encuentra inicialmente en el estado
x1(t), ..., xn(t) = a1, ..., an. ¿Existe un conjunto de valores para las variables
de control u1(t), ..., uk(t) de tal forma que el sistema alcance un estado
predefinido b1, ..., bn en un tiempo finito?
La observabilidad es el problema relacionado con la obtención de
información acerca del estado del sistema x1(t), ..., xn(t) en un instante de
tiempo t cuando no puede medirse de forma directa el estado del sistema,
sino que sólo puede medirse una determinada función del estado.
El problema de la estabilización es la elección del conjunto de
controles u1(t), ..., uk(t) en cada instante de tiempo t de forma tal que el
estado x1(t), ..., xn(t) del sistema se acerque más y más a un estado
preasignado cuando avanza la variable t tiempo del sistema.
Probablemente, el problema más importante de la teoría de control es
el del control óptimo. El problema aquí es la elección de las variables de
control de tal forma que el sistema alcance el estado deseado y lo haga de
forma óptima en el siguiente sentido. Se trata de encontrar el valor para las
variables de control u1(t), ..., uk(t) que llevan el estado del sistema al estado
deseado final, haciendo simultáneamente mínima una cantidad que, de
alguna forma, mide numéricamente el grado de operación del sistema. A esta
cantidad se la denomina índice de funcionamiento o funcional de coste.
2.1.3 Clasificación de los problemas de control.
Puede resultar útil recoger en primer lugar varios problemas clásicos en
la teoría del control automático para fijar la mente en una serie de ideas
básicas como punto de partida1.
A.
Problemas de regulación. Consideremos una variable, o un
conjunto de variables, asociada a un sistema dinámico. Estas
variables tienen que mantenerse a un nivel deseado frente a
un conjunto de circunstancias cambiantes. Existe un segundo
conjunto de parámetros, las variables de control, que pueden
ser ajustados de forma tal que se consiga la deseada
regulación. Las variables ajustables o de control se denominan
a veces “inputs” frente a las variables reguladas o “outputs”.
Lo que es central en este caso es que el valor de la variable
de estado tenga un valor dado en todo instante de tiempo, es
decir, lo esencial es la trayectoria, siendo ésta constante.
Ejemplos específicos son la regulación de la velocidad de giro
1 Roger Brockett, New Issues in the Mathematics of Control, to appear in Mathematic Unlimited, 2001, Springer.
de un molino de viento (o de la máquina de vapor), la
velocidad de un avión controlando el flujo de combustible, la
regulación del contenido en oxígeno de la sangre usando la
velocidad respiratoria, temperatura corporal, nivel de glucosa
en sangre, etc.
B.
Problemas de Control de Punto Final. Hay variables de
estado, variables de control y trayectorias, al igual que en el
caso anterior. En este caso, sin embargo, la forma de la
trayectoria no es de gran interés; es el punto final el que
tiene importancia. Ejemplos estándar incluyen problemas de
“cita” como la exploración espacial, procesado en ingeniería
química en el que los reactantes son introducidos y el proceso
controlado de forma tal que se consigue el producto final con
una pureza especificada, el control de espines nucleares en
resonancia magnética nuclear aplicando campos magnéticos y
pulsos de radiofrecuencia de tal forma que la el haz de
electrones llegue finalmente a la posición especificada, etc.
C.
Problemas de servomecanismos. También hay variables de
estado y de control y trayectorias, y un sistema dinámico
asociado. En este caso, sin embargo, se desea que la salida
siga una trayectoria especificada por la entrada. Por
ejemplo, el control de una fresadora que ha de quitar metal
según indica un molde, el control de un avión de tal forma
que vuele en la trayectoria indicada por el controlador de
vuelo, y el control de un telescopio para que siga el
movimiento aparente de una estrella tal y como se ve desde
la Tierra.
D.
Problemas de Modo Repetitivo. De nuevo tenemos variables
asociadas a un sistema dinámico y variables de control que
influyen en su evolución. El problema a regular consta de una
serie de elementos que han de repetirse cíclicamente de
forma eficiente. Un ejemplo común es el control de los cuatro
ciclos de funcionamiento de un motor de combustión interna
(entrada de combustible/compresión/combustión/salida de
gases residuales). Ejemplos en Biología podrían ser el control
de los procesos respiratorios, control de la acción de bombeo
del corazón, etc.
Esta clasificación, quizá no completa, sin embargo tiene la virtud de
proporcionar un punto de partida con un detalle suficiente para nuestros
propósitos.
2.1.4 Control por realimentación.
Por “control automático” o “control por realimentación” (o
retroalimentación) entendemos que el dispositivo alcanza de forma
automática los valores establecidos para sus variables de estado (“output”) de
forma muy precisa, a pesar de las variaciaciones que puedan producirse en la
entrada (“input”) del dispositivo.
El control por realimentación se llama también control de CICLO
CERRADO, frente a los sistemas de control de CICLO ABIERTO, donde no hay
comparación de las variables de estado con los valores deseados para las
mismas. El sistema se realimenta a sí mismo, pues el control óptimo se
obtiene como función del estado real del sistema. La misma variable que se
desea regular retroalimenta el regulador o dispositivo de control. De esta
forma, el control por feedback es autocorrectivo, por lo que si en el sistema
se produce una perturbación imprevista, el sistema es capaz de corregirla.
El “feedback” o control de realimentación es el mecanismo básico por
el cual los sistemas, sean mecánicos, eléctricos, o biológicos, mantienen su
equilibrio u homeóstasis. En las formas de vida superiores, las condiciones
bajo las cuales la vida puede mantenerse son muy estrictas. Un cambio en la
temperatura corporal de medio grado centígrado es normalmente un signo de
enfermedad. La homeóstasis del cuerpo se mantiene gracias al uso del control
por retroalimentación2.
Los elementos esenciales que aparecen en un sistema de control por
realimentación son: primero, un elemento que mide las variables de estado
(“output”); segundo, un medio de comparar esa salida con el valor deseado
para la misma; y tercero, un método de realimentar esta información a la
entrada (variables de control) de tal forma que se minimiza la desviación de
la salida respecto al nivel deseado.
Los sistemas o procesos de control suelen ser representados de modo
conveniente mediante diagramas funcionales en los que se visualiza el papel
de cada uno de los órganos del sistema. Un ejemplo podría ser el de la figura
siguiente:
Se representa en la figura un proceso físico, mecánico, biológico, etc.,
con una entrada previsible dentro de ciertos límites, pero no exactamente, y
una salida deseable D. El valor real de la salida 0 es detectado por una
unidad de medida que envía una señal a un elemento diferenciador. Este mide
la diferencia o error D-0 y transmite una señal a la unidad controladora, la
cual actúa sobre el proceso de forma adecuada a fin de anular dicho error.
Obviamente, la estabilidad es una cualidad deseable de cualquier
sistema de control. Es necesario que la perturbación que se efectúa en los
controles a fin de corregir el error de desviación en la salida no cause una
alteración excesiva en sentido contrario al de dicha desviación. De ser así, el
error del proceso pasaría alternativamente de un sentido al otro,
desvirtuándose el sistema de control en su propia finalidad. Un sistema de
control inestable puede ejemplificarse en la marcha de un aprendiz de
2 Wiener, N., Cybernetics: or Control and Communication in the Animal and the Machine, Cambridge: MIT Press, 1948.
ciclista. Un pequeño error inicial de dirección y equilibrio es corregido con
intensidad creciente, acabando inexorablemente el recorrido con una caída.
El control por realimentación puede definirse como el uso de las
propias variables de estado como medio de controlar el comportamiento del
sistema. Un ejemplo de la vida diaria de un sistema de control por
retroalimentación es el control de la velocidad de un automóvil, que usa la
diferencia entre la velocidad real y la deseada para variar el flujo de
combustible. Ya que la salida del sistema se usa para regular su entrada, tal
dispositivo se dice que es un sistema de control de bucle cerrado.
En este tema, no sólo trataremos con sistemas de control naturales,
como aquellos que se presentan en organismos vivos o en la sociedad, sino
también con sistemas de control diseñados por el hombre, como los usados
para controlar aviones, automóviles, satélites, robots y procesos industriales.
2.1.5 Los métodos de la teoría de control.
Los métodos de la teoría de control son extraordinariamente variados,
dependiendo de la naturaleza de los problemas. Estos admiten una primera
clasificación en dos grupos: problemas determinísticos y problemas
estocásticos. Son problemas estocásticos aquellos en cuya formulación
intervienen elementos regidos por leyes aleatorias, al menos a efectos de
quien plantea el problema. Es decir, problemas en los que el estado del
sistema es influenciado por perturbaciones aleatorias. Así, si se trata de
plantear un nuevo sistema económico para el futuro, es claro que la evolución
del sistema tendrá aspectos imprevisibles regidos por leyes aleatorias en gran
parte. Quien fabrica tal plan ha de conjeturar, basado tal vez en su
conocimiento previo de la trayectoria evolutiva de otros sistemas semejantes,
la situación de éste y sus reacciones posibles a tal o cual manipulación.
Los problemas determinísticos admiten una gran variedad. El proceso
que se estudia puede regirse por un sistema de ecuaciones diferenciales
ordinarias, o parciales, o en diferencias finitas. La formulación exacta de un
proceso real conduce con frecuencia a problemas matemáticos intratables por
su excesiva complicación. Caben entonces dos actitudes. Uno puede
contentarse con una simplificación del problema que resulte asequible al
tratamiento matemático, o bien, renunciando al tratamiento analítico
completo del problema, se acude a su tratamiento numérico, ensayando
obtener una solución aproximada mediante el uso de computadores y los
métodos del análisis numéricos.
Con frecuencia surgen problemas que ocasionan por su interés
matemático y práctico el desarrollo de todo un nuevo campo con métodos
propios. Así, por ejemplo, ha surgido el de las ecuaciones diferenciales con
argumento retardado. Consideremos el sistema del diagrama funcional
representado anteriormente para el control por realimentación. El proceso,
que podemos pensar como una cadena de fabricación en serie, tiene una
entrada y una salida. Es razonable pensar que, desde que el proceso comienza
con la fabricación de una pieza hasta que ésta sale acabada, que es cuando
pasa por la unidad de medida, transcurra un cierto tiempo . Mientras tanto,
el proceso ha seguido funcionando en las mismas condiciones, y si éstas han
sido defectuosas, el control no tiene oportunidad de actuar hasta un tiempo
después. Esta situación, así como la posibilidad, también razonable, de que la
acción de control no sea instantánea, sino diferida unos segundos, da lugar a
la consideración de ecuaciones diferenciales del tipo
F (t , x, x' (t ), x' (t   ))  0
que se denominan de argumento retardado.
Asimismo, los problemas con que se enfrenta la teoría de control son a
menudo no lineales. Esto motiva la necesidad de utilización del análisis no
lineal, rama que se encuentra hoy en día en plena expansión.
Vamos ahora a examinar algunos de los principios básicos de la teoría
de control. El modo de proceder en los problemas del cálculo de variaciones
clásico se ha conservado en los modernos problemas de control en una buena
medida. De entre las posibles funciones que es necesario considerar se logra,
primeramente, descartar un buen conjunto de ellas, mediante condiciones
necesarias que ha de satisfacer la solución, o soluciones al problema. Además,
esta primera selección permite en muchos casos asentar la existencia de
solución o soluciones al problema. En el cálculo de variaciones la ecuación de
Euler era una de tales condiciones. En la teoría de control moderna el
principio de optimalidad y el principio de máximo de Pontryagin representa un
papel similar.
El principio de optimalidad es la formulación del hecho obvio de que si
una estrategia comprende varios estadios parciales, y es óptima, lo es
necesariamente en cada uno de sus estadios. De otro modo, podría ser
sustituida por una estrategia globalmente mejor. En otras palabras, si para ir
de A a C existe un camino G, que es el mejor posible, y sabemos que pasa por
B, es claro que el mejor camino posible para ir de A a B es el que sigue G.
El principio máximo de Pontryagin es de formulación más complicada.
Se refiere a sistemas de control regidos por ecuaciones diferenciales
ordinarias y afirma que el control óptimo, si existe, ha de hacer máxima una
cierta expresión de significado nada obvio. El principio es de gran
aplicabilidad, y permite en muchas ocasiones resolver completamente el
problema en cuestión.
El principio de bang-bang se refiere a sistemas de control lineales
regidos por ecuaciones diferenciales ordinarias en los que el índice de
funcionamiento es el tiempo. Tales problemas se denominan problemas
lineales de control óptimo de tiempo. Un control se llama de conmutación
cuando los valores que toma son +1 y –1 alternativamente. Puede ser
realizado, por ejemplo, mediante un conmutador eléctrico que solamente
admite dos posiciones. Un control de conmutación se llama también en la
literatura control bang-bang. El principio de bang-bang afirma que cualquier
efecto realizable mediante un control medible puede ser realizado también
mediante uno de conmutación en el mismo tiempo. Por tanto, si existe un
control de tiempo óptimo, existe un control de conmutación óptimo. Y
también, si un control de conmutación es de tiempo óptimo con respecto a los
otros controles de conmutación, entonces es óptimo.
El principio de bang-bang es de gran importancia práctica, pues un
control de conmutación es mucho más sencillo de realizar efectivamente que
un control de cambio continuo.
2.2. HISTORIA DEL CONTROL AUTOMÁTICO.
Comenzaremos haciendo una breve historia de la teoría del control
automático. Estudiando el progreso histórico de la teoría del control, es
posible distinguir algunas tendencias fundamentales y señalar algunos avances
clave.
La teoría del control es una disciplina práctica. Como tal, su progreso
ha estado muy ligado a los problemas prácticos que necesitaron ser resueltos
en cualquier fase de la historia humana. Desde que existe la cultura humana,
el control ha significado alguna clase de poder o dominación del hombre sobre
su entorno. Determinados fragmentos cuneiformes sugieren que en el siglo
veinte antes de Cristo, en la antigua Mesopotamia ya existían determinados
sistemas de control de irrigación. Los desarrollos clave de la historia de la
humanidad que han afectado al desarrollo del control por realimentación han
sido:
1. La preocupación de los Griegos y los Árabes por controlar de forma
precisa la evolución del tiempo. Esto representa un período
comprendido entre los años 300 AC hasta el 1200 DC.
2. La Revolución Industrial en Europa. Generalmente se sitúa su comienzo
en el tercer cuarto del siglo XVIII; sin embargo, sus raíces pueden
encontrarse ya en los años 1600.
3. El comienzo de las comunicaciones de masas y la Primera y Segunda
Guerras Mundiales. Esto representa el período entre 1910 y 1945.
4. El comienzo de la era espacial y del computador en 1957.
En un punto intermedio entre la Revolución Industrial y las Guerras
Mundiales, hubo un desarrollo extraordinariamente importante. La teoría del
control comenzó a adquirir su lenguaje escrito, el lenguaje de las
matemáticas. J. C. Maxwell proporcionó el primer análisis matemático
riguroso de un sistema de control por retroalimentación o feedback en 1868.
De esta forma, y en cuanto a su formulación matemática, se puede dividir la
historia del desarrollo matemático de la teoría del control en varias etapas:
1. Prehistoria del control automático: sería el período anterior a 1868,
hasta la publicación del primer trabajo matemático sobre la teoría del
control por Maxwell.
2. Según Friedland3, podemos llamar al período comprendido entre 1868 y
los primeros años del siglo XX el período primitivo del control
automático.
3. Es habitual llamar al período desde entonces hasta 1960 el período
clásico;
4. y al período posterior a 1960 hasta el presente el período moderno.
2.2.1 Antecedentes de la teoría de control.
Estudiemos de forma rápida la historia de los dispositivos de control
automático. Una referencia detallada para el período entre –300 hasta la
Revolución Industrial puede encontrarse en la referencias citadas ( 4, 5).
3 Friedland, B., Control System Design: An Introduction to State-Space Methods, New York: McGraw-Hill, 1986.
Relojes de agua de los Griegos y los Árabes.
La primera motivación para el control en tiempos antiguos fue la
necesidad de determinaciones precisas del devenir del tiempo. Así, alrededor
de –270, el mecánico griego Ktesibios de Alejandría inventó un regulador de
corcho (válvula de flotador) para un reloj de agua. La función de este
regulador era mantener el
nivel del agua en un tanque a
una profundidad constante.
Esta profundidad constante
producía un flujo de agua a
través de una tubería situada
en la parte inferior del
tanque que llenaba un
segundo depósito a una
velocidad constante. El nivel
de agua en el segundo
depósito era proporcional al
tiempo transcurrido. De esta
forma, el reloj de Ktesibios
medía con precisión las
horas, los días y los años. El
regulador
de
Ktesibios
consistía en un flotador para controlar el flujo de agua entrante a través de
una válvula; cuando el nivel de agua bajaba, la válvula se abría y ponía el
nivel del reservorio al nivel adecuado. Este regulador flotante tenía la misma
misión que el flotador de la cisterna de los actuales WC.
4 Mayr, O., The Origins of Feedback Control, MIT Press, Cambridge 1970; Mayr O., The Origins of Feedback Control, Scientific
American vol 1(4), pág. 110-118 (Octubre 1970). Disponible on-line en http://reserve.libraries.psu.edu/me/19010.htm.
5 Fuller, A.T., "The Early Development of Control Theory," Trans. ASME (J. Dynamic Systems, Measurement, & Control), vol.
98G, no. 2, pp. 109-118, June 1976. y no. 3 pp. 224-235, September 1976.
Un regulador flotante fue usado por Filón de Bizancio en –230 para
mantener el aceite de una
lámpara a un nivel constante.
Durante el primer siglo
DC,
Heron
de
Alejandría
desarrolló reguladores flotantes
y similares para propósitos tales
como dispensadores de vino,
diseños
de
sifones
para
mantener entre dos tanques de
agua
diferencias de
nivel
constantes, la apertura de
puertas de templos, etcétera.
Dispensador de vino.
“Máquina” de aire caliente:
Debajo de las puertas del templo, se
sitúa una vasija esférica B que contiene
agua. Una tubería FG conecta la parte
superior de esta esfera con el pedestal
del altar, un espacio hueco y
herméticamente cerrado. Otra tubería
conduce desde la esfera a otra vasija o
cubo, colgada a través de una polea por
la que pasan unas cuerdas atadas a los
ejes que abren o cierran las puertas.
Otras cuerdas sujetan un contrapeso a
través de otra polea, atadas a los
mismos ejes de forma tal que su movimiento produce el giro opuesto al de las
cuerdas provinentes de la vasija colgada. Si se enciende un fuego en el altar,
el aire calentado se expande, pasa por la tubería y empuja al agua de la
esfera a través del sifón al cubo colgado. El peso de esta vasija hace que ésta
descienda, girando los ejes de las puertas, y haciendo que éstas se abran.
Cuando se extingue el fuego, el aire se condensa, el agua vuelve de nuevo a
través del sifón del cubo a la esfera, el contrapeso cae y las puertas del
templo se cierran.
En la antigua China se han encontrado dispositivos como el regulador de
pajita que se muestra en la figura inferior.
Desde 800 hasta 1200, varios ingenieros árabes como los tres hermanos
Musa, Al-Jazari y Ibn Al-Sa’ati usaron reguladores flotantes para relojes de
agua y otras aplicaciones. Durante este período se usó el importante principio
de control “on/off”, que volverá a surgir al tratar los problemas de tiempo
mínimo en los 1950.
Por fin, cuando Bagdad cayó ante los mongoles en 1258, todo este
pensamiento creativo vió su fin. Además, la invención del reloj mecánico en
el siglo XIV hizo obsoleto el reloj de agua y sus sistemas de feedback o
retroalimentación. (El reloj mecánico no es un sistema de feedback). El
regulador flotante no aparece otra vez hasta su uso en la Revolución Industrial
alrededor de 1750.
Además de situarse en el tiempo, el hombre se preguntó desde antiguo
por su lugar en el espacio. Merece la pena mencionar un sistema de control de
pseudo-retroalimentación que se desarrolló en China en el siglo XII (Wu Tejen,
año 1107) para la navegación. Los carros de combate tenían una estatua que
giraba gracias a un mecanismo ligado a las ruedas del carro de tal forma que
la estatua siempre apuntaba al sur. Usando la información direccional
proporcionada por la estatua, el conductor del carro podía seguir una línea
recta. Llamamos a este mecanismo pseudo-feedback porque no involucra
técnicamente un mecanismo de retroalimentación propiamente dicho, a
menos que las acciones del conductor sean incluidas como parte del sistema.
Por ello, no es un sistema de control automático.
La Revolución Industrial.
La Revolución Industrial en
Europa fue consecuencia, entre
otros factores, de la introducción
de
las
primeras
máquinas
motrices,
especialmente
las
máquinas de vapor. La historia
comienza con la invención de los
molinos para moler grano, y
continúa con el diseño y
construcción de hornos, calderas,
y por fin, la máquina de vapor.
Estos dispositivos no podían ser
regulados de forma adecuada a
mano, y de esa forma surgió la
necesidad de desarrollar sistemas
de
control
automático
adecuados. Se inventaron en esta
época una gran variedad de dispositivos de control, tales como reguladores
flotantes, reguladores de temperatura, reguladores de presión, y dispositivos
de control de velocidad.
James Watt inventó su máquina de vapor en 1769, y esta fecha marca
para los historiadores el comienzo aceptado de la Revolución Industrial. Sin
embargo, las raíces de la Revolución Industrial pueden llevarse hasta los años
1600 o antes, con el desarrollo de los molinos y los hornos.
Antes de Watt, hubo otros inventores que diseñaron y construyeron
máquinas de vapor. Especialmente digna de mención es la máquina de vapor
de balancín desarrollada por el herrero Thomas Newcomen en colaboración
con John Cawley en Devon en 1712. En un extremo del balancín se encontraba
la barra del émbolo de una caldera de vapor. Cuando el vapor penetra en el
cilindro, el émbolo asciende. Ello da lugar a que el agua penetre en el
cilindro, lo que a su vez produce la condensación del vapor, creando una
región de vacío, y el retroceso del émbolo por el interior del cilindro hasta la
posición inicial debido a la presión atmosférica exterior. En el otro extremo
del balancín había una bomba capaz de extraer 540 litros de agua por minuto
con doce oscilaciones del balancín. La eficacia de esta máquina de vapor era
muy baja (alrededor de un uno por ciento de la energía utilizada para
calentar la caldera), porque era necesario estar calentando permanentemente
la caldera (muy pesada, y por tanto con un valor alto para la capacidad
calorífica) pues ésta continuamente se enfriaba en el momento de la
condensación del vapor (al retroceder el émbolo).
El hecho de que estas máquinas de vapor tempranas fueran
energéticamente ineficientes y su funcionamiento fuera regulado a mano, las
hacía poco adecuadas al uso industrial. Es importante darse cuenta de que la
Revolución Industrial no comenzó realmente hasta la invención de máquinas
mejoradas y sistemas de control automático para regularlas.
La denominación “Revolución Industrial” puede resultar exagerada. Sin
embargo, es indudable que el cambio producido en las sociedades industriales
tras la invención de la máquina de vapor ha sido enorme. Antes de 1783
(primera venta de una máquina de vapor), la disponibilidad energética de un
hombre era la que podía producir por sí mismo o con ayuda del trabajo
animal. Un granjero con un caballo o dos disponía de una potencia promedio
de 0.1 kW. En la actualidad, al
comienzo del siglo XXI, el consumo
energético per cápita en el mundo
desarrollado es de alrededor de 10
kW.
Este
incremento
ha
revolucionado la forma de vida de
una forma extraordinaria.
Los molinos de viento.
Los constructores de molinos
de
viento,
por
su
parte,
desarrollaron una gran variedad de
sistemas
de
control
por
realimentación. El “fantail” o
“ventilador de cola”, inventado en
1745 por el herrero británico Edmund
Lee, consistía en un pequeño
ventilador montado a ángulo recto
de la rueda principal de un molino de
viento. Su función era hacer girar el
eje del molino de viento de forma continua
para que éste quedase alineado en la dirección
del viento, maximizando la eficiencia del
mismo.
La tolva (dispositivo colocado encima de
la muela –piedra de molino- desde donde va
cayendo la molienda al sitio en que es
triturada) es un dispositivo que regula el flujo
de grano en un molino, dependiendo de la
velocidad de rotación de la muela. Estaba en
uso en una forma refinada en 1588.
Y finalmente, eran necesarios también
dispositivos para medir y regular la velocidad
de rotación de los molinos. Para construir un
controlador de realimentación que mantenga
estable la velocidad, es necesario en primer lugar disponer de dispositivos de
medida de la misma. Los constructores de molinos desarrollaron varios
dispositivos para medir la velocidad de rotación. Usando estos sensores,
fueron inventados varios dispositivos de regulación de velocidad, incluyendo
velas para molinos de viento autorregulados. La mayor parte de la tecnología
que desarrollaron los constructores de molinos fue más tarde desarrollada
para su uso en la regulación de la máquina de vapor.
Reguladores de Temperatura.
Cornelius Drebbel, ingeniero holandés, vivió en Inglaterra algún tiempo,
y también en la Praga del Emperador Rudolf II, junto a su contemporáneo J.
Kepker. Alrededor de 1624, desarrolló un sistema de control de temperatura
automático (termostato) para un horno, motivado por su creencia de que los
metales básicos podían ser convertidos en oro manteniéndoles a una
temperatura constante y precisa durante un período largo de tiempo.
También usó este regulador de temperatura en una incubadora para gallinas
ponedoras.
Los reguladores de temperatura fueron estudiados por J. J. Becher en
1680, y se usaron de nuevo en una incubadora por el Principe de Conti y R.-A.
F. De Réaumur en 1754.
El “registro centinela” se desarrolló en América por W. Henry alrededor
de 1771, quien sugirió su uso en hornos químicos, en la producción de acero y
porcelana, y en el control de la temperatura de un hospital.
No fue hasta 1777, sin embargo, cuando Bonnemain, un inventor
parisino, mejoró estos sistemas desarrollando un regulador de temperatura
adecuado para uso industrial, que fue patentado en 1783. Su termostato fue
usado en una incubadora para el crecimiento de gallinas. Su dispositivo
consistía en un sensor de temperatura compuesto por una varilla de hierro
rodeada por un tubo de plomo. La dilatación o compresión de la longitud del
tubo de plomo debido al cambio de temperatura constituía la variable que
controlaba la temperatura. Este movimiento se acoplaba a una palanca de
control de entrada de aire de un horno de tal forma que un aumento en la
temperatura del horno reducía el flujo de entrada de aire al horno y
viceversa. El control de temperatura permitió a Bonnemain, entre 1778 y
1794, dirigir una enorme granja a las afueras de París que abastecía de
gallinas a la corte real y al mercado de París. Su dispositivo fue más tarde
instalado en el horno de una planta productora de agua caliente.
Reguladores flotantes.
La regulación del nivel de un
líquido era condición indispensable en
dos áreas importantes en los últimos
años del siglo XVIII: en la caldera de
una máquina de vapor y en los
sistemas de distribución de agua
doméstica. Por tanto, el regulador
flotante recibió un nuevo interés,
especialmente en Gran Bretaña.
En su libro de 1746, W. Salmon
citaba precios para reguladores
flotantes usados para mantener el
nivel de depósitos de agua para viviendas. Este regulador fue usado en las
primeras patentes de las cisternas de WC alrededor de 1775. La cisterna fue
refinada posteriormente por Thomas Crapper, un fontanero londinense, que
gracias a sus inventos, fue armado caballero por la Reina Victoria, y pasó por
tanto a ser sir Thomas Crapper.
El primer uso conocido de un regulador de válvula flotante en una
caldera de vapor está descrito en una patente debida a James Brindley en
1758. El usó un regulador en una máquina de vapor diseñada y construida para
bombear agua. S. T. Wood usó un regulador flotante para una máquina de
vapor en su fábrica de cerveza en 1784. En la Siberia rusa, el minero de
carbón Ivan I. Polzunov desarrolló en 1765 de forma independiente un
regulador flotante para una caldera de vapor que impulsaba ventiladores para
altos hornos. El esquema de regulador flotante de Polzunov se muestra en la
figura adjunta. Cuando el nivel de agua cae por debajo de un nivel
preseleccionado por la longitud del cable vertical unido al flotador, la válvula
se abre y el agua entra en el depósito, hasta que el flotador alcanza el nivel
preseleccionado y la válvula de entrada se cierra.
En 1791, cuando se adoptó por la firma de Matthew Boulton y James
Watt, el regulador flotante era ya de uso común en máquinas de vapor.
Reguladores de Presión.
Otro problema asociado a la máquina de vapor era el de la regulación
de la presión de vapor en la caldera, persiguiendo que el vapor que movía la
máquina estuviera a una presión constante.
En 1674, el físico francés Denis Papin se percata de que la temperatura
de ebullición del agua y otros líquidos depende de la presión a que están
sometidos. Cuando las presiones son superiores a la atmosférica, las
temperaturas correspondientes a los puntos de ebullición aumentan. Papin
aprovecha su descubrimiento y comercializa en 1681 la primera olla a presión.
En esta olla metálica herméticamente cerrada, equipada con una válvula de
sobrepresión segura inventada por él mismo, la presión del vapor aumenta
durante la cocción. Estos valores superiores permiten una cocción más rápida.
En el año 1707, Papin usó esta válvula de sobrepresión como dispositivo
de regulación de su máquina de vapor de alta presión destinada al bombeo de
agua para las fuentes de Kassel. A partir de entonces, este dispositivo de
regulación de la presión de vapor fue un dispositivo estándar en las máquinas
de vapor.
El regulador de presión fue refinado posteriormente en 1799 por R.
Delap y también por M. Murray. En 1803, un regulador de presión se combinó
con un regulador centrífugo por Boulton y Watt para uso en sus máquinas de
vapor.
Reguladores centrígugos.
La máquina de vapor alcanzó su madurez en 1783 con la venta del
primer prototipo de máquina de vapor del escocés James Watt. Dicha
máquina, ya adecuada para su uso industrial, fue diseñada mucho antes del
primer enunciado de la Primera Ley de la Termodinámica, que data de 1842.
El incentivo principal para su desarrollo era evidentemente el deseo de
introducir una máquina motriz en la molienda del grano. Usando la máquina
de vapor rotatoria, el molino de vapor de Albion comenzó su operación en
1786.
Fue en la Universidad de Glasgow donde Watt entró en contacto por
vez primera con una máquina de vapor de balancín (inventada por
Newcomen), que le había sido entregada para que reparase.
Tres novedades esenciales en el diseño de la máquina de vapor de Watt
fueron las que definitivamente introdujeron la máquina de vapor en la
industria de la época. Dichas mejoras fueron el diseño de “doble acción” que
permitió mejorar la eficiencia energética de la máquina de vapor, el
“engranaje planetario” (y posteriormente la biela) para transformar el
movimiento oscilante en movimiento rotatorio, y el “péndulo cónico” o
centrífugo como regulador de la velocidad de salida.
En 1765, el constructor Watt separó el condensador del cilindro (que en
la máquina de Newcomen iban unidos), eliminando la necesidad de calentar el
cilindro (muy pesado, y por tanto con un alto valor para la capacidad
calorífica) de forma constante, con lo que se consiguió reducir un 75% de
energía. Watt, además, aisló térmicamente el cilindro para evitar pérdidas
térmicas. En lugar de la presión atmosférica para lograr el retroceso del
émbolo, el modelo de Watt usaba la propia presión de vapor generada. Para
ello, se conducía el vapor a ambos lados del émbolo, motivo por el cual esta
máquina de baja presión se denominó de “doble acción”. De esta forma, al no
condensarse el vapor (el retroceso lo realizaba el propio vapor, y no la
entrada de presión atmosférica, que condensaba el vapor) la eficiencia
energética era mucho mayor.
En segundo lugar hay que considerar la mejora introducida debido al
“engranaje planetario” y el volante, que introduce Watt por primera vez para
adecuar el movimiento de subida y bajada del émbolo a movimiento rotatorio.
Las primeras máquinas de vapor estaban provistas de un movimiento de salida
oscilante que era regulado usando un dispositivo conocido como balancín,
utilizado ya por Newcomen en su máquina de vapor diseñada para el bombeo
de las minas de carbón de Cornwall. Ahora, a pesar de tener una estructura
semejante a las de la máquina de vapor de balancín, el movimiento generado
por la máquina de vapor es rotatorio.
Y finalmente, el problema del control de la velocidad. Un problema
asociado a la máquina de vapor rotatoria era la regulación de la velocidad de
revolución. Parte de la tecnología de la regulación de velocidad de los
constructores de molinos de viento y agua fue desarrollada para este
propósito. En 1788, Watt completó el diseño del “regulador de bolas
voladoras” (péndulo centrífugo o péndulo cónico) para la regulación de la
velocidad de la máquina de vapor rotatoria. El dispositivo empleaba dos
esferas metálicas pivotadas que eran desplazadas hacia fuera debido a la
fuerza centrífuga. Cuando la velocidad de rotación se incrementaba, los pesos
se separaban del eje de giro, accionando un mecanismo (“sistema de varillas
en paralelogramo”) que estrangulaba la válvula de flujo de vapor, lo que
ralentizaba el funcionamiento de la máquina. De esta forma, se garantizaba
de forma automática una
velocidad constante de giro.
La
historia,
sin
embargo,
comienza
algo
antes. El péndulo centrífugo
fue usado por primera vez
para controlar la velocidad de
giro en molinos de viento. En
1787, Thomas Mead patentó
el uso de un péndulo
centrífugo para controlar la
velocidad de las aspas de un
molino de viento. Las piedras
de un molino de viento tenían
tendencia
a
separarse
(levantarse la superior frente
a la inferior) cuando la velocidad angular de las piedras era muy elevada. Esto
conducía a una molienda no muy fina. Para corregir esto, Mead dispuso el
actuador de un péndulo centrífugo para controlar el grado de inclinación de
las velas del molino de viento, de tal forma que cuando la velocidad de giro
de las piedras se incrementase, el ángulo de inclinación de las velas
decreciese, controlando de esta forma la salida (velocidad angular de las
ruedas) constante, a pesar de pequeños cambios en la entrada (velocidad del
viento).
En 1784, Boulton y Watt se involucraron en la construcción de un
molino que funcionase con ayuda de una máquina de vapor. Para supervisar la
construcción del molino, ellos contrataron a un constructor de molinos de 23
años, John Rennie, que acababa de finalizar su aprendizaje bajo un famoso
constructor de molinos escocés, Andrew Meikle. En mayo de 1788, Matthew
Boulton visitó este molino, el Molino Albion, y descubrió que Rennie había
instalado un péndulo centrífugo para detectar la velocidad de las piedras del
molino. La salida del péndulo era aplicada a un dispositivo que presionaba
hacia abajo las piedras del molino, para mantener constante el espaciado
entre las piedras, a pesar de variaciones en su velocidad de giro, y asegurar
de esta forma una molienda fina. Boulton y Watt se dieron cuenta de que el
péndulo centrífugo podía servir como un medio para controlar de forma
directa la velocidad de la máquina de vapor. Todo lo que necesitaban era
aplicar la salida del péndulo centrífugo a la presión de entrada a los pistones
de la máquina a través de la válvula de entrada. De hecho, Boulton y Watt
acababan de mejorar el diseño de esta válvula, de tal forma que fue sencillo
acoplar a dicha válvula el péndulo centrífugo. El diseño real del regulador
centrífugo fue dejado en manos de John Southern, un ayudante de Watt que
contaba treinta años. A finales de 1788, el regulador había sido diseñado y fue
instalado en la máquina de vapor. De esta forma, el controlador de velocidad
de los molinos de viento se convirtió el regulador de velocidad de la primera
máquina de vapor de la Era Industrial. El péndulo centrífugo, girando en la
parte superior de cada máquina de vapor capturó la imaginación de todo
quien la observó, convirtiéndose en todo un símbolo de la rama del saber
dedicada al control automático.
Los dispositivos de control o realimentación utilizados hasta entonces
permanecían como secundarios o no jugaban un papel fundamental como
parte de la maquinaria que controlaban. Sin embargo, la operación del
péndulo centrífugo fue claramente visible incluso para el ojo no entrenado, y
su principio de funcionamiento tenía un gusto exótico que parecía a muchos
encarnar la naturaleza de la nueva era industrial. Por ello, el regulador
centrífugo alcanzó la conciencia del mundo industrial y pasó a ser un símbolo
de toda una revolución en Europa. Este fue el primer uso del control por
realimentación o feedback que tuvo un conocimiento popular y extendido.
Merece la pena mencionar que la palabra griega para regulador es
kußernan. En 1947, el matemático norteamericano Norbert Wiener en el MIT
(Massachusetts Institute of Technology) estaba buscando un nombre para su
nueva disciplina de teoría autómata de control y comunicación en el hombre y
la máquina. Investigando el péndulo centrífugo de Watt, él investigó también
la etimología de la palabra kußernan, y dio con la palabra griega para
gobierno, kußerntV. De esta forma, seleccionó el nombre de cibernética para
su nuevo campo. Wiener, partiendo del paralelismo empírico entre los
sistemas de regulación orgánicos y técnicos, los estudia utilizando para ello
modelos matemáticos y estadísticos, y acaba introduciéndolos en la
descripción de nuevos procesos.
Alrededor de 1790 en Francia, los hermanos Périer desarrollaron un
regulador flotante para controlar la velocidad de una máquina de vapor, pero
su técnica no igualaba los resultados del regulador centrífugo, por lo que fue
pronto suplantado.
Finalmente, en 1799 William Murdock inventó el distribuidor de vapor,
que permite un control automático de las válvulas, así como la excéntrica,
que simplifica el proceso de transformación del movimiento de ascenso y
descenso del émbolo en otro giratorio.
El péndulo simpático.
Habiendo comenzado nuestra historia del control automático con los
relojes de agua de la antigua Grecia, retomamos esta porción de la historia
volviendo a la preocupación de la humanidad con el paso del tiempo.
El reloj mecánico inventado en el siglo XIV no es un sistema de control
de realimentación de bucle cerrado, sino un dispositivo oscilatorio de bucle
abierto de precisión, cuya exactitud se asegura protegiendo el mecanismo de
perturbaciones externas. En 1793, el franco-suizo Abraham-Louis Breguet, el
constructor de relojes más famoso de su tiempo, inventó un sistema de
retroalimentación de bucle cerrado para sincronizar relojes de bolsillo.
El péndulo simpático de Breguet usaba un caso especial de regulación
de velocidad. Consistía en un gran cronómetro de alta precisión con una
montura para un reloj de bolsillo. El reloj de bolsillo a ser sincronizado se
situaba en la montura ligeramente antes de las doce en punto, a la hora en
que un alfiler emergía del cronómetro, se insertaba en el reloj, y comenzaba
un proceso de ajuste automático regulando el brazo del muelle del reloj de
bolsillo. Después de introducir el reloj en el péndulo simpático unas pocas
veces, el brazo regulador se ajustaba automáticamente. En un sentido, este
dispositivo se usaba para transmitir la precisión del gran cronómetro al
pequeño reloj de bolsillo.
El submarino de Isaac Peral.
En 1885, el español Isaac Peral presentó un proyecto de “torpedero
sumergible” a sus superiores del Observatorio de San Fernando donde
trabajaba (el primer submarino torpedero eléctrico). El Ministro de la Marina
le hizo acudir a Madrid, donde expuso su proyecto ante una comisión técnica ,
recibiendo un informe favorable y siendo autorizada la construcción del
submarino.
La aportación más importante de Isaac Peral al mundo submarino, más
que la posibilidad de la navegación bajo el agua, problema resuelto con
anterioridad por algunos inventores y especialmente por otro español, Narciso
Monturiol, con el “Ictíneo”, fue la resolución de los problemas que el
submarino presentaba para ser utilizado como arma, como torpedero
sumergible en la terminología de la época.
Ligado con ello, tuvo que resolver, entre otros, los problemas del
mantenimiento de cota de inmersión (con su “aparato de profundidades”) y
de la inclinación. Para ello, desarrolló un regulador automático de
profundidad, basado en las propiedades elásticas de la flexión de una lámina,
órgano vital destinado a mantener de forma automática la cota de inmersión;
y un péndulo diseñado para el control de la inclinación.
Se trataba del dispositivo que ponía en marcha, simultánea o
independientemente, los motores eléctricos acoplados a las dos hélices de eje
vertical, situadas en las cabezas del buque. El elemento sensible era un
lámina flexible, en una de cuyas caras actuaba la presión del agua, en tanto
que en la otra lo hacía un muelle, previamente regulado a la tensión
correspondiente a la profundidad deseada.
Cuando el submarino se encontraba a esa profundidad, la lámina no
presentaba deformación alguna, por anularse ambas presiones. En este caso
se mantenía cerrado un circuito secundario que hacía girar las hélices a poca
velocidad, pero suficiente para compensar la flotabilidad positiva del
submarino, que era de sólo 50 kg., para que llevando los tanques de lastre
llenos y las citadas hélices paradas , la torreta quedara a flote. Por el
contrario, cuando la tensión del muelle superaba la presión del agua, la
lámina se curvaba cerrando el circuito principal y ambas hélices giraban a
gran velocidad, impulsando la nave hacia el fondo, hasta quedar igualadas
dichas presiones.
Inversamente, cuando la presión del agua era mayor que la tensión del
muelle, la lámina se curvaba hacia el otro lado y las hélices giraban en
sentido contrario, haciendo subir al submarino. En la práctica, como existía la
flotabilidad positiva antes indicada, la cota de inmersión se mantenía
mediante la acción intermitente de las hélices, de acuerdo con las ligeras
oscilaciones verticales que se producían en todo caso inferiores a 30 cm. de
amplitud.
Independiente del aparato de profundidades había un péndulo de
nivelación que al inclinarse longitudinalmente el submarino, ponía en
funcionamiento las hélices hasta colocarlo horizontal.
Comunicaciones de Masas y el Teléfono de Bell.
A finales de los años 1920 y principios de los 1930, el tema del control y
la retroalimentación recibió un empuje extraordinario debido a la aparición
de problemas relacionados con la ingeniería eléctrica de sistemas de
comunicación.
Un problema fundamental en el desarrollo de un sistema de
comunicaciones de masas que pudiese extenderse a grandes distancias era la
necesidad de amplificar de forma periódica la señal de voz en largas líneas
telefónicas. Para que una señal de voz pudiese transmitirse a distancias
transcontinentales, era necesario utilizar en la línea varios cientos de
dispositivos amplificadores denominados “repetidores”. Fluctuaciones en la
ganancia de salida de estos amplificadores producían una distorsión de la
señal, por lo que al final, se producía una degradación de la señal que era
proporcional al número de amplificadores presentes en la cadena.
Desafortunadamente, a menos que se tome gran precaución, no sólo se
amplifica la señal, sino también el ruido. Era, pues, absolutamente necesario
controlar automáticamente la ganancia de estos amplificadores con una gran
precisión.
Para reducir la distorsión en amplificadores, Harold Stephen Black 6
demostró la utilidad de la realimentación negativa en 1927. En 1904 había
sido inventado el “diodo” (tubo con dos electrodos por el que circula una
corriente de electrones) por el británico Ambrose Fleming. En 1906, el físico
norteamericano Lee de Forest había presentado el “triodo”. De Forest coloca
entre los electrodos del diodo una rejilla metálica, y aplica una corriente
6 Black, H.S., "Stabilized Feedback Amplifiers," Bell Syst. Tech. J., 1934.
continua. Mediante pequeñas modificaciones en esta tensión puede variar en
gran medida la corriente de electrones en el interior del tubo. Este es el
principio en que se basa la amplificación electrónica. Simultáneamente, el
físico austríaco Robert von Lieben había presentado de forma independiente
una patente para el “relé de rayos catódicos”, consistente en la introducción
en el tubo amplificador de tres rejillas que tenían la misma finalidad.
Finalmente, en 1927 se inventa el amplificador de realimentación de
forma independiente por el neerlandés Klaas Posthumus y el norteamericano
Harold Stephen Black, mejorando tanto la calidad de la recepción de las
emisiones de radio como la estabilidad de los receptores. Las propiedades
amplificadoras logran una notable independencia tanto de la temperatura
como del acabado (tolerancias que se producen en la fabricación) de los
componentes electrónicos empleados. El principio de amplificación por
realimentación se basa en hacer pasar de nuevo una parte de la tensión de
salida del amplificador por la entrada, donde se resta de la tensión que entra
en el aparato. Estos amplificadores con acoplamiento negativo aplicados a las
oscilaciones eléctricas muestran un comportamiento mucho más estable que
los amplificadores convencionales.
Control de navegación de barcos y Control Clásico.
Durante las Guerras Mundiales, el desarrollo de los sistemas de control
llegó a ser cuestión de supervivencia.
Un problema militar importante durante este período fue el control
aplicado a navegación de barcos, que eran cada vez más avanzados en su
diseño. Entre los primeros desarrollos estuvo el diseño de sensores para
control de bucle cerrado.
En 1910, Elmer Ambrose Sperry concibió y desarrolló distintos
dispositivos de control basados en la idea del giróscopo. Un giróscopo es un
disco montado en una base de tal forma que el disco puede girar libremente
alrededor de sus ejes. Por ello, cuando el disco está girando, permanecerá
con una orientación fija, independientemente de los movimientos de la base.
Sperry se dió cuenta de que ello le confería la posibilidad de convertirse en un
dispositivo de control en barcos construidos en metal, en los que las brújulas
magnéticas no funcionaban correctamente. El giroestabilizador de Sperry,
patentado en 1908, consiste en un giróscopo con una gran inercia, y cuyo eje
vertical estaba montado en la bodega del barco. El primer giroestabilizador
data de 1912, y conseguía minimizar el cabeceo del barco en su movimiento,
con lo que se evitaban las tensiones en la estructura del barco y los daños al
cargo, además que se mejoraba el confort en los pasajeros. Durante la
Segunda Guerra Mundial, Sperry diseñó un avión sin piloto que podía
transportar hasta 450 kg de explosivos a una distancia de 160 km bajo control
giroscópico (la primera bomba volante V-1). Más tarde, otros dispositivos
inventados por Sperry fueron utilizados para distintos objetivos, entre ellos, el
control de barcos de vapor, y para el piloto automático de aviones, etc.
N. Minorsky7 introdujo su controlador de tres términos para la
conducción de barcos, llegando a ser el primero en usar un controlador PID
(proportional-integral-derivative). Él consideró los efectos no lineales en un
sistema de bucle cerrado.
Desarrollo de Armamento y Apuntamiento de Proyectiles.
Otro problema importante en el período de las Guerras Mundiales fue el
del apuntamiento preciso de armas a bordo de barcos y aviones dotados de
movimiento. Con la publicación de su “Theory of Servomechanisms”, de H. L.
Házen8, se inició el uso de la teoría matemática del control en tales
problemas. En su artículo, Házen acuñó la palabra servomecanismo, que
implica una relación principal/esclavo en los sistemas.
La mira de bombardeo de Norden, desarrollada durante la Segunda
Guerra Mundial, usaba repetidores síncronos para obtener información acerca
de la altura de los aeroplanos, y perturbaciones de velocidad y viento sobre la
mira, asegurando alcances precisos de las armas.
2.2.2 El Nacimiento de la Teoría Matemática de Control.
El diseño de sistemas de control por feedback fue una historia de
prueba y error junto a una gran cantidad de intuición práctica de los
personajes de la historia. De esta forma, podría decirse que se trató más bien
de un arte que de una ciencia.
Los ingenieros del siglo XIX encontraron experimentalmente que cuando
el “feedback” del regulador centrífugo aumentaba (esto es, se reducía más y
más la presión de vapor para un incremento fijo de la velocidad de salida), se
alcanzaba un punto donde el regulador dejaba de controlar, y la salida
(velocidad) comenzaba a oscilar. El regulador se volvía inestable. El
regulador, diseñado para superar el efecto de las perturbaciones externas,
podía, bajo ciertas circunstancias, generarlas. El responsable de este cambio
de comportamiento es el “tiempo de respuesta” finito desde que el regulador
detecta hasta que se genera la salida de retroalimentación. Este tiempo de
respuesta hace que la retroalimentación negativa (las perturbaciones a la
7 Minorsky, N., "Directional Stability and Automatically Steered Bodies," J. Am. Soc. Nav. Eng., vol. 34, p. 280, 1922.
8 Házen, H.L., "Theory of Servo-mechanisms," J. Franklin Inst., 1934.
salida se reducen) puede pasar a ser retroalimentación positiva (las
perturbaciones son amplificadas).
En la mitad del siglo XIX fue cuando por primera vez se analizó la
estabilidad de los sistemas de control por realimentación. Ya que las
matemáticas constituyen el lenguaje formal de la teoría del control
automático, podríamos llamar al período anterior a esta época la teoría
prehistórica del control.
Ecuaciones diferenciales.
En 1840, el astrónomo del Observatorio Astronómico Británico en
Greenwich, G. B. Airy, desarrolló un dispositivo de realimentación para el
apuntamiento de un telescopio. Su dispositivo era un sistema regulador de
velocidad que giraba el telescopio de forma automática para compensar la
rotación de la tierra, permitiendo de esa forma el estudio de una estrella
dada durante un intervalo largo de tiempo.
Desafortunadamente, Airy descubrió que debido al diseño erróneo del
bucle de control automático, se introducían oscilaciones salvajes en el
sistema. De esa forma, fue el primero en discutir las inestabilidades de
sistemas de bucle cerrado, y el primero en usar ecuaciones diferenciales en su
análisis9. La teoría de las ecuaciones diferenciales estaba por entonces bien
desarrollada, debido al descubrimiento del cálculo infinitesimal por I. Newton
(1642-1727) y G. W. Leibnitz (1646-1716), y el trabajo de los hermanos
Bernoulli (últimos años del siglo XVII y primeros del XVIII), J. F. Riccati (16761754), y otros. El uso de las ecuaciones diferenciales en el análisis del
movimiento de sistemas dinámicos fue establecido por J. L. Lagrange (17361813) y W. R. Hamilton (1805-1865).
Teoría de la Estabilidad.
El trabajo inicial en el análisis matemático de los sistemas de control
fue en términos de ecuaciones diferenciales. James Clerck Maxwell10 fue el
primero en analizar la estabilidad del regulador centrífugo de Watt, en su
pionero trabajo de 1868. Su técnica consistió en linealizar las ecuaciones
diferenciales de movimiento para encontrar la ecuación característica del
sistema. Estudió el efecto de los parámetros del sistema en la estabilidad,
mostrando que el sistema es estable si las raíces de la ecuación característica
tienen partes reales negativas. De esta forma, el problema de la estabilidad
se redujo a la localización de las raíces de las ecuaciones diferenciales que
rigen el movimiento del regulador. La teoría mostró que las oscilaciones
aparecidas cuando el comportamiento del regulador se hace inestable podían
ser evitadas con una elección adecuada de los parámetros del regulador. Con
el trabajo de Maxwell podemos decir que la teoría de los sistemas de control
fue firmemente establecida.
9 Airy, G.B., "On the Regulator of the Clock-Work for Effecting Uniform Movement of Equatorials," Memoirs of the Royal
Astronomical Society, vol. ll, pp. 249-267, 1840.
10 Maxwell, J.C., "On Governors," Proc. Royal Soc. London, vol. 16, pp. 270-283, 1868.
E. J. Routh11 proporcionó una técnica numérica para determinar cuándo
la ecuación característica tenía raíces estables.
El ruso I. I. Vishnegradsky12 analizó la estabilidad de los reguladores
usando ecuaciones diferenciales de forma independiente a Maxwell. En 1893,
A. B. Stodola estudió la regulación de una turbina de agua usando las técnicas
de Vishnegradsky. Modeló la dinámica de los actuadores, incluyendo en su
análisis el problema de los retrasos de los mecanismos de actuación. Fue el
primero en introducir la noción de “constante de tiempo del sistema”.
Desconocedor de los trabajos de Maxwell y Routh, planteó el problema de la
determinación de la estabilidad de la ecuación característica a A. Hurwitz 13,
quien lo resolvió de forma independiente.
El trabajo de A. M. Lyapunov fue la base de toda la teoría de control
posterior. Estudió la estabilidad de ecuaciones diferenciales no lineales
usando una noción generalizada de la energía en 1892 14. Desafortunadamente,
aunque su trabajo fue aplicado y continuó en Rusia, los tiempos no estaban
maduros en el mundo occidental para su elegante teoría, y permaneció
desconocida allí hasta aproximadamente 1960, cuando su importancia fue
realmente reconocida.
El ingeniero británico O. Heaviside inventó el cálculo operacional en
1892-1898. Estudió el comportamiento transitorio de sistemas, introduciendo
una noción equivalente a la de función transferencia.
La culminación de esta fase de desarrollo de la teoría de control podría
situarse en la publicación en 1921 del libro de M. Tolle, donde exponía las
ecuaciones diferenciales que describen el movimiento de varios tipos distintos
de máquinas y sus reguladores.
Teoría de Sistemas.
Es en el estudio de sistemas dinámicos donde la teoría de control por
retroalimentación tiene su lugar en la organización del conocimiento humano.
Así, la introducción del concepto de sistema como una entidad dinámica con
entradas (“input”) y salidas (“output”) definidas que se ligan a otros sistemas
y al entorno fue un requisito previo para un desarrollo ulterior de la teoría del
control. La historia de la teoría de sistemas dinámicos requiere un estudio
completo en sí mismo, pero haremos aquí un breve resumen.
Durante los siglos XVIII y XIX, el trabajo de A. Smith 15 en Economía, los
descubrimientos de C. R. Darwin16 en Biología, y otros desarrollos en
Medicina, Política, Psicología, Sociología, etc. evidencian la importancia de la
teoría de control en campos tan distintos como los mencionados, que por otro
lado estaban teniendo un gran impacto en la conciencia humana. El estudio de
11 Routh, E.J., A Treatise on the Stability of a Given State of Motion, London: Macmillan & Co., 1877.
12 Vyshnegradsky, I.A., "On Controllers of Direct Action," Izv. SPB Tekhnolog. Inst., 1877.
13 Hurwitz, A., "On the Conditions Under Which an Equation Has Only Roots With Negative Real Parts," Mathematische Annalen,
vol. 46, pp. 273-284, 1895.
14 Lyapunov, M.A., "Problème général de la stabilité du mouvement," Ann. Fac. Sci. Toulouse, vol. 9, pp. 203-474, 1907.
(Translation of the original paper published in 1892 in Comm. Soc. Math. Kharkow and reprinted as Vol. 17 in Ann. Math Studies,
Princeton University Press, Princeton, N.J., 1949.)
15 The Wealth of Nations, 1776.
16 On the Origin of Species by Means of Natural Selection, 1859.
la Filosofía Natural superó el trabajo de los filósofos griegos y árabes, con
contribuciones de Nicolas de Cusa (1463), Leibniz y otros. Los desarrollos del
siglo XIX, unidos a la Revolución Industrial y un sentido expansivo de la
conciencia de geopolítica global y astronomía tuvieron una influencia
profunda en esta Filosofía Natural.
En los primeros años del siglo XX, A. N. Whitehead17, con su filosofía de
“mecanismos orgánicos”, L. Von Bertalanffy18, con sus principios jerárquicos
de organización, y otros, habían comenzado a hablar de una “teoría general
de sistemas”. En este contexto, la evolución de la teoría de control podía
proseguir.
Análisis en el Dominio de Frecuencias.
El análisis matemático de los sistemas de control había sido
desarrollado hasta aquí usando ecuaciones diferenciales en el dominio del
tiempo. En los Laboratorios Bell, durante los años 1920 y 1930, fueron
exploradas y usadas en sistemas de comunicación las aproximaciones en el
dominio de la frecuencia desarrolladas por P.-S. de Laplace (1749-1827), J.
Fourier (1768-1830), A. L. Cauchy (1789-1857), y otros.
El amplificador (triodo) diseñado por H. S. Black era, de hecho, la
expresión electrónica del principio de control usado previamente en sistemas
mecánicos. La cuestión que surgió a continuación era si este amplificador
sería estable en todo el rango de frecuencias representado en la comunicación
oral. La respuesta a esta cuestión requería un análisis matemático de la
estabilidad más complejo que el que había sido desarrollado hasta entonces
para sistemas mecánicos.
El diseño de Black consistía en en introducir un desfase en el sistema en
la frecuencia correcta. La Teoría de Regeneración para el diseño de
amplificadores estables fue desarrollada por el sueco Harry Nyquist 19,
derivando su criterio de estabilidad basado en la representación polar de una
función compleja. Nyquist establece los fundamentos científicos de la
cibernética, mediante el desarrollo de la teoría que sirve como base a los
procesos estables de oscilación con realimentación negativa. Nyquist toma la
idea para el tratamiento de procesos con realimentación negativa de esta
experiencia previa en las técnicas de amplificación mediante válvulas ya
descrita. El acoplamiento positivo hace que la oscilación se vea reforzada,
motivo por el cual se emplea con frecuencia en los osciladores. Por el
contrario, la realimentación negativa tiene un efecto amortiguador, siendo
adecuado para la estabilización de las oscilaciones.
Finalmente, H. W. Bode20 usó en 1938 las representaciones de
respuesta en magnitud y fase de una función compleja (imaginaria),
investigando la estabilidad de bucles cerrados utilizando las nociones de
ganancia y margen de fase.
17 Whitehead, A.N., Science and the Modern World, Lowell Lectures (1925),
New York: Macmillan, 1953.
18 Bertalanffy, L. von, "A quantitative theory of organic growth," Human Biology, vol. 10, pp. 181-213, 1938.
19 Nyquist, H., "Regeneration Theory," Bell Syst. Tech. J., 1932.
20 Bode, H.W., "Feedback Amplifier Design," Bell System Tech. J., vol. 19, p. 42, 1940.
Laboratorio de Radiación del M.I.T.
Para estudiar los problemas de procesado de información y control
asociados con el recién inventado radar, fue creado el Laboratorio de
Radiación en el Massachusetts Institute of Technology en 1940. La mayor
parte del trabajo en la teoría de control de los años 1940 provino de aquel
laboratorio.
Durante su trabajo en un proyecto del M.I.T. en 1941, A. C. Hall se dio
cuenta de los efectos perniciosos que tenía el ignorar el ruido en el diseño de
sistemas de control. Se dió cuenta de que la tecnología del dominio de
frecuencias desarrollado en los Laboratorios Bell podía ser usada para
confrontar los efectos del ruido, y utilizó esta aproximación para diseñar un
sistema de control para un radar aerotransportado. El éxito demostró de
forma definitiva la importancia de las técnicas del dominio de frecuencias en
el diseño de sistemas de control21.
Usando aproximaciones basadas en la función de transferencia, el
diagrama de bloques y métodos del dominio de frecuencias, hubo un gran
éxito en el diseño de controles en el Laboratorio de Radiación. En 1947, N. B.
Nichols desarrolló su Carta para el diseño de sistemas de realimentación. Con
el trabajo del M.I.T., la teoría de servomecanismos lineales fue establecida
firmemente. Un resumen del trabajo de este laboratorio puede encontrarse
en Theory of Servomechanisms22.
Trabajando en la Aviación Norteamericana, W. R. Evans23 presentó su
técnica de localización de raíces, que proporcionó una forma directa de
determinar la situación de los polos de bucle cerrado en el plano-s. Durante
los 1950, la mayor parte del trabajo sobre teoría de control se concentró en el
plano-s, obteniendo características de respuesta deseables.
La era del espacio y del ordenador y el Control Moderno.
Con el advenimiento de la era espacial, el diseño del control abandonó
las técnicas del dominio de frecuencias de la teoría clásica del control,
volviendo al uso de las técnicas de las ecuaciones diferenciales de finales del
siglo XIX en el dominio temporal. Estudiaremos brevemente las razones para
este cambio de paradigma.
El paradigma de la teoría clásica de control era muy adecuado para
problemas de diseño de control durante las Guerras Mundiales. La
aproximación en el dominio de frecuencias era apropiado para sistemas
lineales invariantes en el tiempo. Esta aproximación tiene sus resultados
óptimos cuando se aplica a sistemas de entrada única y salida única. Por otro
lado, el diseño clásico de controles tuvo algún éxito en sistemas no lineales.
Usando las propiedades de reducción de ruido de las técnicas del dominio de
frecuencias, puede diseñarse un sistema de control estable frente a las
variaciones en los parámetros del sistema, a los errores de medida y
perturbaciones externas. Así, las técnicas clásicas pueden usarse en una
21 Hall, A.C., "Application of Circuit Theory to the Design of Servomechanisms," J. Franklin Inst., 1966.
22 James, H.M., N.B. Nichols, and R.S. Phillips, Theory of Servomechanisms, New York: McGraw-Hill, M.I.T. Radiation Lab.
Series, Vol. 25, 1947.
23 Evans, W.R., "Graphical Analysis of Control Systems," Trans. AIEE, vol. 67, pp. 547-551,1948.
versión linealizada de un sistema no lineal, dando buenos resultados en un
punto de equilibrio cerca del cual el comportamiento del sistema es
aproximadamente lineal. Las técnicas del dominio de frecuencias pueden ser
aplicadas también a sistemas no lineales sencillos usando el criterio de
Nyquist. Desafortunadamente, no es posible diseñar sistemas de control para
sistemas multivariables altamente no lineales, como los que aparecen en
aplicaciones aeroespaciales. De esta forma, fue necesario una vuelta al
dominio temporal para el tratamiento de los sistemas no lineales aparecidos
especialmente en la era espacial. La escuela rusa, siguiendo los pasos de
Lyapunov, fue la avanzadilla en esta vuelta al dominio temporal.
Control Óptimo en Sistemas Naturales.
El más antiguo de los problemas de máximo y mínimo (los llamados
problemas extremales) se considera el problema isoperimétrico clásico: hallar
entre las curvas planas cerradas de una longitud dada, la curva que abarca la
mayor superficie. Los filósofos griegos trataron de resolver este problemaaún
en el siglo V adC. Sobre él escribía por ejemplo Aristóteles.
Ya en el Renacimiento, Johann Bernoulli fue el primero que mencionó
el Principio de Control Óptimo en conexión con el Problema de la
Braquistócrona en 1696: encontrar la curva que une los puntos A y B, A más
alto que B, tal que el tiempo empleado por un cuerpo masivo que cae bajo la
acción de la gravedad de A a B a lo largo de la curva sea mínimo. Este
problema fue resuelto por Leibniz, los hermanos Bernoulli, por Isaac Newton y
L’Hôpital, y llegó a estar claro que la búsqueda del control óptimo es una
propiedad fundamental del movimiento en los sistemas naturales. Se
demostró que la braquistócrona coincide con un arco de cicloide que va de A a
B. Esto representó el comienzo de un nuevo campo: el cálculo de variaciones,
cuyos principios sistemáticos fueron establecidos sobre todo por Euler y
Lagrange.
Varios principios de control óptimo extremales fueron investigados con
posterioridad, incluyendo el Principio de Tiempo Mínimo del francés Pierre De
Fermat al comienzo del siglo XVII en Óptica (para explicar la ley de la
refracción de la luz: el trayecto que sigue un rayo luminoso en un medio
heterogéneo es el más corto posible, y corresponde a un tiempo mínimo); los
trabajos de L. Euler en 1744; y el resultado de Hamilton de que un sistema se
mueve de tal forma que minimiza la integral temporal de la diferencia entre
la energía cinética y potencial (variable denominada Lagrangiano del
sistema).
Estos Principios Extremales son todos principios de mínimo. En los
primeros años 1900, A. Einstein mostró que, en el sistema de coordenadas
espacio-temporal cuadridimensional, el movimiento de sistemas ocurre de
forma tal que el tiempo resulta ser un máximo y no un mínimo.
Ya que los sistemas naturales exhiben control óptimo en su
comportamiento (en sentido de que hacen extremal una cierta función), tiene
sentido diseñar sistemas de control artificiales en una forma “optima” en este
sentido. Una ventaja es que este diseño puede llevarse a cabo en el dominio
temporal. En el contexto del diseño de control moderno, es usual minimizar el
tiempo de tránsito, o un funcional de energía generalizada cuadrática,
posiblemente con alguna ligadura en los controles permitidos. R. Bellman24
aplicó la programación dinámica al control óptimo de sistemas discretos en el
tiempo, probando que la dirección natural de resolver problemas de control
óptimo es hacia atrás en el tiempo, obteniendo esquemas de realimentación
de bucle cerrado, generalmente no lineales. En 1958, L. S. Pontryagin 25 había
desarrollado su principio de máximo, que resolvía problemas de control
óptimo basándose en el cálculo de variaciones desarrollado por L. Euler (17071783). Resolvió el problema de tiempo mínimo, derivando una ley de control
on/off como el control óptimo (bang-bang).
2.3. PROBLEMAS CLÁSICOS DE CONTROL.
2.3.1 El péndulo centrífugo y la máquina de vapor.
En la figura de al margen se esquematizan los elementos básicos del
mecanismo de la máquina de vapor sin regulador. El combustible se quema en
un horno que calienta el agua encerrada en un depósito. La presión de vapor
producida depende de la resistencia de las calderas disponibles, y de la
efectividad de la transferencia de calor del horno al agua. Esta presión de
vapor tenía unos valores típicos de unos 3.5 105 Pa en los días de los primeros
prototipos de la máquina de vapor. En 1862, el desarrollo de la producción del
acero permitió calderas más resistentes, por lo que las presiones pudieron
llegar a los 1.8 106 Pa. En 1920, ya se alcanzaban presiones de 107 Pa.
La presión de vapor p’ producida en la caldera pasa a través de una
válvula que reduce la presión en una proporción determinada por la válvula.
Cuando el regulador se introduce en el sistema, el nivel de actuación del
24 Bellman, R., Dynamic Programming, New Jersey: Princeton Univ. Press, 1957.
25 Pontryagin, L.S., V.G. Boltyansky, R.V. Gamkrelidze, and E.F. Mishchenko, The Mathematical Theory of Optimal Processes,
New York: Wiley, 1962.
péndulo centrífugo controla la configuración angular de la válvula de tal
forma que reduce la presión de salida de la válvula cuandola velocidad de giro
se incrementa y viceversa.
La presión de salida p de la válvula se expande empujando al pistón de
la máquina. El cuerpo de la máquina es, de hecho, un ingenioso dispositivo
donde se transforma el empuje unidimensional contra el pistón en un
movimiento oscilatorio. La transformación está producida con ayuda de una
válvula deslizante representada en la figura. Cuando el pistón se encuentra en
la posición (a), la presión de vapor empuja al pistón hacia la derecha. El gas a
la derecha del pistón, que se encuentra a baja presión, es empujado y
conducido a un condensador, y de nuevo al depósito de agua de la caldera por
una conducción no representada en la figura. Cuando del pistón se mueve
hacia la derecha, la válvula deslizante, activada por una rueda excéntrica
ligada a la rueda principal activada por el pistón, lleva a la posición (b) de la
figura. Entonces, comienza el movimiento del pistón en sentido contrario,
cerrándose así un ciclo completo.
En esencia, el pistón se desplaza de forma oscilatoria debido a la
presión del gas, imprimiento un momento de fuerzas sobre el eje de la rueda
principal, y convirtiendo de esta forma un movimiento oscilatorio
unidimiensional en un movimiento circular. El valor promedio del momento
que imprime el pistón sobre la rueda depende en general del valor de la
presión de vapor p y de la velocidad angular  del movimiento oscilatorio del
pistón (o de la rueda o eje principal). Por tanto, podemos expresar el
momento promedio de impulsión Mi de forma:
M i  M i ( p,  )
La dependencia funcional precisa dependerá de los detalles técnicos de
la construcción de la máquina de vapor. Sin embargo, en general, se puede
esperar que el momento promedio aumente cuando aumenta la presión, y
disminuya a velocidades angulares de giro muy altas.
Este momento de fuerzas de impulsión tenderá a aumentar la velocidad
de giro de la máquina de vapor, a lo que se opone el momento de fuerzas
debido a la “carga” Mc, cuyo promedio temporal dependerá de la velocidad
angular del eje principal. Por ejemplo, si el eje de la máquina de vapor se
acopla a las paletas de propulsión de un barco, la resistencia del agua a la
rotación de las paletas ofrecerá un momento de “carga” que se opondrá al
aumento de la velocidad angular de giro. El momento de carga aumentará
muy rápidamente con la velocidad angular (esto es, cuando aumenta la
velocidad angular, aumenta el momento de fuerzas que se opone al
movimiento de giro):
M c  M c ( )
El eje principal de la máquina de vapor está normalmente equipado con
un regulador centrífugo con un valor muy grande para el momento de inercia.
El propósito del regulador centrífugo es esencialmente proporcionar al eje de
giro una cantidad muy grande de inercia rotacional, de tal forma que los
pequeños cambios en los momentos de impulsión o de carga afecten a la
velocidad angular del eje en una muy pequeña cantidad. Podemos considerar
el péndulo centrífugo como un reservorio en el que se almacena energía
cinética de rotación. Si hubiera un pequeño cambio en el momento de carga,
que requiere más energía de la máquina de vapor, ésta podría ser
proporcionada a partir de la acumulada en el regulador centrífugo sin
necesidad de variar la velocidad angular de giro, ya que el regulador
centrífugo tiene un gran momento de inercia.
2.3.1.1 Ecuaciones del péndulo centrífugo.
El
péndulo
centrífugo,
mostrado en la figura, consiste en
una varilla vertical que gira a la
velocidad angular  proporcional a la
velocidad de la máquina. Al final de
la varilla, están montados dos brazos
de longitud L que soportan en sus
extremos dos masas M, las “bolas
voladoras”, obligadas a girar con la
varilla. Los brazos tienen la
posibilidad de pivotar alrededor del
eje en que están ligadas a la varilla
vertical J en un plano vertical. Una
extensión de los brazos porporciona
un medio de desplazar un controlador cuya posición regula la presión y el
flujo de vapor en la máquina. De esta forma, el péndulo cónico puede
considerarse como un dispositivo que transforma velocidad angular en una
lectura sobre una dirección vertical. El regulador centrífugo será el péndulo
centrífugo al que se le une una varilla que actúa de control sobre la entrada
de la máquina controlada, de tal forma que un aumento en la velocidad
angular del dispositivo actúa finalmente reduciendo la entrada y viceversa.
Nuestro objetivo será determinar la posición de equilibrio 0 de las
masas a una velocidad angular  dada de la varilla vertical. Posteriormente,
veremos que las masas pueden oscilar alrededor de la posición de equilibrio, y
encontraremos el período de esta oscilación. Comenzaremos dibujando un
diagrama de fuerzas para una de las masas M y la trayectoria de esta masa.
Las fuerzas sobre la masa M son su propio peso P, y la tensión T del brazo que
la soporta.
En el estado estacionario, la masa describe una trayectoria circular en
un plano horizontal; el radio de esta circunferencia es:
R Lsen 0
donde 0 es la posición de equilibrio de la varilla. La velocidad de M será por
tanto:
v  R  Lsen 0
Por estar tratando un equilibrio en un sistema no inercial de referencia,
tenemos que introducir una fuerza de inercia, que en este caso será la
llamada fuerza centrífuga, dirigida hacia el centro de la circunferencia en que
se producel el movimiento, y cuyo valor será:
Mv 2
Fcf  Macf 
 M 2 R  M 2 Lsen 0
R
Esta fuerza debe estar en un plano horizontal, dirigida hacia la varilla vertical
central del péndulo.
Por tanto, el equilibrio de fuerzas en este sistema no inercial de
referencia, debe escribirse de la forma siguiente:
T cos 0  Mg  0
Tsen 0  M 2 Lsen 0  0
Resolviendo el sistema de ecuaciones, se puede encontrar el resultado
de las dos incógnitas del mismo, la tensión T en los brazos del péndulo
centrífugo, y el ángulo de equilibrio 0.
De la primera ecuación puede obtenerse que
Mg
T
cos 0
(imponiendo que el coseno no se anula, es decir, que el ángulo 0 no puede
ser igual a noventa grados).
El sistema de ecuaciones tiene dos soluciones:
 Una primera solución, válida cuando el ángulo 0 es distinto de cero:
T  M 2 L  0
Sustituyendo T por su valor:
Mg
 M 2 L  0
cos 0
g
 2 L
cos 0
g
cos 0  2
 L
 Y una segunda solución:
sen 0  0
que implica que el ángulo 0 es igual a cero. En este caso, el
valor para la tensión es:
T  Mg
La primera situación se produce cuando  2 L  g , mientras que la
segunda se produce necesariamente cuando  2 L  g . Por tanto, existe un
valor umbral para la velocidad angular  de la varilla horizontal, por debajo
del cual el ángulo de equilibrio 0 es cero. Para valores de  por encima de
este valor umbral, el ángulo de equilibrio es finito y se incrementa al
aumentar . Es curioso observar que precisamente el valor umbral para  se
produce a un valor que es igual que el valor de la frecuencia angular de
oscilación de un péndulo de longitud L:
g
umbral 
L
Supongamos que nos encontramos en una situación en la que
  g L , por lo que el ángulo 0 tiene un valor finito, dado por la ecuación
anterior. Supongamos que la masa, en un momento dado, es empujada a una
situación    0 , y se deja libre. Entonces, las fuerzas que actúan sobre la
masa M tenderán a conducir de nuevo la masa M a su posición de equilibrio 0,
sea  mayor o menor que 0. Esto indica que la masa M oscilará alrededor de
su posición de equilibrio 0, volviendo de nuevo a su posición de equilibrio
cuando se amortigüe dicha oscilación.
De forma opuesta, si la velocidad angular  se incrementa
repentinamente hasta un valor '     , se definirá una nueva posición de
equilibrio  0 '   0   0 , según la ecuación que obtuvimos con anterioridad. La
masa M se encuentra por tanto en una posición fuera de “su” equilibrio, en
una cantidad  0 , y se desplazará a su nueva posición de equilibrio 0’ por
medio de oscilaciones amortiguadas.
Es deseable tener una idea del valor del período T de esta oscilación.
Para calcular dicho período, tomaremos la siguiente aproximación:
Sea  constante, y apliquemos a la masa M una pequeña fuerza “extra”


F , perpendicular a T , lo que llevará la masa M a una nueva posición de
equilibrio    0   (ver Figura adjunta). Estableceremos una relación entre
F y el desplazamiento  en la posición de equilibrio de la masa. Esta
relación será lineal para pequeños F; la escribiremos de forma:
F  kL 
donde k es la constante de proporcionalidad que mide la proporción entre la
fuerza F y el desplazamiento lineal L. Se trata formalmente de la misma
ecuación que en un resorte armónico, por lo que la frecuencia y el período
tendrán los valores siguientes:
M
T  2
k

k
M
Escribamos las ecuaciones del equilibrio de fuerzas a la vista del
diagrama de fuerzas de la figura:
Mg  Fsen  T cos  0
F cos  Tsen  M 2 Lsen
sistema de dos ecuaciones con dos incógnitas, F y T. Multiplicando la
primera por cos, y la segunda por sen, y sumando, obtenemos:
Mgsen  F  M2 Lsen cos
Pero conociendo el valor de Mg obtenido anteriormente,
Mg  M2 L cos 0
se puede sustituir, obteniendo:
F  M2 Lsen (cos  cos 0 )
Pero los ángulos  y 0 difieren en una cantidad pequeña 
(  0     ), por lo que:
cos 0  cos(   )  cos cos  sensen  cos  sen
(ya que sen    , y cos   1 ). Finalmente, obtenemos:
F  M 2 Lsen2
con lo que obtenemos el valor buscado para la constante “elástica” k:
k  M 2 sen2
Cuando la oscilación de las “bolas” del péndulo centrífugo tiene una amplitud
pequeña, k es prácticamente constante, y en el cálculo del período y la
frecuencia, podemos sustituir  por su valor medio 0. Entonces, la frecuencia
angular  de la oscilación de las bolas del péndulo centrífugo alrededor de su
posición de equilibrio 0 está dada por:
g sen  0
  sen  0 
L cos  0
y su período T por:
2 1
T
 sen 0
2.3.1.2 Modelo matemático para la máquina de vapor sin
control automático.
En la figura adjunta se muestra un diagrama de bloques de los
diferentes elementos presentes en una máquina de vapor. La entrada a la
máquina de vapor es la presión p que empuja al pistón. La salida de la
máquina de vapor es la velocidad angular  del eje.
Carga
p’
Caldera
Mi(p,)
p
Válvula
Pistón
Mc()
Eje de giro
Vamos a hacer un análisis cuantitativo de la máquina de vapor sin
regulador. Examinaremos cómo se acelera la máquina de vapor, qué

determina la velocidad del estado estacionario, y cómo la velocidad de salida
cambia al producirse cambios en el momento de impulsión (presión de
entrada) o en el momento de carga.
La ecuación que describe la velocidad angular  está dada por:
d
I
 ( M i ( p,  )  M c ( ))
dt
Cuando el dispositivo
comienza su movimiento (  =
0), el momento de impulsión
tiene un valor determinado
exclusivamente por la presión
del vapor Mi( = 0) = Mi(p, 0),
mientras que el momento de
carga tiene un valor que
llamaremos
Mc(0).
La
aceleración angular al comienzo
será por tanto constante, por lo
que el cambio en la velocidad
angular será lineal en el tiempo. Si los momentos de impulsión y carga fuesen
indenpendientes de la velocidad angular, entonces, este aumento de
velocidad angular no se detendría nunca, y la máquina de vapor no alcanzaría
ningún estado estacionario. Sin embargo, el momento de impulsión en general
disminuye cuando aumenta la velocidad angular, y el momento de carga, por
el contrario, aumenta con la velocidad angular, por lo que se alcanza un
momento en que ambas cantidades se igualan, y a partir de este momento,
ocurre que:
d
M i ( p 0 ,  0 )  M c ( 0 ) 
0
dt
y la velocidad angular tenderá a acercarse al valor de  en que esta igualdad
se produce.
Veamos ahora qué le
pasa a la velocidad angular si
se produce un cambio en la
presión de vapor. Si la presión
que proviene de la caldera
disminuye
ligeramente,
la
velocidad de giro también
disminuirá. Para evitar esto es
precisamente para lo que se
introducen
los reguladores
centrífugos de control de
velocidades angulares.
En la figura vemos cómo determinar gráficamente el cambio en la
velocidad angular estacionaria 0 cuando se incrementa la presión de vapor
en una cantidad pequeña p0. Podemos expresar analíticamente este cambio
cuando estos cambios son cantidades pequeñas. Esto puede hacerse
escribiendo el desarrollo de Taylor para Mi(p0+p), y quedándonos sólo en el
término lineal en p de la expansión:
 dM i 
 p  ...
M i ( p 0  p )  M i ( p 0 )  
 dp  p0
Haciendo lo propio para los valores del momento de carga Mc(0+):
 dM c 
M c ( 0   )  M c ( 0 )  
   ...
 d 0
Cuando la presión de vapor cambia de p0 a p0+p0, alcanzaremos un
estado final de equilibrio en el que nuevamente el momento total es cero:
M i ( p0  p0 )  M c (0  0 )
lo que implica que
 dM i 
 dM c 

 p 0  
  0
 d   0
 dp  p0
es decir:
  dM i  
 
 
dp

 p0 

 0  
p0
 dM c  

 
  d  0 
de donde se deduce que el cambio en la frecuencia de la máquina de vapor
cuando cambia la presión de vapor, en este modelo, es directamente
proporcional a la velocidad de cambio del momento de impulsión respecto a
la presión de vapor, e inversamente proporcional a la velocidad de cambio del
momento de carga respecto a la frecuencia angular de giro. Ambas cantidades
se supone que son conocidas, pues dependen de las características de la
máquina de vapor y de la “carga”.
Vamos a continuación a estudiar la respuesta temporal de la máquina
de vapor no controlada a los cambios en la presión de vapor estudiados
anteriormente. Estudiaremos cómo cambia la velocidad angular  para
aproximarse a su nueva velocidad angular estacionaria 0+.
Para ello, utilizaremos la ecuación para la evolución temporal de la
velocidad angular de giro, ya escrita con anterioridad:
d
I
 ( M i ( p,  )  M c ( ))
dt
donde I es el momento de inercia del volante giratorio de salida. Inicialmente,
d
M i ( p 0 )  M c ( 0 )  I
 0    0
dt
Suponemos que el el instante de tiempo t=0, la presión de vapor de
entrada aumenta de repente a un valor p0+p0. Sabemos de nuestro análisis
anterior que la velocidad angular cambiará de 0 a 0+ cuando el sistema
se asienta en el nuevo estado estacionario. Para ver la forma precisa en que 
se aproxima a 0+, hacemos uso de una expansión en serie de Taylor con la
condición de que M i ( p0 )  M c ( 0 ) . Ello da una ecuación para la evolución de
 de forma:
d  dM i 
 dM c 
 p 0  
I
 
 (   0 )
dt  dp  p0
 d   0
con las condiciones de contorno
 t = 0,  = 0

  dM i 

 
dp

 p0
t  ,    f   0   0   0  
 dM c 


  d 0
Reordenando
escribirse:
I
términos,
d
dt
La cantidad dentro de
operación final  f  0
la
ecuación



 p0


diferencial
anterior
puede
  dM i 



 


  dp  p0
 dM c 

 
p 0   0    

d   0

  dM c 


   d  


0


los paréntesis cuadrados es la frecuencia angular de
 0 , por lo que obtenemos:
d
1  dM c 
 ( f   ) 

dt
I  d 0
d
dt

 f   I (dM c d )0
Llamando tiempo característico a la cantidad:
I
t0 
(dM c d )0
obtenemos finalmente la ecuación diferencial, escrita de forma simplificada:
d
dt

 f   t0
Integrando, obtenemos:
 (t )
t
d
dt
  f    0 t 0
0
  f   (t ) 
 t
ln
   
t0
0 
 f
  f   (t ) 

  e t / t 0
   
0 
 f
 f  (t )  ( f  0 )e t / t0
(t )   f  ( f  0 )e t / t
0
(t )  0  ( f  0 )(1  e t / t )
0
Esto es, la máquina de vapor se aproxima a su nuevo valor estacionario
para la velocidad angular de forma exponencial, con una constante temporal
t0 que es el tiempo característico definido antes, y que es el tiempo de
respuesta de la máquina de vapor a un cambio en las condiciones de
funcionamiento. Este tiempo es proporcional al momento de inercia del
volante al que se aplican los momentos de impulsión y de carga, e
inversamente proporcional al término lineal en la expansión del momento de
carga respecto a la frecuencia angular alrededor del valor de la frecuencia
angular estacionaria del estado inicial. Es claro por qué interesan volantes con
valores altos para el momento de inercia. En este caso, fluctuaciones rápidas
en los valores de la presión de vapor o momento de carga respecto al valor
del tiempo propio no afectarán al funcionamiento de la máquina, que tendrá
un comportamiento estable frente a estas oscilaciones muy rápidas.
2.3.1.3 Modelo matemático
para la máquina de vapor con
péndulo
centrífugo
como
regulador automático.
Hemos estudiado cómo
los cambios en la presión de
vapor produce cambios en la
velocidad angular de operación
de la máquina de vapor. Tales
cambios son, en general,
indeseables en la práctica.
También hemos dicho que el
uso de un regulador centrífugo con un gran momento de inercia era útil para
suprimir los efectos en los cambios de presión cuando estos cambios ocurren
rápidamente comparado con el tiempo de respuesta de la máquina. Sin
embargo, para cambios de presión que se mantienen durante períodos largos
de tiempo, estos cambios en la velocidad angular de la máquina se producen.
En esta sección, examinaremos cómo es posible reducir las desviaciones en la
velocidad angular del dispositivo mediante un mecanismo de regulación que
modifica la presión de entrada en función de la velocidad angular de giro de
la máquina de vapor.
En la figura lateral, se muestra esquemáticamente cómo el péndulo
centrífugo acopla mecánicamente la velocidad de giro de salida de la máquina
de vapor a la presión aplicada al pistón a través de la válvula a la salida de la
caldera. La velocidad ’ del péndulo cónico o centrífugo es directamente
proporcional a la velocidad de salida  del eje de giro principal de la máquina
de vapor. La constante de proporcionalidad, que está fijada por la geometría
de acoplo, debería tener un valor tal que cuando el eje de giro principal de la
máquina de vapor girase a su velocidad normal o típica 0, la velocidad de
giro ’ del péndulo centrífugo fuese ligeramente mayor que el valor umbral
  g L (Como ya vimos anteriormente, cuando  '  g L , las bolas giran
casi horizontalmente, y la altura no cambia mucho al cambiar la velocidad
angular ’. Por otro lado, cuando  '  g L , las bolas no vuelan).
Cuando las bolas se mueven hacia arriba debido a un incremento de la
velocidad angular de la máquina de vapor, el controlador del péndulo
centrífugo cierra la válvula sobre la que actúa de forma tal que la presión de
vapor que empuja el pistón disminuye. Se trata de un feedback entre la salida
() y la entrada (p). Esta feedback es negativo en el sentido de que un
incremento en la velocidad angular se traduce en una disminución en la
presión de vapor.
En la figura siguiente se muestra un diagrama de bloques de los varios
componentes de la máquina de vapor controlada. Notamos, en comparación
con el diagrama de bloques de la máquina de vapor no controlada, que se
trata de un sistema de bucle cerrado (en contraposición de la máquina de
vapor no controlada, que está representada por un diagrama de bloques de
bucle abierto). El hecho de que la salida esté conectada a la entrada resulta
en un diagrama de bocles de bucle cerrado. Con ayuda de este diagrama,
podremos escribir las ecuaciones de evolución de la máquina de vapor
regulada.
Carga
p=p’-p
p’
Caldera
Válvula
Mi(p,)
Mc()
Eje de giro
Pistón

-p=ch
h
Péndulo
centrífugo
’
Acoplo
geométrico
Como en el caso del péndulo no regulado, el cambio en el momento
angular del péndulo cónico viene dado por la diferencia entre el momento de
fuerzas de impulsión y el momento de fuerzas de “carga”:
d
I
 ( M i ( p,  )  M c ( ))
dt
En el caso del feedback, el punto crucial es que la presión de vapor p
en los pistones es ahora una función de la velocidad angular de salida , y por
tanto, p = p(), y:
M i ( p)  M i ( p( ))
Es importante darse cuenta de que al escribir que p = p(), estamos
aceptando implícitamente que un cambio en la frecuencia de salida se sigue
de forma inmediata por un cambio en la presión de entrada. Es decir, que la
realimentación se realiza de forma inmediata, sin ningún tiempo de retraso o
retardo. Obviamente, esto no puede físicamente ser así, porque al regulador
centrífugo le cuesta un tiempo finito (no nulo) cambiar la posición de las
masas voladoras, y por tanto, hay un retraso en la aplicación de la regulación
a la válvula que hace disminuir la presión de vapor de entrada. Este retraso en
la respuesta del regulador puede conducir a inestabilidades en el control de la
máquina. Nosotros, sin embargo, supondremos que la respuesta del sistema
controlado a los cambios en la carga de salida o presión de entrada es tan
lenta que en comparación con este tiempo, el regulador centrífugo tiene una
respuesta esencialmente instantánea.
Estudiaremos a continuación los cambios en los momentos de impulsión
y de carga en respuesta a cambios pequeños cerca del punto de operación
estacionaria. Para ello, expanderemos en serie de Taylor alrededor de los

puntos de equilibrio p0 y 0. Quedándonos con los términos lineales en p y
:
 dM i 
 ( p  p 0 )  ...
M i ( p 0  p )  M i ( p 0 )  
 dp  p0
 dM c 
M c ( 0   )  M c ( 0 )  
 (   0 )  ...
 d 0
En el caso presente, sin embargo, debemos tener en cuenta que
cualquier cambio en la presión de vapor p puede producirse por variaciones en
la presión en la caldera (llamaremos p0 a este cambio), o debido a cambios
en la frecuencia de salida 0 (la realimentación). Expresaremos este hecho
de la siguiente forma:
( p  p0 )  p0  k (   0 )
Esta ecuación representa la diferencia crucial entre el caso del sistema sin
control y regulado. Vemos que los cambios en la presión de vapor de entrada
son proporcionales a los cambios en la velocidad angular de salida que
proporciona la máquina de vapor. El cambio en la variable de entrada es
directamente proporcional al cambio en la variable de salida. Este tipo de
sistema de control se denomina por ello “sistema de control proporcional”.
Existen otros dispositivos con control proporcional a la derivada temporal de
la variable de salida (sistemas de control derivativo), o a la integral en el
tiempo de la variable de salida (sistemas de control integral). También
existen sistemas en los que la entrada y la salida pueden no estar relacionados
de forma lineal. Tales sistemas se denominan sistemas de control no lineal. La
matemática subyacente a tales sistemas es muy compleja.
En la ecuación última, la cantidad k, que tiene dimensiones de presión
por tiempo (ML-1T-1), es la constante de proporcionalidad que relaciona el
cambio en velocidad angular y en la presión de entrada al pistón. El signo
negativo representa el hecho de que el sistema es un dispositivo de feedback
negativo. Sustituyendo en las ecuaciones para la evolución del sistema,
tenemos:

 dM i 
d  dM i 
 dM c 
 p0  k 
 (   0 )  
I
 
 (   0 )
dt  dp  p0
 d 0

 dp  p0

Donde hemos usado que Mi(p0)= Mc(0). Los dos primeros términos de la
derecha representan el cambio en el momento de impulsión asociados al
cambio en la presión de vapor (p0) y en la frecuencia de salida (a través de
la realimentación). El último término es el cambio en el momento de carga
asociado al cambio en la velocidad angular de salida.
Reordenando términos, tenemos al final la ecuación diferencial:
 dM 
 dM i  
d  dM i 
c
 p0  
 (   0 )
I
 
  k 
dt  dp  p0
 d 0
 dp  p0 
formalmente equivalente a la encontrada en el caso no controlado. Sin
embargo, ahora, el coeficiente del término (-0) incluye un término de
realimentación negativa.
Habitualmente, se degine el factor de ganancia G como una medida de
la efectividad del regulador centrífugo en cambiar la frecuencia de la
máquina de vapor:
( dM i dp ) p0
Gk
( dM c d )  0
Siguiendo los mismos pasos que para el caso no regulado, obtenemos como
solución:
(t )  0  ( f1  0 )(1  e t / t1 )
alcanzando una velocidad angular estacionaria modificada, con un valor:
  dM i  
 
 
dp

 p0  p0
 0
 f1   0  1   0  



0
1 G
 dM c   1  G

 
  d 0 
y con un tiempo de respuesta modificado que tiene un valor:
I (dM c d )0
t
t1  0 
1 G
1 G
Por ello, tanto el valor para la frecuencia angular del nuevo estado
estacionario, como la forma en que se aproxima al nuevo estado estacionario
son diferentes a los encontrados en el caso no controlado. En la
representación gráfica adjunta se muestra el comportamiento típico de una
misma máquina de vapor no regulada, y regulada, en la que se ve que para el
caso de disponer de regulador centrífugo, el nuevo valor de equilibrio está
más cerca del valor estacionario anterior, y que se alcanza el estado
estacionario en un tiempo menor. El factor en que disminuyen tanto el
desplazamiento en frecuencia angular como el tiempo de respuesta es
precisamente el factor 1 1  G .
Descargar