ESCUELA DE INGENIERÍA ELÉCTRICA UNIVERSIDAD DE COSTA RICA Modelado y análisis de sistemas lineales José David Rojas Fernández Mauricio Espinoza Bolaños Universidad de Costa Rica Prefacio Este folleto corresponde a la parte teórica del curso IE0409: Análisis de Sistemas, de la carrera de Ingeniería Eléctrica, Universidad de Costa Rica. Este curso introduce al estudiante en el modelado y análisis matemático de sistemas físicos mediante el uso de diversas herramientas teóricas y experimentales. Así mismo, se hace uso de software especializado para la simulación de estos modelos de manera que sea un complemento para el análisis de la respuesta de los sistemas tanto en el dominio del tiempo como en el de la frecuencia. La obtención y análisis de modelos que representen la realidad y permitan derivar conclusiones y predicciones, es un pilar fundamental tanto en el área de las ciencias como en el de la ingeniería. Es conocido que en la actualidad, los físicos están tratando de derivar una teoría que unifique todas las leyes de las fuerzas que rigen la naturaleza, de manera que, bajo una sola teoría, sean capaces de explicar los fenómenos electromagnéticos, nucleares y gravitacionales, tanto a nivel cuántico como a nivel relativista. Esta “teoría del todo” es, fundamentalmente, un modelo que explique la interacción entre la masa y la energía del universo. Específicamente a nivel de ingeniería, los modelos juegan un rol preponderante en el diseño de sistemas. En cualquier proyecto, el paso anterior a la implementación y puesta en marcha de un sistema, es realizar una simulación con la que se pueda analizar y extraer conclusiones, descubrir posibles fallas y proponer áreas de mejora. Por supuesto, esta simulación tiene que estar basada en un modelo que sea reflejo de la realidad que se estudia. Este curso es el primero en el área de control automático que se imparte en la carrera de Ingeniería Eléctrica. Sin embargo, su contenido es útil para muchas más áreas además de la teoría de control pura. Basta darse cuenta de que, en cada curso de la carrera, lo que se hace es estudiar modelos (matemáticos) que ayudan a entender los sistemas eléctricos y electrónicos. Una vez que se comprende el funcionamiento de estos elementos, se procede a su manipulación de manera que puedan ser utilizados para beneficio de las personas. Es decir, lo que se hace en cada curso de ingeniería es aprender a analizar sistemas específicos para luego controlarlos. En este curso, no se trabaja con un sistema en específico, sino que se trata de estudiar el modelado y análisis de una manera general. 1 2 Revisiones Última revisión: 23 de febrero de 2017 Versión 0.1, I-2012: Primera versión del folleto. Capítulos del 1 al 3 solamente. Versión 0.2, II-2012: Se agregan los capítulos del 4 al 8 más los apéndices. Correcciones de ortografía y redacción. Versión 0.3, I-2013: Se agregaron los temas de estabilidad de Routh-Hurwitz y de amplificadores operacionales. Se incluyó un cuadro con el cálculo de las inercias rotacionales de figuras generales. Se arreglaron las figuras de los diagramas de flujo para que se vean correctamente cuando se imprime en blanco y negro. Se agregaron ejercicios resueltos al final de los capítulos. Se eliminaron los exámenes viejos de los apéndices para ser publicados como un folleto aparte. Versión 0.3.1, II-2013: Correcciones a la ortografía y la redacción. Correcciones en ecuaciones con errores en los ejemplos. Cambio en los márgenes para mejorar la lectura. Se agregó el tema de la forma canónica de Jordan en el tema de análisis en el espacio de estado y se cambió la demostración de la relación entre la respuesta impulsiva y la respuesta a estado cero en la sección 2.3.3. Versión 0.4, I-2014: Correcciones a la ortografía y la redacción. Se agregó el tema de métodos numéricos en los apéndices, se incorporó la demostración de la ecuación de Bernoulli. Versión 0.4.1, II-2014: Correcciones a la ortografía y la redacción. Versión 0.4.2, I-2015: Correcciones a la ortografía y la redacción. Se cambió el orden de los capítulos para que haya más coherencia entre los temas. Se agregó el método de identificación de Stark. Se cambió el capítulo de motores DC a uno de sistemas electromecánicos: se agregó información general sobre estos sistemas. Versión 0.4.3, II-2015: Correcciones a la ortografía y la redacción. Se agregó el estudio de los ceros cuadráticos en la parte de respuesta en frecuencia. Versión 0.4.4, I-2016: Correcciones a la ortografía y la redacción. Versión 0.5, I-2017: Se eliminó el tema de análisis en el espacio de estado. Este tema se verá en un curso de control más avanzado en la carrera. La persona interesada puede estudiar el tema en los apéndices. Escuela de Ingeniería Eléctrica Universidad de Costa Rica Índice general I. Fundamentos 8 1. Introducción al modelado y análisis de sistemas 1.1. Introducción a la teoría general de sistemas . . . . . . . . . 1.1.1. Antes de llevar el curso . . . . . . . . . . . . . . . . 1.1.2. Historia del análisis de sistemas . . . . . . . . . . . 1.1.3. Importancia del análisis de sistemas en la ingeniería 1.2. Concepto de sistema . . . . . . . . . . . . . . . . . . . . . 1.2.1. Definición de sistema . . . . . . . . . . . . . . . . . 1.2.2. Tipos de sistemas . . . . . . . . . . . . . . . . . . . 1.2.3. Variables de un sistema . . . . . . . . . . . . . . . 1.3. Concepto de modelo de un sistema . . . . . . . . . . . . . 1.3.1. Definición de modelo . . . . . . . . . . . . . . . . . 1.3.2. Tipos de modelos . . . . . . . . . . . . . . . . . . . 1.3.3. Obtención de los modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . eléctrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2. Introducción al espacio de estados 2.1. El concepto de estado . . . . . . . . . . . . . . . . . . . . . 2.1.1. Definición . . . . . . . . . . . . . . . . . . . . . . . 2.1.2. Propiedades de las variables de estado . . . . . . . 2.1.3. Definiciones importantes . . . . . . . . . . . . . . . 2.1.4. Linealidad e invarianza en el tiempo . . . . . . . . 2.2. Sistemas eléctricos como prototipos de sistemas lineales . . 2.3. Modelado en variables de estado . . . . . . . . . . . . . . . 2.3.1. Ecuación de estados y salidas . . . . . . . . . . . . 2.3.2. Elección de las variables de estado . . . . . . . . . . 2.3.3. Respuesta a entrada cero y respuesta a estado cero 2.4. La función de transferencia . . . . . . . . . . . . . . . . . . 2.4.1. Definición de función de transferencia . . . . . . . . 2.4.2. La función de transferencia a partir de la respuesta a 2.4.3. La ecuación característica del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . estado . . . . 3 . . . . . . . . . . . . 9 9 9 10 10 13 14 14 14 19 19 21 24 . . . . . . . . . . . . . . . . . . . . . . . . cero . . 27 27 27 30 31 31 33 42 42 44 51 59 59 60 61 4 2.4.4. Función de transferencia para sistemas multivariables . . 2.4.5. Circuitos eléctricos utilizando funciones de transferencia 2.5. Relaciones entre los modelos matemáticos . . . . . . . . . . . . 2.5.1. Partiendo de la RES . . . . . . . . . . . . . . . . . . . . 2.5.2. Partiendo del MVE . . . . . . . . . . . . . . . . . . . . . 2.5.3. A partir de la función de transferencia . . . . . . . . . . 2.6. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 63 65 65 65 67 69 3. Representación gráfica de modelos 90 3.1. Diagramas de bloques . . . . . . . . . . . . . . . . . . . . . . . . . . 90 3.1.1. Creación del diagrama de bloques . . . . . . . . . . . . . . . . 92 3.1.2. Simplificación de diagramas de bloques . . . . . . . . . . . . . 96 3.1.3. El modelo en variables de estado a partir del diagrama de bloques 98 3.2. Diagramas de flujo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 3.2.1. Propiedades de los diagramas de flujo . . . . . . . . . . . . . . 105 3.2.2. Fórmula de Mason . . . . . . . . . . . . . . . . . . . . . . . . 105 3.3. Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 4. Caracterización en el dominio del tiempo 4.1. Análisis de estabilidad . . . . . . . . . . . . . . . . . 4.1.1. Relación entre los polos y el MVE . . . . . . . 4.1.2. Estabilidad BIBO . . . . . . . . . . . . . . . . 4.1.3. Estabilidad asintótica . . . . . . . . . . . . . . 4.1.4. Criterio de estabilidad de Routh-Hurwitz . . . 4.2. Representación del retardo en sistemas lineales . . . . 4.3. Sistemas de primer orden . . . . . . . . . . . . . . . . 4.4. Sistemas de segundo orden . . . . . . . . . . . . . . . 4.4.1. Especificación de la respuesta subamortiguada 4.5. Efecto de los ceros en el sistema . . . . . . . . . . . . 4.5.1. Ceros de fase mínima . . . . . . . . . . . . . . 4.5.2. Ceros de fase no mínima . . . . . . . . . . . . 4.6. Concepto de polos dominantes . . . . . . . . . . . . . 4.6.1. Aproximación de polos con retardos . . . . . . 4.6.2. Procedimiento utilizando la Half rule . . . . . 4.7. Ejercicios resueltos . . . . . . . . . . . . . . . . . . . Escuela de Ingeniería Eléctrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 114 115 116 117 119 124 125 127 128 134 134 135 136 137 138 142 Universidad de Costa Rica 5 II. Modelado e Identificación 5. Modelado analítico de sistemas 5.1. Leyes fundamentales . . . . . . . . . . . . . . . . . 5.1.1. Balance de masa . . . . . . . . . . . . . . . 5.1.2. Balance de energía . . . . . . . . . . . . . . 5.1.3. Conservación de la cantidad de movimiento 5.1.4. Otras leyes de conservación . . . . . . . . . 5.1.5. La red generalizada . . . . . . . . . . . . . . 5.2. Modelado de sistemas eléctricos . . . . . . . . . . . 5.3. Modelado de sistemas mecánicos traslacionales . . . 5.4. Modelado de sistemas mecánicos rotacionales . . . . 5.4.1. Conversión entre traslación y rotación . . . . 5.5. Modelado de Sistemas electromecánicos . . . . . . . 5.5.1. Modelado de motores DC . . . . . . . . . . 5.6. Modelado de sistemas térmicos . . . . . . . . . . . 5.7. Modelado de sistemas hidráulicos . . . . . . . . . . 5.8. Modelos estáticos . . . . . . . . . . . . . . . . . . . 5.8.1. A partir del modelo en variables de estado . 5.8.2. A partir de pruebas experimentales . . . . . 5.9. Linealización . . . . . . . . . . . . . . . . . . . . . 5.10. Ejercicios resueltos . . . . . . . . . . . . . . . . . . 150 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6. Identificación de sistemas en el dominio del tiempo 6.1. Descripción del problema . . . . . . . . . . . . . . . . . . . . . 6.2. Algunas definiciones preliminares . . . . . . . . . . . . . . . . 6.3. Modelos utilizados en la identificación . . . . . . . . . . . . . . 6.3.1. Modelos para sistemas no autorregulados . . . . . . . . 6.3.2. Modelos para sistemas autorregulados . . . . . . . . . . 6.3.3. Comparación de los modelos en su respuesta temporal 6.4. Métodos de identificación en el tiempo . . . . . . . . . . . . . 6.4.1. Método para obtener un modelo integrante . . . . . . . 6.4.2. Métodos para obtener modelos de primer orden . . . . 6.4.3. Métodos para obtener modelos de segundo orden . . . 6.5. Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . Escuela de Ingeniería Eléctrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 151 151 153 153 154 154 156 159 166 171 172 178 182 187 195 196 197 198 202 . . . . . . . . . . . 239 239 240 242 243 244 247 247 248 251 260 265 Universidad de Costa Rica 6 III. Análisis 270 7. Análisis en el dominio de la frecuencia 7.1. La respuesta en frecuencia . . . . . . . . . . . . . . . . . . 7.1.1. Magnitud y fase . . . . . . . . . . . . . . . . . . . . 7.1.2. Efecto del retardo puro . . . . . . . . . . . . . . . . 7.1.3. Ceros de fase no mínima . . . . . . . . . . . . . . . 7.2. El diagrama de Bode . . . . . . . . . . . . . . . . . . . . . 7.2.1. Aproximación asintótica del diagrama de Bode . . . 7.2.2. Obtención de la FT a partir del diagrama de Bode 7.3. Diagrama Polar . . . . . . . . . . . . . . . . . . . . . . . . 7.3.1. Construcción de los diagramas polares . . . . . . . 7.3.2. Graficación de diagramas polares . . . . . . . . . . 7.4. Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271 271 271 276 276 277 278 288 290 291 296 297 Bibliografía 323 IV. Apéndices 325 A. La transformada de Laplace 326 A.1. Definición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 326 A.2. Tablas de la Transformada de Laplace . . . . . . . . . . . . . . . . . 327 B. Resumen de álgebra lineal 330 B.1. Nomenclatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330 B.2. Determinantes e inversas . . . . . . . . . . . . . . . . . . . . . . . . . 331 C. Métodos numéricos para la simulación de sistemas C.1. Representación numérica y medidas de error . . . C.1.1. Representación digital de números . . . . . C.1.2. Medida del error . . . . . . . . . . . . . . C.2. Solución numérica de ecuaciones algebraicas . . . C.2.1. Método de la falsa posición . . . . . . . . C.2.2. Método de Newton-Raphson . . . . . . . . C.2.3. Método de la secante . . . . . . . . . . . . C.3. Métodos de diferenciación e integración numéricas C.3.1. Aproximación de derivadas . . . . . . . . . C.3.2. Integración numérica . . . . . . . . . . . . Escuela de Ingeniería Eléctrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334 334 334 337 338 339 341 343 345 345 348 Universidad de Costa Rica 7 C.4. Solución numérica de ecuaciones diferenciales . . . . . . . . . . . . . . 352 C.4.1. Método de Euler . . . . . . . . . . . . . . . . . . . . . . . . . 353 C.4.2. Métodos de Runge-Kutta . . . . . . . . . . . . . . . . . . . . . 353 D. Análisis en el espacio de estados D.1. Transformación de los MVE . . . . . . . . . . . . . . . . . . . . . D.1.1. Forma canónica de Jordan . . . . . . . . . . . . . . . . . . D.2. Análisis de controlabilidad . . . . . . . . . . . . . . . . . . . . . . D.2.1. Forma canónica controlable para sistemas SISO . . . . . . D.2.2. Subespacio controlable . . . . . . . . . . . . . . . . . . . . D.2.3. Cálculo de la entrada para obtener un estado determinado D.3. Análisis de observabilidad . . . . . . . . . . . . . . . . . . . . . . D.3.1. Forma canónica observable para sistemas SISO . . . . . . . D.3.2. Subespacio no-observable . . . . . . . . . . . . . . . . . . . D.4. Principio de dualidad . . . . . . . . . . . . . . . . . . . . . . . . . D.5. Descomposición de Kalman . . . . . . . . . . . . . . . . . . . . . D.6. Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . Índice alfabético Escuela de Ingeniería Eléctrica . . . . . . . . . . . . . . . . . . . . . . . . 360 360 362 363 364 365 367 367 369 369 371 372 379 384 Universidad de Costa Rica Parte I. Fundamentos 8 1. Introducción al modelado y análisis de sistemas 1.1. Introducción a la teoría general de sistemas En este apartado se pretende dar una introducción al análisis de sistemas, enfocándolo particularmente al curso IE0409 Análisis de Sistemas de la Escuela de Ingeniería Eléctrica de la Universidad de Costa Rica. 1.1.1. Antes de llevar el curso Como el lector notará al ir avanzando en el semestre, este curso está basado en herramientas matemáticas vistas en cursos anteriores. Por lo tanto, se sugiere que antes de leer este material, el estudiante haga una revisión rápida de los siguientes conceptos: Álgebra matricial. Determinantes, autovalores (también llamados eigenvalores o valores propios) y autovectores (también llamados eigenvectores o vectores propios). Ecuaciones diferenciales, incluyendo transformadas de Laplace. Análisis de circuitos lineales. Comportamiento de los circuitos ante entradas sinusoidales en régimen permanente y ante entradas tipo escalón e impulso. Impedancias de los circuitos eléctricos en el dominio s y jω y sus diferentes aplicaciones. Leyes de Newton del movimiento para sistemas mecánicos. Este curso es una combinación de ecuaciones diferenciales y álgebra lineal aplicada a sistemas reales, tales como circuitos eléctricos, sistemas mecánicos, hidráulicos y térmicos. 9 10 1.1.2. Historia del análisis de sistemas En la década de 1950 el biólogo austriaco Ludwig von Bertalanffy, plantea el término Teoría General de Sistemas o TGS. Ludwig, veía la teoría general de sistemas como: “un esfuerzo de estudio interdisciplinario, que trata de encontrar las propiedades comunes a los sistemas que se presentan en todos los niveles de la realidad, pero que son objeto tradicionalmente de disciplinas académicas diferentes”. (Loría y Mazón, 1989) Esta teoría se ha nutrido enormemente por varios estudiosos de varias áreas, incluso desde antes que Ludwig la propusiera. Algunos ejemplos de estos aportes son: William Ross Ashby (1903-1972): quien fue uno de los fundadores de la cibernética y de conceptualizar la realimentación de un sistema. Creó la ley de Ashby, la cual indica que: “Solo la variedad absorbe la variedad” Como se verá en el curso de sistemas de control, esta ley es fundamental, aunque poco mencionada. Norbert Wiener (1894-1964): fue un matemático estadounidense. Junto con William Ross Ashby, desarrollaron la cibernética. Francisco Varela (1946-2001) y Humberto Maturana (1928): juntos desarrollaron el concepto de autopoiesis, el cual designa la dinámica de un ser estable para mantenerse estable. Por ejemplo, un ser vivo se mantiene estable, pero debe comunicarse con su medio, ser dinámico. Niklas Luhmann (1927-1998): fue el pionero de la aplicación de la teoría general de sistemas en la sociología. Expandió el concepto de autopoiesis a los sistemas sociales. 1.1.3. Importancia del análisis de sistemas en la ingeniería eléctrica Históricamente, las aplicaciones del análisis de sistemas tuvieron su origen en la ingeniería mecánica, no obstante, el gran número de aplicaciones en el ámbito de los circuitos eléctricos y máquinas eléctricas, y el hecho de que la una gran cantidad de Escuela de Ingeniería Eléctrica Universidad de Costa Rica 11 Depósito de agua Bombas (a) Proceso con cuatro tanques. (b) Esquema del proceso simplificado. Figura 1.1: Ejemplo de un sistema instrumentos utilizados para el control de procesos son electrónicos, han trasladado la mayoría de esta área del conocimiento a la ingeniería eléctrica. Pero, ¿por qué es importante este curso para la formación de un profesional en la ingeniería eléctrica? Para responder esta pregunta, considérese por ejemplo la tarea típica en la industria de controlar el nivel de los cuatro tanques del sistema de la Figura 1.1a (este sistema se encuentra en el Laboratorio de Automática de la Escuela de Ingeniería Eléctrica de la Universidad de Costa Rica). Este proceso se muestra en forma esquemática en la Figura 1.1b y corresponde a cuatro tanques “acoplados”. Si el lector es observador, notará que el líquido que sale del depósito inferior puede llegar a cualquiera de los cuatro tanques manipulando las válvulas. Ahora bien, ¿qué se necesita para controlar este sistema? Al tener conocimientos de electrónica uno pensaría en medir el nivel de cada tanque con un sensor de nivel. Esto es fundamental, pues la información sobre el nivel del agua no nos sirve de nada si no se puede transformar a una variable eléctrica que pueda ser analizada con instrumentos electrónicos. Por otro lado, se debe tener un controlador, algo que reciba la señal del sensor de nivel, lo compare con el valor que se desea, y determine qué acción se debe llevar a Escuela de Ingeniería Eléctrica Universidad de Costa Rica 12 cabo. Algo importante del controlador es que alguien o algo le debe decir qué nivel es el que se desea, por lo que el controlador debe admitir señales del exterior. No obstante, algo le debe sacar el agua al depósito inferior para llevarlo a los tanques. Este “algo” se llama actuador. El actuador debe tomar la señal de salida del controlador y utilizarla para manipular el agua del depósito según el controlador le indique. Para esta aplicación, un par de bombas (que ya están en el sistema) son ideales. Con todos estos elementos se puede formar el esquema de la Figura 1.2, el cual es el esquema del sistema de control que se quiere diseñar. Para finalizar la justificación del porqué es importante este curso, es válido hacerse las siguientes preguntas ¿Cómo saber qué sensor se debe conectar al sistema? ¿Qué controlador es el ideal para esta aplicación? ¿Cómo se comportará el sistema con las bombas que se le conecten? ¿Vale la pena pensar en controlar este sistema? ¿Qué información se puede obtener del sistema solo con las señales de salida? Es ahí donde entra el análisis de sistemas, ya que esta área del conocimiento brinda herramientas para, entre otras cosas: Modelar matemáticamente un sistema real. Determinar las características dinámicas de un sistema ante una entrada particular. Analizar la variación de la salida de un sistema con respecto a las señales de entrada. Conocer el rango de variación de las entradas y las salidas en función de los aspectos constructivos del sistema. Comparar el sistema bajo estudio con otros que se comportan en forma análoga. Representar gráficamente el sistema en diagramas que se pueden manipular para analizarlo en diferentes formas. Diseñar el controlador del sistema en función de lo que se quiere obtener y los aspectos constructivos del sistema. Análisis de Sistemas es el primer curso que se lleva en el área del control automático, pues se centra en el estudio del objeto que se desea controlar o analizar, no obstante, el control del sistema se suele estudiar en otras asignaturas. Dentro del área de Control Automático la escuela ofrece: Escuela de Ingeniería Eléctrica Universidad de Costa Rica 13 Niveles deseados Variable eléctrica Controlador Acción mecánica Actuador Señales de nivel Nivel real Sistema Sensor Figura 1.2: Esquema del sistema de control. Sistemas de control (curso obligatorio). Se diseñan los controladores del sistema de control de la Figura 1.2. Laboratorio de control (curso optativo). Se practica con varios sistemas de control y se contraponen sus características. Sistemas en tiempo discreto (curso obligatorio para licenciatura). Se analizan los sistemas pero aplicando principalmente la transformada Z en lugar de la transformada de Laplace. Control e instrumentación de procesos industriales (curso optativo). Se estudian los sensores y las características prácticas de los sistemas de control. Sistemas no lineales (curso optativo). Se aplican técnicas de análisis y control especiales para sistemas que no cumplen con el principio de superposición. Automatización industrial (curso optativo). Se utilizan un tipo especial de controladores (llamados P LC 0 s) para controlar un determinado tipo de sistemas. Redes neuronales y lógica difusa (curso optativo). Se utilizan técnicas avanzadas de control basadas en programación y métodos iterativos. Sistemas de adquisición de datos y diseño de instrumentos virtuales (curso libre). Se analizan los principios de la adquisición de datos hacia el computador y se diseñan las interfaces de control y los controladores con software. 1.2. Concepto de sistema Aunque es muy probable que el lector comprenda en general del concepto de sistema, es necesario dar una definición más precisa de ello. Esto con el fin de poder diferenciar de forma clara lo que es un sistema y un “modelo de un sistema”. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 14 1.2.1. Definición de sistema Según Eykhoff (1977), un sistema es: “Una colección de objetos organizada, la cual está dirigida hacia un objetivo o fin”. En este punto uno se podría preguntar si varios cuerpos reales son un sistema. Pensando por ejemplo en un automóvil, el automóvil está formado por varios objetos (ruedas, tornillos, cables, volante, asientos, entre otros). Todos estos objetos están organizados y cumplen un fin, transportar a sus pasajeros, por lo tanto, un automóvil califica como sistema. 1.2.2. Tipos de sistemas Los sistemas conceptuales son aquellos formados por estructuras abstractas como definiciones, símbolos, nombres, etc. Ejemplos de estos sistemas son la matemática, la estructura política de un país, la notación musical y los idiomas. Todos los sistemas que no son conceptuales son físicos, es decir, se pueden tocar. En el curso, se le prestará especial atención a estos últimos, pues tienen la capacidad de intercambiar materia y energía con el medio. 1.2.3. Variables de un sistema Al estar formados los sistemas por objetos definidos, se crea directamente una frontera para el sistema, la cual, puede ser incluso función de lo que la persona que lo analiza crea conveniente para su estudio. Típicamente, un sistema se representa por la letra S. Se dice que el sistema S está dentro de su frontera, y fuera de ella está el universo o medio. No obstante, el sistema debe comunicarse con su medio para seguir existiendo, por lo que se debe dar un traspaso de información, energía o materia. Además, el sistema posee internamente objetos o subsistemas que se deben comunicar entre ellos o que definen su comportamiento. Esta idea se muestra esquemáticamente en la Figura 1.3. Seguidamente, se hace una serie de definiciones relacionadas a las variables de un sistema. Variables internas Las variables internas de un sistema S se pueden dividir en: Escuela de Ingeniería Eléctrica Universidad de Costa Rica 15 Universo Sistema Frontera Variables internas Variables externas Figura 1.3: Esquema de las variables de un sistema. Parámetros: son variables que están en función de los aspectos constructivos del sistema, por lo que no dependen de las entradas, pero sí pueden depender del tiempo o de las coordenadas espaciales. Cuando se obtiene la ecuación diferencial que describe un sistema, los parámetros son los coeficientes de dicha ecuación. Tómense en consideración los circuitos de la Figura 1.4, ambos son circuitos RC, la diferencia radica en la fuente utilizada para alimentarlos. Independientemente del tipo de fuente que tenga el circuito, la ecuación diferencial que describe la tensión en el capacitor (vc ) se puede escribir como: vin (t) = vc (t) + RC d vc (t), dt (1.1) Los coeficientes de esta ecuación diferencial son los parámetros del sistema, es decir, la capacitancia C y la resistencia R. Pero, ¿qué pasa si por desgaste la resistencia y la capacitancia cambian? En ese caso, la ecuación se podría escribir como: vin (t) = vc (t) + R(t)C(t) d vc (t), dt (1.2) donde la dependencia de los parámetros respecto al tiempo se hace evidente. Es más, si se considera la variación de la resistencia total del circuito por el cable usado, se podría escribir: vin (t) = vc (t) + R(t, x)C(t, y) d vc (t), dt (1.3) donde x representa una coordenada espacial que se utiliza para modelar la resistencia total del circuito y y podría tomarse como la distancia entre las Escuela de Ingeniería Eléctrica Universidad de Costa Rica 16 Figura 1.4: Circuito RC alimentado por distintas fuentes. placas de un capacitor variable. En todos estos casos, la capacitancia C y la resistencia R son parámetros del sistema. Variables de estado: Debido a que el curso está basado en gran medida en las variables de estado de un sistema, aquí se dará una leve introducción a ellas. En la sección 2.1 se muestran con mayor detalle estos conceptos. Las variables de estado son las que, junto con las funciones de entrada, determinan el conjunto de funciones de salida en un sistema. Por ejemplo, si se trata de despejar la tensión del capacitor del circuito de la Figura 1.4 se obtendría la siguiente relación1 : vc (t) = vc (t0 )e − t−t0 RC 1 Z t − (t−τ ) + e RC vin (τ )dτ. RC t0 (1.4) Como es bien conocido, la respuesta total está formada por la respuesta natural y la forzada. La respuesta natural es función de las condiciones iniciales del sistema (las cuales no se pueden considerar cero a menos que se diga lo contrario). Debido a que se debe conocer la tensión del capacitor para determinar la tensión en todo el tiempo, la tensión inicial del capacitor es una variable de estado de este sistema. En este caso la salida del sistema (la tensión vc (t)) es también la variable de estado, no obstante, eso no es siempre cierto. Si se considera más bien la salida del sistema como la corriente que pasa por la resistencia, el lector podrá 1 Se recomienda que el lector repase los conceptos de convolución y análisis de circuitos de primer orden. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 17 determinar fácilmente que: iR (t) = 1 [−vc (t) + vin (t)] , R (1.5a) t−t 1 1 Z t − (t−τ ) − RC0 RC e = + vin (τ )dτ + vin (t) , − vc (t0 )e R RC t0 (1.5b) t−t 1 1 Z t − (t−τ ) − RC0 RC e = − vc (t0 )e + vin (τ )dτ R RC t0 + Z t t0 δ(t − τ )vin (τ )dτ , (1.5c) Z t t−t 1 1 Z t − (t−τ ) − RC0 = −vc (t0 )e e RC vin (τ )dτ + − δ(t − τ )vin (τ )dτ , R RC t0 t0 (1.5d) Z t t−t 1 − (t−τ ) 1 − RC0 + − e RC vin (τ ) + δ(t − τ )vin (τ ) dτ , = −vc (t0 )e R RC t0 (1.5e) Z t t−t 1 − (t−τ ) 1 − RC0 − + = −vc (t0 )e e RC + δ(t − τ ) vin (τ )dτ , R RC t0 (1.5f) donde se usó la propiedad tt0 δ(t − τ )vin (τ )dτ = vin (t) para diferenciar la respuesta forzada (debida a las entradas) de la respuesta natural (debida a los estados). Esta propiedad recibe el nombre de la propiedad de muestreo de la función delta de Dirac. R En este último caso, para determinar la salida del sistema (la corriente iR (t)) es necesario conocer la tensión inicial del capacitor (vc (t0 )) y la señal de entrada (vin (t)). Este es un ejemplo de cómo es posible que una salida del sistema no sea una variable de estado y viceversa. En este caso, la tensión del capacitor sigue siendo una variable de estado. Aunque más adelante se describirán más propiedades de las variables de estado, algunas de las principales son (Loría y Mazón, 1989): • Definen la respuesta natural del sistema. • Dependen de las entradas y la historia del sistema (por ejemplo en (1.4) el capacitor se cargó por la aplicación de una tensión antes del tiempo t0 ). Escuela de Ingeniería Eléctrica Universidad de Costa Rica 18 • Constituyen la memoria del sistema, pues no pueden cambiar inmediatamente. • Permiten asignar un único conjunto de salidas a un determinado conjunto de entradas. Variables externas Son las variables con la capacidad de traspasar la frontera del sistema. Las hay de dos tipos: entradas y salidas. Entradas: Son las responsables de definir la evolución forzada del sistema. Se dividen en: • Entradas determinísticas: Las cuales son generadas intencionalmente, es decir, por el usuario del sistema. Típicamente estas entradas son producidas por un elemento externo al sistema, por ejemplo, fuentes de tensión en un circuito, un generador de ondas, una caldera generadora de calor en un sistema de calefacción. • Entradas estocásticas: Las cuales son generadas por señales que no se pueden manipular, pero que típicamente se pueden medir, y por lo general se conoce algún valor probabilístico de éstas (valor promedio, máximo, mínimo, desviación estándar, etc.). Por ejemplo, la fuerza generada por la fricción del aire sobre las alas de un avión no se puede manipular, pero se puede medir (es más, se necesita medir para poder controlar adecuadamente el sistema), además, dependiendo de la zona, se puede estimar su valor máximo, mínimo y promedio. Cuando se hace referencia a los sistemas de control, a este tipo de entradas también se les llama perturbaciones. Salidas: Son las señales que le brindan información al universo de cómo se encuentra el sistema. Las salidas poseen dos componentes: • Respuesta forzada: Es debida al efecto de las entradas y a los parámetros del propio sistema. • Respuesta natural: Es debida al efecto de los estados del sistema y al de sus parámetros. Considérese por ejemplo la tensión del capacitor en el circuito de la Figura 1.4. De (1.4) se obtuvo: t−t 1 Z t − (t−τ ) − RC0 vc (t) = vc (t0 )e + e RC vin (τ )dτ, (1.6) RC t0 Escuela de Ingeniería Eléctrica Universidad de Costa Rica 19 Figura 1.5: Variables de un sistema. siendo esta expresión la que describe la salida total del sistema. Como es bien conocido de cursos anteriores, la respuesta total se puede dividir en la salida forzada y la salida natural, a saber: vc (t) = vc0 (t) + vcθ (t), donde para este caso: (1.7) t−t0 vc0 (t) = vc (t0 )e− RC , (1.8) es la respuesta natural del sistema y: 1 Z t − (t−τ ) e RC vin (τ )dτ. vcθ (t) = RC t0 es la respuesta forzada. (1.9) Para concluir esta sección, en la Figura 1.5 se muestra un esquema de las variables de un sistema cualquiera. 1.3. Concepto de modelo de un sistema 1.3.1. Definición de modelo Para manipular o analizar un sistema es necesario primero representarlo de alguna forma. Esta representación lleva el nombre de modelo, donde el modelo se puede definir como: Escuela de Ingeniería Eléctrica Universidad de Costa Rica 20 Una representación de los aspectos esenciales de un sistema (Loría y Mazón, 1989). Esta definición es en realidad bastante relativa, ¿qué es esencial para representar un sistema? Para discutir este punto considérese el circuito de la Figura 1.6, definiendo la fuente de tensión como la entrada y la tensión de la resistencia como la salida. Si se desea representar este sistema por medio de un modelo, tal que represente exclusivamente la relación entre la entrada y la salida se tendría, por ejemplo: L dvR (t) + RvR (t) = Rvin (t), dt (1.10) la cual es la ecuación diferencial que modela al sistema. Obsérvese que en esta ecuación no se consideran los cambios en la temperatura, no obstante, es bien conocido que la resistencia varía con la temperatura (Dorf y Svoboda, 2000). Tampoco se considera el desgaste de los componentes respecto al tiempo ni el posible cambio de la inductancia por un acople magnético con algún circuito cercano, es más, tampoco se ha considerado un modelo que incorpore la posibilidad de una fuente de tensión que pueda quemar los componentes o la incorporación del ruido eléctrico en la señal de salida. Considerando estos puntos, se puede crear un modelo “más exacto” del sistema: Si |vin | ≤ vinmax : L(M ) Si |vin | > vinmax : d vR (t) + R(T, t)vR (t) = R(T, t)vin (t) + f (t), dt vR (t) = 0, (1.11) (1.12) donde M es el coeficiente de acoplamiento magnético, T es la temperatura y f (t) es una función de ruido eléctrico. En esta discusión, se colocó vR (t) = 0 si |vin | > vinmax para modelar el hecho de una determinada tensión máxima en la resistencia que hará que se queme, y por lo tanto no pase corriente y vR (t) = 0. Aunque este nuevo modelo puede resultar mucho más completo que el mostrado en (1.10), ciertamente sería muy difícil trabajar con él, debido a la gran cantidad de información que se necesita. De hecho, aunque todos los fenómenos que lo definen son reales, muy probablemente el lector nunca se preocupó por ellos y siempre ha considerado como suficiente el modelo mostrado en (1.10), pues representa los aspectos esenciales del sistema bajo estudio. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 21 Modelo Sistema y modelo Figura 1.6: Circuito RL. 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 Tiempo (s) 0 0,5 1 1,5 2 2,5 3 3,5 4 Tiempo (s) (muestreo cada 0.5s) 4,5 Figura 1.7: Respuesta de un sistema y su modelo en tiempo discreto. 1.3.2. Tipos de modelos Los modelos se pueden clasificar de acuerdo a varios criterios, siendo posible que un modelo pertenezca a varias clasificaciones: De acuerdo a la estructura matemática Modelos en tiempo continuo. En este tipo de modelos se considera que la variable independiente es el tiempo t, el cual es continuo, por lo que puede tomar cualquier valor. Estos modelos, representan el comportamiento de los sistemas por medio de ecuaciones diferenciales o funciones de transferencia en el dominio s. Modelos en tiempo discreto. En este caso, la variable independiente tiempo, solo puede tomar valores discretos (no necesariamente enteros). Por lo general, estos modelos se utilizan cuando se hace alguna conversión analógica-digital en el proceso a analizar, pues se hace un muestreo de las señales cada cierto tiempo. Las ecuaciones en diferencias y las funciones de transferencia en el dominio z son algunos modelos de este tipo. En la Figura 1.7 se muestra un ejemplo de un modelo discreto con un periodo de muestreo de 0,5 s. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 22 Modelos lineales. Estos modelos corresponden a las estructuras matemáticas que cumplen con los principios de homogeneidad y aditividad y por tanto se puede aplicar la superposición. El lector debe recordar de cursos anteriores que el principio de homogeneidad es tal que: f (au) = af (u), donde f es la salida del sistema, u es la entrada y a es un número real. Mientras que el principio de aditividad establece que: f (u1 + u2 + · · · + ui + · · · ) = f (u1 ) + f (u2 ) + · · · + f (ui ) + · · · , donde ui es la entrada i-ésima del sistema. Modelos no lineales. Estos están formados por las estructuras matemáticas que no cumplen con los principios de linealidad y homogeneidad. El tratamiento de estos modelos es muy complejo y requiere de análisis avanzados. La mayoría de los modelos tratados en este documento, son lineales y todos son en tiempo continuo. En otros cursos se les da énfasis a los demás modelos. De acuerdo a las características de sus parámetros Como se ha comentado en varias ocasiones, los parámetros de un sistema varían en el tiempo o pueden depender de coordenadas espaciales. Así, se presentan cuatro posibilidades para clasificar un modelo de ese sistema: Variantes en el tiempo. En este caso, los parámetros del modelo son una función del tiempo. Trabajar con estos modelos tiene una mayor dificultad, pues las ecuaciones diferenciales resultantes son más complejas y no siempre se pueden resolver fácilmente. Invariantes en el tiempo. En este caso, los parámetros del modelo son constantes en el tiempo, por lo que su aplicación es limitada a un lapso lo suficientemente pequeño para que los parámetros del sistema no varíen en forma significativa. No obstante, la mayoría de los modelos son invariantes en el tiempo debido a que son más fáciles de analizar y representan los sistemas reales con suficiente exactitud. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 23 De parámetros distribuidos. Para estos modelos los parámetros son función de las coordenadas espaciales. Particularmente estos modelos son adecuados para sistemas de gran tamaño, donde es imposible conseguir o suponer que todos los parámetros son homogéneos. Por ejemplo, el grosor de la carrocería de un automóvil no es uniforme en todos los puntos porque en ciertas zonas se necesita la existencia de mayor resistencia que en otras. El grosor de la carrocería de un automóvil es por tanto un parámetro distribuido. De parámetros concentrados. Estos modelos se caracterizan porque sus parámetros no son función de las coordenadas espaciales sino que se mantienen constantes en el espacio. La mayoría de los modelos aquí utilizados son los modelos invariantes en el tiempo y de parámetros concentrados. De acuerdo a las salidas La clasificación de los modelos respecto a las salidas son: Modelos causales (causa-efecto). En estos modelos las salidas dependen de las salidas y entradas pasadas. Todos los sistemas físicos son causales, pues no existe un sistema que tome en cuenta el futuro para decidir su comportamiento, de lo contrario, se estaría conociendo el futuro, por tanto, los modelos causales son los más utilizados. Modelos anticipativos. Los valores actuales de este modelo dependen de los valores futuros, para ello, estos modelos deben determinar el futuro2 . Por supuesto, debido a esta cualidad, los modelos anticipativos no son físicamente realizables. Modelos con memoria. Estos son los modelos cuya salida depende de lo que haya sucedido en el pasado, y posiblemente, también de la entrada actual. Cualquier sistema con un elemento almacenador de energía, se dice que es capaz de mantener un estado, pues el elemento que almacena la energía no puede cambiar su cantidad de energía inmediatamente. Si en la ecuación que modela 2 El lector debe ser cuidadoso, no es lo mismo determinar el futuro que estimarlo, determinar (al menos en este contexto) implica tener conocimiento perfecto de lo que pasará, estimarlo implica poder suponer con un cierto margen de certeza lo que pasará. Un ejemplo típico son las predicciones del tiempo atmosférico, se puede estimar si lloverá, hará sol, etc, pero estas estimaciones no son 100 % confiables. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 24 un sistema, aparece algún tipo de condición inicial, esto implica que es un modelo con memoria. Modelos sin memoria. Tómese en consideración una resistencia conectada a una fuente de tensión, la relación que determina la corriente en la resistencia es: iR (t) = vin (t) , R obsérvese que esta relación no toma en cuenta el valor de alguna señal para un tiempo t0 < t, donde t es el momento actual. Debido a esto, a este modelo no le interesa lo que ha pasado antes, se puede decir que no tiene memoria. No obstante, si se calcula la corriente en un inductor conectado a la misma fuente de tensión se tendría que: 1Zt iL (t) = iL (t0 ) + vL (τ )dτ, L t0 y como la corriente en el tiempo t depende de t0 con t0 < t, se tiene que este modelo sí tiene memoria. El uso de modelos con memoria va íntimamente ligado a sistemas con elementos almacenadores de energía, en el primer caso, ni la resistencia ni la fuente almacenan energía, por lo que el modelo resulta sin memoria. En el segundo caso, debido a que el inductor almacena energía, resultó necesario utilizar un modelo con memoria. En la Figura 1.8 se muestra un esquema para resumir todas las clasificaciones de los modelos que aquí se mencionaron. 1.3.3. Obtención de los modelos Dado un sistema, existen básicamente tres formas para obtener un modelo de él. Estas formas se pueden representar como cajas, a saber: caja blanca, gris y negra. Modelado de caja blanca Este tipo de obtención del modelo también se llama modelado analítico. En él, se supone que el usuario tiene conocimiento total del sistema (puede medir lo que desee y tiene acceso total al interior del mismo), por lo que utiliza las leyes físicas que lo gobiernan para determinar el modelo del mismo. Este tipo de modelado es el más usado en el diseño de sistemas, pues se cuenta con toda la información del sistema. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 25 ClasificaciónNdeNlosNmodelos Estructrura matemática Parámetros Geometría Tiempo Tiempo Salidas Tipo Tiempo Memoria Concentrados Variantes Continuos Lineales Anticipativos ConNmemoria Distribuidos Invariantes Discretos NoNlineales Causales SinNmemoria Figura 1.8: Clasificación de los modelos. Figura 1.9: Modelo de un motor DC. Modelado de caja gris Este tipo de modelo se refiere a la determinación de los parámetros de un modelo de un sistema a partir de una estructura conocida. Por ejemplo, se sabe que el circuito equivalente de un motor DC (el circuito que modela la parte eléctrica) con excitación independiente es el mostrado en la Figura 1.9. Todos los motores de este tipo se pueden representar con este modelo, no obstante, es necesario hacer experimentos y pruebas para determinar el valor de los parámetros del modelo (L, R y kf ), pues no siempre es posible medirlos directamente. Modelado de caja negra La idea de esta técnica es hacer un modelo sin conocer la estructura interna del sistema. Para ello se utilizan experimentos sobre las entradas del sistema para Escuela de Ingeniería Eléctrica Universidad de Costa Rica 26 investigar cómo se comportan las salidas y a partir de eso determinar un modelo del sistema. Por esto, a este tipo de modelado se le llama modelado experimental. Aunque este modelado es muy utilizado, también es el más abstracto, pues los modelos encontrados no dicen nada de la estructura física del sistema, simplemente son entidades matemáticas que comparten o aproximan algunas de sus propiedades. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 2. Introducción al espacio de estados Los sistemas que se estudian en este curso pueden ser modelados matemáticamente a partir de ecuaciones diferenciales ordinarias. Estas ecuaciones son el punto inicial para el estudio analítico del concepto de estado y por ende, del espacio de estados. En este capítulo, se introduce la formulación matemática del espacio de estados, su análisis y la resolución de las ecuaciones para sistemas lineales e invariantes en el tiempo. Cómo representar diagramas de manera gráfica con la ayuda de diagramas de bloque y de flujo, se estudia en el Capítulo 3. En el Capítulo 5 se estudia el modelado analítico de sistemas, es decir, la obtención de las ecuaciones diferenciales que representan la dinámica de un sistema a partir de principios físicos y químicos establecidos. Se recomienda que antes de empezar a estudiar este capítulo, el estudiante realice un pequeño repaso de álgebra matricial y de la transformada de Laplace, que son herramientas indispensables en el análisis de sistemas. Una buena referencia para repasar estos temas, se puede encontrar en Kuo (1996). Además, un pequeño resumen se presenta en los apéndices A y B. 2.1. El concepto de estado 2.1.1. Definición Intuitivamente, se comprende el término estado como la condición actual de un sistema. Esta condición es producto de la historia del sistema, es decir, de las perturbaciones que ha sufrido a lo largo del tiempo y que han definido su situación presente. Una analogía fácil de entender es cuando un médico en una sala de urgencias pregunta por el estado de un paciente. En este caso, el estado del sistema (el paciente) se refiere a su condición de salud. El médico necesita saber este estado para poder tomar las acciones necesarias para llevar al paciente a un estado “mejor”. Ahora bien, desde el punto de vista cuantitativo, es necesaria una definición más precisa: Se define estado de un sistema como la mínima cantidad de información necesaria en un instante para que, conociendo la entrada a partir 27 28 de ese instante, se pueda determinar cualquier variable del sistema en cualquier instante posterior (Domínguez et al., 2006). Esta cantidad mínima de información se refiere precisamente al valor de las variables del sistema. La cantidad mínima de variables que definen de manera única el estado del sistema se les conoce como variables de estado. Volviendo a la analogía del paciente, las variables de estado que podrían definir el estado del mismo son su temperatura interna, la cantidad de azúcar en sangre, el colesterol, presencia de erupciones en la piel, etc. Si se tiene conocimiento de la dinámica del sistema, y además se conoce la entrada que se aplica en el sistema desde un instante inicial t0 hasta un instante final t1 , es posible predecir el nuevo estado (es decir, los nuevos valores de las variables de estado del sistema) en cualquier instante entre t0 y t1 . Con el intervalo de observación [t0 , t1 ] se puede denotar la entrada y la salida del sistema como ū = u[t0 ,t1 ] y ȳ = y[t0 ,t1 ] respectivamente. Supongamos que un sistema real se puede representar con un objeto abstracto S (el modelo) de manera que se pueda escribir una relación de la forma: S(ū, ȳ) = 0. (2.1) A esta relación se le llamará Relación Entrada Salida (RES). Normalmente esta RES corresponderá a la ecuación diferencial que relaciona las salidas del sistema con las entradas del mismo. Asociado a este objeto abstracto se puede definir un vector variable x(t0 ) ∈ Σ de manera que la salida ȳ queda totalmente definida teniendo conocimiento de: El valor de x(t0 ) La entrada del sistema ū La RES S(ū, ȳ) = 0 Al valor de este vector x se le llama entonces, estado del sistema. Σ es el espacio vectorial de todos los posibles estados del sistema. A este espacio se le conoce como espacio de estados. Si la relación entre la entrada, la salida y los estados se escribe de manera explícita: y[t0 ,t] = Ŝ(x(t0 ), u[t0 ,t] ), ∀x(t0 ) ∈ Σ, ∀t > t0 . (2.2) A la función Ŝ se le conoce como Relación Entrada Salida Estado (RESE). Normalmente la RESE se obtiene resolviendo la ecuación diferencial definida por la RES. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 29 + Figura 2.1: Circuito simple. Ejemplo 2.1 Si se tiene el circuito simple de la Figura 2.1, obtener la RES y la RESE. Solución: Más adelante se presentará la forma de obtener el modelo de los sistemas eléctricos. Por ahora, supongamos que se nos da la ecuación diferencial de este sistema y que está dada por: dVout (t) RC + Vout (t) = Vin (t). dt Basta con escribir esta ecuación como: S(ū, ȳ) = RC dy(t) + y(t) − u(t) = 0. dt Para obtener la RES del sistema. En este caso u(t) = Vin (t) y y(t) = Vout (t). Para obtener la RESE, basta con encontrar una expresión de la salida en función de la entrada y los estados, es decir, resolver la ecuación diferencial. Existen diferentes métodos para resolver ecuaciones diferenciales. Para este caso, vamos a utilizar la transformada de Laplace. Aplicando la transformada de Laplace sobre la RES, se obtiene: RC (sY (s) − y(0)) + Y (s) − U (s) = 0. Despejando Y (s), se encuentra que: (RCs + 1)Y (s) = RCy(0) + U (s), RC 1 Y (s) = y(0) + U (s). RCs + 1 RCs + 1 Aplicando la transformada inversa de Laplace obtenemos la expresión para y(t): −1 y(t) = y(0)e RC t + Escuela de Ingeniería Eléctrica 1 Z t −1 (t−τ ) e RC u(τ ) dτ . RC 0 Universidad de Costa Rica 30 Como se puede observar, la salida del sistema depende de los parámetros del sistema (R y C), la entrada u(t) y depende de y(0), además t0 = 0. En este caso, este valor de y(0) es precisamente el estado inicial del sistema y por lo tanto, la salida del sistema dependerá directamente del valor que tenga. Es decir, la salida del sistema es al mismo tiempo una variable de estado. El sistema tiene una sola variable de estado y el espacio de estados será igual a todos los posibles valores que pueda tomar y(0). 2.1.2. Propiedades de las variables de estado Las variables de estado deben cumplir las siguientes propiedades (Domínguez et al., 2006): 1. Unicidad: Dadas una condición inicial y una entrada, el valor del estado debe ser único: ∀t ≥ t0 , x0 = x(t0 ), u(τ ) t0 < τ ≤ t ⇒ x(t) es única 2. Continuidad: Las trayectorias en el espacio de estados son funciones continuas: lı́m x(t) = x(t0 ) ∀t y ∀t0 t→t0 3. Transitividad: Si se tienen 3 tiempos t0 < t1 < t2 , entonces para conocer el estado en t2 se tienen dos opciones: Conocer el estado en t0 y la entrada aplicada desde t0 hasta t2 : x(t2 ) = Ψ(t2 , t0 , x(t0 ), u(τ )) con t0 < τ ≤ t2 O conocer el estado en t1 y la entrada aplicada desde t1 hasta t2 : x(t2 ) = Ψ(t2 , t1 , x(t1 ), u(τ )) con t1 < τ ≤ t2 Suponiendo que el estado en t1 se alcanzó mediante: x(t1 ) = Ψ(t1 , t0 , x(t0 ), u(τ )), con t0 < τ ≤ t1 Escuela de Ingeniería Eléctrica Universidad de Costa Rica 31 2.1.3. Definiciones importantes Existen algunas definiciones importantes para el análisis de sistemas que se derivan del concepto de RESE (Loría y Mazón, 1989): Estado alcanzable: El estado x∗ ∈ Σ se dice alcanzable a partir del estado x ∈ Σ si y solo si, existe una entrada u(t) tal que el sistema es llevado desde x hasta x∗ en un tiempo finito. Estado cero: Un estado θ ∈ Σ es un estado cero del objeto S, si para todo t0 y con una entrada nula, la RESE de S, con S partiendo de θ es una función nula: Ŝ(θ, 0) = 0, ∀t ≥ t0 . Respuesta de estado cero: Se le denomina respuesta de estado cero yθ , a la respuesta del objeto S ante una entrada ū cuando parte desde su estado cero θ: ȳθ (t) = Ŝ(θ, ū). Respuesta en estado estacionario: Se define como el límite (si existe) de la respuesta del sistema, cuando el tiempo tiende a infinito: yss = lı́m Ŝ(x, u). t→∞ Respuesta a entrada cero: Se define como la respuesta de un sistema S ante una entrada nula, partiendo de un estado particular x: yec = Ŝ(x, 0). 2.1.4. Linealidad e invarianza en el tiempo En este curso, se estudiarán solo los sistemas que sean lineales e invariantes en el tiempo. Ahora bien, en la naturaleza todos los sistemas son no lineales y variantes en el tiempo pero, si el lapso y el rango de acción en el que se estudian son pequeños, estos sistemas reales se pueden aproximar bien a sistemas lineales e invariantes, que son mucho más sencillos de analizar y para los que existe una gran cantidad de teoría alrededor. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 32 Linealidad Se dice que un sistema es lineal si cumple las siguientes propiedades (Loría y Mazón, 1989): Superposición: Las salidas del sistema obtenidas para cada conjunto de entradas actuando por separado, pueden sumarse para obtener el efecto de todas las entradas actuando en conjunto. Esto es, para un sistema general ȳ = F (ū), considerando ȳ como la salida y ū como la entrada para un tiempo t0 ≤ t ≤ t1 , la superposición se puede escribir matemáticamente como: F (ū1 + ū2 ) = F (ū1 ) + F (ū2 ). (2.3) Homogeneidad: La respuesta de un sistema obtenida a partir de las entradas escaladas en un factor determinado, es igual a escalar, en ese mismo factor, la respuesta del sistema obtenida a partir de las entradas sin escalar. Matemáticamente: F (kū) = kF (ū), (2.4) sin embargo, como se ha visto hasta ahora, la salida de los modelos no solo depende de la entrada sino también de los estados. Por ello, un modelo será lineal si es lineal en los estados (o lo que es equivalente, es lineal a entrada cero), en las entradas (lo que es lo mismo a ser lineal a estado cero) y además cumple una propiedad más: la propiedad de descomposición, la cual dice que la salida total de un sistema se puede escribir como la suma de la respuesta a entrada cero más la suma de la respuesta a estado cero. Matemáticamente, se dice que un sistema es lineal si (Canales y Barrera, 1977): Ŝ (k (x1 + x2 ) , k (ū1 + ū2 )) = k Ŝ (x1 , ū1 ) + k Ŝ (x2 , ū2 ) . (2.5) Esta ecuación incluye la propiedad de linealidad a entrada cero, puesto que si ū1 = ū2 = 0 se tiene que: Ŝ (k (x1 + x2 ) , 0) = k Ŝ (x1 , 0) + k Ŝ (x2 , 0) . También la de linealidad a estado cero: si los estados son iguales al estado cero θ, x1 = x2 = θ: Ŝ (θ, k (ū1 + ū2 )) = k Ŝ (θ, ū1 ) + k Ŝ (θ, ū2 ) . Y la de descomposición puesto que si k = 1, x2 = θ y ū1 = 0: Ŝ ((x1 + θ) , (0 + ū2 )) = Ŝ (x1 , 0) + Ŝ (θ, ū2 ) . Escuela de Ingeniería Eléctrica Universidad de Costa Rica 33 Invarianza en el tiempo Esta propiedad se refiere a los sistemas en los cuales no importa en qué tiempo se analicen, siempre ante una misma entrada y estados resultará la misma salida. Esto es equivalente a decir que las propiedades y parámetros del sistema permanecen constantes en el tiempo. Formalmente, se puede expresar esta propiedad de la siguiente manera (Canales y Barrera, 1977): Sea RT el operador de retardo, de tal manera que retarda a una señal T unidades de tiempo, esto es: RT (u(t)) = u(t − T ). (2.6) Si ante una entrada ū, la salida del sistema viene dada por: ȳ = Ŝ (x0 , ū) . Entonces si el sistema es invariante en el tiempo, retardar la señal de salida T unidades de tiempo será igual a obtener la salida del sistema, pero con la entrada retardada T unidades de tiempo, es decir: RT (ȳ) = Ŝ (x0 , RT (ū)) . 2.2. (2.7) Sistemas eléctricos como prototipos de sistemas lineales Los circuitos eléctricos sencillos se pueden modelar como sistemas lineales. Para efectos de este capítulo, se presentarán las ecuaciones de los elementos para tener una base más realista para estudiar los modelos en variables de estado. En el capítulo 5, se ampliará el estudio del modelado de sistemas a los de tipo mecánico, térmico e hidráulico. Primero unas cuantas definiciones básicas (Dorf y Svoboda, 2000): Carga eléctrica: Propiedad de algunas partículas que se ve afectada por campos electromagnéticos. Electricidad: Fenómeno físico que se origina de la interacción entre cargas eléctricas. Circuito eléctrico: Interconexión de elementos eléctricos (elementos que en cierta medida, permiten el flujo de carga a través de ellos) que producen al menos una trayectoria cerrada de forma que pueda fluir una corriente eléctrica. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 34 Elemento Parámetro Ecuación Fuente de tensión Tensión (V) Vin = f (t) Fuente de corriente Corriente (A) Iin = f (t) Resistor Capacitor Resistencia (Ω) Capacitancia (F) VR = RIR IC = C dVdtC Símbolo + Iin + IR + Ic Inductor Inductancia (H) VL = L dIdtL Vin - + IL VR - R Vc - C VL - L Cuadro 2.1: Modelos de los elementos de los sistemas eléctricos. Corriente: Es la tasa de flujo de la carga eléctrica por un punto dado. Su unidad de medida es el Ampere (A). Tensión: Se define como tensión al trabajo necesario para mover una carga eléctrica unitaria. Su unidad es el volt (V). Ampere: Es la intensidad de una corriente constante, que mantenida en el vacío entre dos conductores paralelos, rectilíneos, de longitud infinita, de sección circular despreciable, y situados a una distancia de un metro entre ambos, producirá entre estos conductores una fuerza igual a 2,0×10−7 newton por metro de longitud (Ministerio de Economía, Industria y Comercio, 2010). Volt: Es la diferencia de potencial eléctrico entre dos puntos de un conductor que transporta una corriente eléctrica constante de un Ampere, y cuando la potencia disipada entre esos dos puntos es igual a un Watt (Ministerio de Economía, Industria y Comercio, 2010). En el Cuadro 2.1, se presentan los principales elementos que componen los sistemas eléctricos. Los llamados elementos activos son los que son capaces de entregar energía al circuito eléctrico. Estos elementos son las fuentes de tensión y corriente. Una fuente ideal de tensión, podrá entregar una tensión definida con cualquier corriente. Esta corriente dependerá del resto del circuito y teóricamente puede tomar cualquier valor. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 35 En cambio, una fuente de corriente ideal será capaz de entregar un nivel de corriente definido, sin importar el nivel de tensión que se obtenga. El elemento eléctrico pasivo (que absorbe energía) más simple es el resistor. Nótese en el Cuadro 2.1 la convención para elementos pasivos: la corriente siempre irá en sentido contrario al de la tensión1 . Un resistor es un objeto que obstaculiza en cierta medida el flujo de la corriente eléctrica. La relación que existe entre la tensión y la corriente en un cuerpo viene descrita por la ley de Ohm. Esta ley indica que la tensión que se produce en un cuerpo es proporcional a la corriente que la atraviesa. A este parámetro de proporcionalidad se le llama resistencia (medida en Ohms: Ω = 1V/A), y es la unidad con la que se mide la resistencia de un objeto. Esta relación y el símbolo del resistor se pueden encontrar en el Cuadro 2.1. Matemáticamente, la ley de Ohm se enuncia como: VR = RIR , (2.8) donde VR es la tensión que aparece en el resistor, IR es la corriente y R es su resistencia. Como se indicó, el resistor es capaz de absorber energía, pero no es capaz de almacenarla. Una vez que la corriente deje de circular a través de él, la tensión será nula también. Existen dos elementos eléctricos capaces de almacenar energía: el capacitor y el inductor. El capacitor (también llamado condensador) es un elemento pasivo que es capaz de almacenar energía gracias al campo eléctrico que mantiene en su interior. En su forma más simple, está formado por dos placas conductoras que están separadas por un material dieléctrico. Una vez que una tensión se aplica en él, las placas conductoras empiezan a acumular carga, una con carga positiva y otra con carga negativa. La carga de una de estas placas es proporcional a la diferencia de potencial (tensión) aplicado entre las dos placas, es decir: Q = CVc , (2.9) donde Q es la carga, Vc es la tensión aplicada al capacitor y C es el factor de proporcionalidad. Este factor recibe el nombre de capacitancia y expresa la cantidad de carga por volts que puede almacenar un capacitor. La unidad en el Sistema Internacional de Unidades (SI) para la capacitancia es el farad (F). Al derivar a ambos lados con respecto al tiempo, se encuentra la siguiente relación: dQ dVc =C , dt dt dVc Ic = C . dt (2.10) 1 La tensión siempre se mide como la resta del potencial del polo positivo menos el potencial del polo negativo. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 36 De (2.10) se rescata que la tensión en un capacitor no puede variar de forma instantánea porque requeriría una corriente infinita. El otro elemento almacenador de energía es el inductor. En su forma más sencilla, un inductor es una bobina de alambre por la que se hace circular corriente eléctrica. Este elemento es capaz de almacenar energía gracias al campo magnético que se forma cuando fluye la corriente a través de sus devanados. La relación entre la tensión y la corriente en un inductor es: dIL VL = L , (2.11) dt es decir, la tensión que se produce en el inductor es proporcional al cambio en la corriente con respecto al tiempo. De la ecuación (2.11) se observa que no es posible tener un cambio instantáneo de la corriente en un inductor, porque esto implicaría una tensión infinita. La constante L es llamada inductancia y mide la capacidad de un dispositivo de almacenar energía en la forma de campo magnético. La unidad de medida de la inductancia es el henry (H). Sumado a las variables físicas del sistema y a los elementos, es necesario contar con las relaciones correspondientes que nos permitan analizar el flujo de las variables a través de los elementos. En el caso de los sistemas eléctricos, las dos leyes fundamentales son las leyes de Kirchhoff. Para enunciar estas leyes primero se necesita definir lo que es un nodo y un lazo en un circuito eléctrico. Un nodo se define como el punto donde se conectan dos o más elementos eléctricos. En el circuito de la Figura 2.2 se pueden observar cuatro nodos. Nótese que el nodo inferior incluye bastantes líneas de unión (o alambres ideales con resistencia cero, si se quiere ver así), igualmente se podrían dibujar todos los elementos tocándose en un solo punto, pero por norma general, se trata que los diagramas de los circuitos sean más o menos cuadrados. Un lazo es una trayectoria cerrada dentro de un circuito que pasa por varios nodos una sola vez, pero que inicia y termina en el mismo nodo. Un caso especial de un lazo es una malla, que tiene la característica de que no contiene ningún otro lazo. Por ejemplo, en la Figura 2.3 se muestra un circuito con tres lazos de los cuales, solo dos de ellos son mallas. La Figura 2.3a presenta un lazo que contiene a los lazos de las Figuras 2.3b y 2.3c. La primera ley de Kirchhoff o ley de nodos indica que la suma algebraica de corrientes en un nodo es igual a cero. Lo que indica esta ley es que en un circuito eléctrico no hay nodos sumideros, es decir, la corriente que entra a un nodo es igual a la corriente que sale. En la Figura 2.4 se muestran tres corrientes que confluyen en un nodo. En este caso, a partir de la ley de nodos se obtiene la siguiente relación Escuela de Ingeniería Eléctrica Universidad de Costa Rica 37 1 3 2 4 Figura 2.2: Un circuito con cuatro nodos. (a) Lazo 1 (b) Lazo 2 (c) Lazo 3 Figura 2.3: Un circuito con 3 lazos. Solo los lazos 2 y 3 son mallas. entre estas corrientes: i1 − i2 − i3 = 0, (2.12) como se puede observar, las corrientes positivas que entran al nodo se suman en la expresión, mientras que las corrientes positivas que salen del nodo se restan. La segunda ley de Kirchhoff es la ley de lazos que dice que la suma algebraica de tensiones para cualquier lazo es igual a cero. En la Figura 2.5 se muestra un lazo con diferentes elementos. La expresión que relaciona las tensiones de los elementos viene dada por: v1 − v2 − v3 = 0, (2.13) Las tensiones que van en el sentido de recorrido del lazo, se suman en la expresión, mientras que las tensiones que van en contra del recorrido se restan. Ahora se tienen los elementos básicos para el análisis de sistemas eléctricos. Utili- Escuela de Ingeniería Eléctrica Universidad de Costa Rica 38 Figura 2.4: Ley de nodos de Kirchhoff. + - + - + - Figura 2.5: Ley de lazos de Kirchhoff. zando las leyes de Kirchhoff y los modelos de cada uno de los elementos, es posible escribir la ecuación diferencial correspondiente que modela la dinámica del circuito eléctrico. Ejemplo 2.2 Dado el circuito de la Figura 2.6, si la entrada es Vin (t) y la salida es iL (t), obtenga: La ecuación diferencial que modela iL en función de Vin (t) (RES). Si R1 =R2 =10 Ω, L=2 mH y C= 5 µF, encuentre la respuesta en el tiempo de iL (t) en función de la entrada (RESE). Suponga que los estados son la corriente en el inductor y la tensión en el capacitor. Grafique la respuesta temporal del sistema si la entrada es un escalón de magnitud 10 a partir de t = 0 s y los estados iniciales son iguales a cero. Solución: En un caso como este, lo primero que hay que hacer es escribir todas las relaciones Escuela de Ingeniería Eléctrica Universidad de Costa Rica 39 L i1 iL Vin R1 C R2 Figura 2.6: Figura del ejercicio 2.2. que rigen la dinámica del circuito. A partir de los modelos de los elementos se tiene: vR1 (t) = R1 i1 (t), vR2 (t) = R2 iL (t), diL (t) , vL (t) = L dt dvc (t) iC (t) = C . dt (2.14a) (2.14b) (2.14c) (2.14d) Las ecuaciones que se obtienen a partir del análisis de nodos y mallas son: vR1 (t) − Vin (t) − vC (t) = 0, vC (t) − VL (t) − vR2 (t) = 0, −i1 (t) − iL (t) − iC (t) = 0. (2.15a) (2.15b) (2.15c) Introduciendo (2.14c) y (2.14b) en (2.15b) se obtiene: −R2 1 diL (t) = iL (t) + vc (t). dt L L (2.16) Introduciendo (2.14a) en (2.15a) se obtiene una expresión para i1 que luego es introducida en (2.15c) y luego en (2.14d) para obtener: dvC (t) −1 1 1 = Vin (t) − vC (t) − iL (t). dt CR1 CR1 C (2.17) Las ecuaciones 2.16 y 2.17 son importantes porque modelan la variación de los estados del sistema en función de los estados y las entradas. Para la RES, lo que se necesita es una ecuación diferencial que solo depende de la entrada y la salida. A Escuela de Ingeniería Eléctrica Universidad de Costa Rica 40 partir de (2.15b), se sustituye la expresión de vR2 , se despeja vc y se procede a derivar ambos lados para obtener: diL (t) d2 iL (t) dvC (t) = R2 +L . (2.18) dt dt dt2 Esta expresión luego se introduce en (2.17) para obtener la RES: d2 iL (t) L diL (t) 1 R2 1 L + R2 + + + 1 iL (t) + Vin (t) = 0. (2.19) dt CR1 dt C R1 CR1 Se obtiene al final una ecuación diferencial lineal de segundo orden. Se debe hacer un comentario en este punto: el orden de la ecuación siempre estará asociado a elementos almacenadores de energía independientes, es decir, si un sistema tiene n elementos almacenadores de energía independientes, entonces su ecuación diferencial tendrá orden n. En el caso de este ejemplo, puesto que contamos con un capacitor y un inductor, el orden de la ecuación diferencial es dos. Para obtener la RESE, se procede a encontrar una relación entre la salida y los estados. Si se resuelve (2.19), entonces al final, nuestros estados vendrán dados por la corriente iL y su derivada 2 . Para que la tensión del capacitor y la corriente del inductor sean los estados, es mejor proceder a resolver las ecuaciones (2.16) y (2.17) al mismo tiempo. Al aplicar la transformada de Laplace a (2.16) se obtiene: −R2 1 sIL (s) − iL (0) = IL (s) + VC (s). (2.20) L L Igualmente, al aplicar la transformada a (2.17) se obtiene: −1 1 1 sVC (s) − vC (0) = Vin (s) − VC (s) − IL (s), CR1 CR1 C CR1 1 R1 VC (s) = vC (0) − Vin (s) − IL (s). (2.21) CR1 s + 1 CR1 s + 1 CR1 s + 1 Introduciendo (2.21) en (2.20) y despejando para I(s) se obtiene: L(CR1 s + 1) i(0) (CR1 s + 1)(Ls + R2 ) + R1 CR1 + vC (0) (CR1 s + 1)(Ls + R2 ) + R1 1 − Vin (s). (CR1 s + 1)(Ls + R2 ) + R1 I(s) = (2.22) 2 Esto se puede observar puesto que, resolviendo con la transformada de Laplace, la segunda 2 derivada queda L { ddti2L } = s2 IL (s) − siL (0) − i̇L (0), por lo que al final, iL (0) e i̇L (0) serán los estados. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 41 Esta ecuación representa la transformada de Laplace de la RESE, con los estados definidos como la corriente inicial en el inductor y la tensión inicial en el capacitor. Cambiando los parámetros por los valores numéricos indicados en el enunciado del ejemplo, se llega a: 1 × 10−7 s + 2 × 10−3 i(0) 1 × 10−7 s2 + 2,5 × 10−3 s + 20 50 × 10−6 + v(0) 1 × 10−7 s2 + 2,5 × 10−3 s + 20 1 + Vin (s). −7 2 1 × 10 s + 2,5 × 10−3 s + 20 I(s) = (2.23) Para obtener la transformada de Laplace inversa, lo mejor es dejar los términos en una forma conocida primero. Para ello, lo primero que se hace es completar cuadrados en los denominadores de manera que: 1 × 10−7 s2 + 2,5 × 10−3 s + 20 = 1 × 10−7 (s + 12500)2 + 43,75 × 106 . En el caso del término que multiplica a i(0) se procede como sigue: 1 × 10−7 s + 2 × 10−3 s + 2 × 104 i(0) = i(0) 1 × 10−7 s2 + 2,5 × 10−3 s + 20 (s + 12500)2 + 43,75 × 106 ! s + 12500 7,5 × 103 = + i(0) (s + 12500)2 + 43,75 × 106 (s + 12500)2 + 43,75 × 106 ! 6,6143 × 103 s + 12500 + 1,134 i(0) = (s + 12500)2 + 43,75 × 106 (s + 12500)2 + 43,75 × 106 Al aplicar la transformada inversa de Laplace, se obtiene: e−12500t cos (6614,4t) + 1,134e−12500t sen (6614,4t) i(0) ⇒ e−12500t (cos (6614,4t) + 1,134 sen (6614,4t)) i(0) ⇒ e−12500t (1,512 sen (6614,4t + 0,7227)) i(0) La última expresión se obtiene a partir de la igualdad: a sen(ωt) + b cos(ωt) = Escuela de Ingeniería Eléctrica √ b a2 + b2 sen ωt + arctan a !! . Universidad de Costa Rica 42 El resto de los términos se obtienen de manera similar. Cuando se han transformado todos, obtenemos la expresión de la RESE en el dominio del tiempo: i(t) = 1,1512e−12500t sen (6614t + 0,7227)i(0) + 76 × 10−3 e−12500t sen (6614t)v(0) − 1511,86 Z t 0 (2.24) e−12500(t−τ ) sen (6614(t − τ )) Vin (τ ) dτ . Si la entrada es un escalón de magnitud 10, bastaría con cambiar Vin = 10 y resolver la integral. Sin embargo, como lo que se desea es la gráfica de la respuesta y no su expresión analítica, se puede utilizar las ecuaciones (2.16) y (2.17) y los comandos ss y step de MATLAB para obtener la respuesta. Estas dos ecuaciones representan el modelo en variables de estado que se estudiará más adelante. La respuesta se presenta en la Figura 2.7. Corriente en el inductor 0 Corriente (mA) −10 −20 −30 −40 −50 −60 0 100 200 300 Tiempo (µ s) 400 500 Figura 2.7: Respuesta del sistema del ejemplo 2.2, ante una entrada escalón de magnitud 10 con condiciones iniciales (estados) iguales a cero. 2.3. Modelado en variables de estado 2.3.1. Ecuación de estados y salidas En las secciones anteriores se han estudiado dos maneras distintas de describir un sistema: con una relación solo de las entradas y las salidas (la RES) o con una Escuela de Ingeniería Eléctrica Universidad de Costa Rica 43 expresión de la salida con respecto a la entrada y los estados (RESE). Existe una tercera formulación que resulta muy conveniente para el análisis de sistemas: el modelo en variables de estado (MVE). Los estados de un sistema de orden n (n estados) y p entradas se pueden modelar con n ecuaciones de la forma: dxi (t) = fi (x1 (t), x2 (t), . . . , xn (t), u1 (t), u2 (t), . . . up (t)) , dt (2.25) para i = 1, . . . , n, xi (t) el i-ésimo estado y ui (t) la i-ésima entrada. Este conjunto de n ecuaciones se puede escribir en forma matricial con x(t) = [x1 (t), x2 (t), . . . , xn (t)]T el vector de estados y u(t) = [u1 (t), u2 (t), . . . , up (t)]T el vector de entradas: ẋ(t) = f (x(t), u(t)), (2.26) ẋ(t) es un vector que representa la derivada con respecto al tiempo de cada elemento del vector de estados. A (2.26) se le conoce como ecuación de estados, y muestra la variación de los estados con respecto a sus valores actuales, las entradas y el tiempo. Hay que notar que la función f es una función matricial que además puede ser no lineal y variante en el tiempo. No siempre la salida del sistema es igual a uno de los estados, sino que dependen del valor de los estados y las entradas. En un sistema con q salidas, esta dependencia se puede expresar de la forma: yj (t) = gj (x1 (t), . . . , xn (t), u1 (t), . . . , up (t)) , (2.27) donde j = 1, . . . , q. Esta ecuación también se puede escribir en notación matricial, definiendo el vector de salida y(t) = [y1 (t), y2 (t), . . . , yq (t)]T : y = g (x, u) , (2.28) esta sería entonces la ecuación de salida del sistema. Ahora bien, si el sistema es lineal e invariante en el tiempo, estas dos ecuaciones se convierten en: ẋ(t) = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t), (2.29) donde A es una matriz de dimensión n × n, B es una matriz de dimensión n × p, Escuela de Ingeniería Eléctrica Universidad de Costa Rica 44 C es una matriz de dimensión q × n, D es una matriz de dimensión q × p. Es importante notar que el MVE no es único, puesto que dependerá de los estados que se elijan para representar el sistema. Es más, es posible que estos estados no representen ninguna variable física del sistema, sino que solo sean construcciones matemáticas para modelar el sistema. Aún así, aunque el MVE no sea único, cualquier MVE debe conllevar a la misma RESE. Un MVE, deberá cumplir las siguientes condiciones (Domínguez et al., 2006): En la ecuación de estado solo pueden estar relacionadas las variables de estado, sus primeras derivadas y las entradas. En la ecuación de salida solo pueden estar relacionadas las variables de estado, las entradas y las salidas. Las variables de estado no pueden presentar discontinuidades. Las entradas sí pueden tener discontinuidades, por lo que una entrada no puede considerarse nunca como estado. 2.3.2. Elección de las variables de estado Existen algunos criterios estándar para elegir las variables de estado de un Modelo en Variables de Estado (Domínguez et al., 2006). Dependiendo de las variables de estado que se elijan, así serán las matrices del MVE. Es posible tener varios MVE para un mismo sistema, incluso, es posible que estos distintos MVE tengan diferente número de estados. Las variables de estado representan magnitudes físicas del sistema En este caso, para las variables de estado se eligen variables reales del sistema físico que estén asociadas a los elementos almacenadores de energía. Esto garantiza que las variables de estado no presentarán discontinuidades, puesto que no es posible que un elemento transmita toda su energía instantáneamente, sino que debe hacerlo de una manera continua. Para los sistemas eléctricos, se suele elegir como variables de estado la tensión de los capacitores y la corriente de los inductores. En sistemas mecánicos la posición de las masas y su velocidad suelen elegirse como variables de estado. Para el caso de los sistemas hidráulicos la altura de los fluidos es una variable de estado que está Escuela de Ingeniería Eléctrica Universidad de Costa Rica 45 Figura 2.8: Sistema del ejemplo 2.3. asociado con la energía (potencial) del sistema. En sistemas térmicos la temperatura de los elementos que se están estudiando funcionan como variables de estado. Ejemplo 2.3 Encontrar el modelo en variables de estado del sistema de la Figura 2.8 si los estados son las tensiones de los capacitores C1 y C2 y la corriente del inductor L1 , las entradas son vin e iin y las salidas son las corrientes i1 e i5 . Solución: A partir del circuito se obtienen las siguientes ecuaciones: De los modelos de los elementos: vR1 = R1 i1 , vR2 = R2 i3 , vR3 = R3 i5 , dvC1 , i2 = C1 dt dvC2 i4 = C2 , dt di3 vL1 = L1 . dt (2.30a) (2.30b) (2.30c) (2.30d) (2.30e) (2.30f) De la ley de lazos: vC1 Escuela de Ingeniería Eléctrica vin − vR1 − vC1 = 0, − vL1 − vR2 − vC2 = 0, vC2 − vR3 = 0. (2.31a) (2.31b) (2.31c) Universidad de Costa Rica 46 De la ley de nodos: i1 − i2 − i3 = 0, i3 − i4 − i5 + iin = 0. (2.32a) (2.32b) A partir de la ecuación (2.31b) e introduciendo (2.30f) y (2.30b) se obtiene: di3 −R2 1 1 = i3 + vC1 − vC2 . dt L1 L1 L1 (2.33) Como se puede observar, la derivada de la corriente del inductor está dada en función del valor actual de los estados y los parámetros del sistema. Para obtener la expresión para el estado vC1 , se procede de la siguiente manera: se despeja i2 en (2.32a), y cambiando el valor de i1 por el que se obtiene a partir de (2.31a) y (2.30a), se obtiene una ecuación de i2 en función de las entradas y los estados. Este resultado se puede sustituir en (2.30d) para obtener: dvC1 −1 1 1 = i3 − vC1 + vin . dt C1 R1 C1 R1 C1 (2.34) Se puede realizar un procedimiento semejante para la ecuación de vC2 . Se despeja i5 a partir de (2.30c) y se introduce en (2.32b) para obtener una expresión de i4 en función de las entradas y los estados. Luego esto se introduce en (2.30e) para obtener: 1 1 dvC2 1 = i3 − vC2 + iin . dt C2 R3 C2 C2 (2.35) Las expresiones para las salidas, se obtienen fácilmente a partir de las ecuaciones (2.31a) y (2.30a) para i1 y a partir de (2.30c) y (2.31c) para i5 , de esta manera: −1 1 vC1 + vin , R1 R1 1 i5 = vC . R3 2 i1 = (2.36) Ya se tienen todas las ecuaciones necesarias para obtener el modelo en variables de estado, se definen los vectores de estado, entradas y salidas como x = [i3 , vC1 , vC2 ]T , u = [vin , iin ]T y y = [i1 , i5 ]T . De esta manera, el modelo en variables de estado queda: ẋ = 1 C2 " y= 1 L1 −1 R 1 C1 −R2 L −11 C1 0 0 Escuela de Ingeniería Eléctrica −1 L1 0 0 −1 R1 0 0 1 R3 −1 R 3 C2 # 1 x + R 1 C1 0 " x+ 0 1 R1 0 0 0 0 0 u, 1 C2 (2.37) # u. Universidad de Costa Rica 47 Variables de estado como salida de los integradores La idea de esta opción es definir las variables de estado como las condiciones iniciales de las ecuaciones dinámicas del sistema (RES). Lo que se hace es expresar las ecuaciones como integraciones sucesivas y elegir la salida de estas integraciones como las variables de estado. Introduciendo el operador diferencial p que viene definido por: dk , dtk pk = (2.38) es decir: df (t) . dt De esta manera es posible escribir la RES dada por: pf (t) = dn y dn−1 y dy dn u du + an−1 n−1 + . . . + a1 + a0 y = bn + . . . + b1 + b0 u, n dt dt dt dt dt como: pn + an−1 pn−1 + . . . + a1 p + a0 y = bn pn + bn−1 pn−1 + . . . + b1 p + b0 u. (2.39) Para ir obteniendo las ecuaciones de los estados se procede de la siguiente manera: Primero se saca a factor común una de las p: h i pn−1 + an−1 pn−2 + . . . + a1 y − bn pn−1 + bn−1 pn−2 + . . . + b1 u = b0 u − a0 y. (2.40) Todo lo que está dentro del paréntesis cuadrado se puede tomar entonces como el primero de los estados, de manera que: p ẋ1 = b0 u − a0 y, x1 = p n−1 (2.41) + an−1 p n−2 + . . . + a1 y − b n p n−1 + bn−1 p n−2 + . . . + b1 u. (2.42) Luego se procede a hacer nuevamente el mismo proceso, pero con la ecuación (2.42): p h pn−2 + an−1 pn−3 + . . . + a2 y i − bn pn−2 + bn−1 pn−3 + . . . + b2 u = x1 + b1 u − a1 y, Escuela de Ingeniería Eléctrica (2.43) Universidad de Costa Rica 48 entonces se elige la nueva variable de estado como el término que está entre paréntesis: ẋ2 = x1 + b1 u − a1 y, (2.44) x2 = pn−2 + an−1 pn−3 + . . . + a2 y − bn pn−2 + bn−1 pn−3 + . . . + b2 u. De forma genérica: (2.45) ẋi = xi−1 + bi−1 u − ai−1 y. (2.46) Este proceso se sigue hasta obtener las ecuaciones finales: ẋn = xn−1 + bn−1 u − an−1 y, xn = y − bn u. (2.47) (2.48) Con la ecuación (2.48) se obtiene la expresión para la salida y = xn + bn u. Esto se sustituye en todas las definiciones de los estados, de manera que: ẋ1 = −a0 xn + (b0 − bn a0 )u, para i = 1, ẋi = xi−1 − ai−1 xn + (bi−1 − bn ai−1 )u, para 1 < i ≤ n, (2.49) (2.50) que escrito de la forma matricial, con x = [x1 , x2 , . . . , xn ]T toma la forma general: ẋ = y= h 0 0 ··· 1 0 ··· 0 1 ··· .. .. . . . . . 0 0 ··· 0 ... 0 0 0 0 .. . −a0 −a1 −a2 .. . 1 −an−1 1 i x + b 0 − b n a0 b 1 − b n a1 b 2 − b n a2 .. . bn−1 − bn an−1 u, (2.51) x + bn u. Esta misma idea se puede extender para el caso en que se tengan múltiples entradas y múltiples salidas. Variables de estado de fase Existe una manera alternativa de obtener el MVE desde la RES. Si se parte de la expresión genérica con el operador p: pn + an−1 pn−1 + . . . + a1 p + a0 y = bm pm + bm−1 pm−1 + . . . + b1 p + b0 u. (2.52) Escuela de Ingeniería Eléctrica Universidad de Costa Rica 49 Esta ecuación se puede reescribir de la forma: y= bm p m + . . . + b 1 p + b0 u. pn + an−1 pn−1 + . . . + a1 p + a0 (2.53) Luego, lo que se hace es dividir el sistema de la siguiente forma: bm p m + . . . + b1 p + b0 y x1 = . n n−1 p + an−1 p + . . . + a1 p + a0 x1 u de manera que: x1 = pn + an−1 pn−1 1 u, + . . . + a1 p + a0 (2.54) y la salida se escribe como: y = (bm pm + . . . + b1 p + b0 ) x1 . (2.55) La ecuación (2.54) es precisamente la definición del primer estado del sistema. Si se definen los otros estados como las derivadas sucesivas de x1 de manera que: x2 = ẋ1 , x3 = ẋ2 = x¨1 , ... (2.56) 0 (n−1) xn = ẋn−1 = x1 . Entonces a partir de (2.54), se puede obtener una expresión para xn : pn + an−1 pn−1 + . . . + a1 p + a0 x1 = u, (2.57) ẋn + an−1 xn + . . . + a1 x2 + a0 x1 = u, es decir ẋn = −a0 x1 − a1 x2 − . . . − an−1 xn + u. Escrito en forma matricial queda de la forma: ẋ = 0 0 0 .. . 0 −a0 Escuela de Ingeniería Eléctrica 1 0 0 .. . 0 −a1 0 1 0 .. . 0 −a2 0 0 1 .. . 0 −a3 ··· ··· ··· .. . ··· ... 0 0 0 .. . 1 −an−1 x + 0 0 0 .. . 0 1 u. (2.58) Universidad de Costa Rica 50 Para el caso de la ecuación de salida, se dan dos casos. Si m < n, a partir de la ecuación (2.55): y= h b0 b1 ··· b2 0 ··· bm 0 i (2.59) x. En el caso de que n = m, queda un término de la forma pn x1 = ẋn entonces se debe introducir la expresión para ẋn en la ecuación que define y. Una vez que se realizan las operaciones el resultado es: y = (b0 − bn a0 ) x1 + (b1 − bn a1 ) x2 + . . . + (bn−1 − bn an−1 ) xn + bn u. (2.60) Variables de Jordan Como se ha visto, la elección de las variables de estado depende de las necesidades del modelo que se está trabajando. Con el método de las variables de Jordan, la elección de las variables de estado busca simplificar la forma matemática de las matrices del MVE, de manera que la matriz A sea “lo más diagonal posible”. Si se parte de la forma racional de la RES utilizando el operador p (es decir, como en la ecuación (2.53)), es posible escribirla utilizando fracciones parciales. Se encuentran dos casos: Todos los polos de la ecuación son simples. En este caso, el sistema se puede escribir de la forma: ! ρ1 ρ2 ρn y = bn + + + ... + u. p − λ1 p − λ2 p − λn (2.61) Una vez que se tiene en esta forma, se procede a asignar cada uno de estos componentes a una variable de estado de manera que: x1 = x2 = 1 u p−λ1 1 u p−λ2 ⇒ ẋ1 = λ1 x1 + u, ⇒ ẋ2 = λ2 x2 + u, ··· 1 xn = p−λn u ⇒ ẋn = λn xn + u, de esta manera, se puede escribir el sistema como: Escuela de Ingeniería Eléctrica ẋ = y= h λ1 0 .. . 0 ρ1 0 λ2 .. . 0 ρ2 ··· ··· ... 0 0 .. . ··· λn ··· ρn x + i 1 1 .. . 1 x + bn u. u, (2.62) (2.63) Universidad de Costa Rica 51 Existe al menos un polo con multiplicidad r. En este caso, la descomposición en fracciones parciales queda de la forma: ρ1 ρr−1 ρr + ··· + + r 2 (p − λ1 ) (p − λ1 ) p − λ1 ! ρn ρr+1 u. + ··· + + p − λr+1 p − λn y = bn + (2.64) Entonces, en este caso, la asignación de variables queda: 1 u p−λn xn = ⇒ ··· xr+1 = p−λ1r+1 u ⇒ 1 ⇒ xr = (p−λ1 ) u 1 1 xr−1 = (p−λ1 )2 u = p−λ1 xr ⇒ ··· 1 1 x2 = (p−λ1 )r−1 u = p−λ1 x3 ⇒ 1 x1 = (p−λ1 1 )r u = p−λ x2 ⇒ 1 ẋn = λn xn + u, ẋr+1 = λr+1 xr+1 + u, ẋr = λ1 xr + u, ẋr−1 = λ1 xr−1 + xr ẋ2 = λ1 x2 + x3 , ẋ1 = λ1 x1 + x2 . De esta manera, el MVE se puede escribir de la forma: ẋ = 1 λ1 .. . λ1 0 .. . 0 0 0 .. . 0 0 0 .. . 0 0 ··· ··· .. . 0 0 .. . ··· ··· ··· .. . λ1 0 0 .. . ··· 0 0 0 .. . 1 λ1 0 .. . 0 0 0 .. . ··· ··· .. . λr+1 .. . ··· ··· ··· .. . 0 0 0 .. . ··· λn 0 0 0 0 0 .. . x + 0 0 .. . 0 1 1 .. . 1 u, (2.65) y la ecuación de salida vendría dada simplemente por: y= 2.3.3. h ρ1 ρ2 ··· ρr−1 ρr ρr+1 ··· ρn i x + bn u. (2.66) Respuesta a entrada cero y respuesta a estado cero Una vez que se tiene el modelo en variables de estado, el paso siguiente consiste en obtener la solución de sus ecuaciones diferenciales. Normalmente, este apartado Escuela de Ingeniería Eléctrica Universidad de Costa Rica 52 se estudia en dos partes. Primero se estudia la solución de la ecuación homogénea, es decir, con entradas iguales a cero. A esta solución se le conoce con el nombre de respuesta a entrada cero. La metodología que se sigue en esta parte corresponde a la que se presenta en Ogata (2003) y Kuo (1996). Primero se analiza el caso escalar, con una ecuación del tipo: ẋ = ax, (2.67) lo que se puede hacer es suponer una solución de la forma: x(t) = b0 + b1 t + b2 t2 + . . . + bk tk + . . . (2.68) Introduciendo esta solución en la ecuación original, se llega a que: b1 + 2b2 t + . . . + kbk tk−1 (2.69) = a(b0 + b1 t + b2 t2 + . . . + bk tk ), reuniendo los coeficientes que multiplican al mismo grado de t se obtiene: b1 = ab0 , 1 1 b2 = ab1 = a2 b0 , 2 2 1 1 b3 = ab2 = a3 b0 , 3 6 ... 1 1 bk = abk−1 = ak b0 . k k! Si se supone condiciones iniciales iguales a x(0) en t = 0, queda que b0 = x(0) entonces la solución completa queda: 1 1 x(t) = 1 + at + a2 t2 + · · · + ak tk + . . . x(0), 2 k! at = e x(0). (2.70) Claramente la respuesta (2.70) es solución de la ecuación diferencial original. Este mismo procedimiento se puede generalizar para el caso matricial. Si se tiene la ecuación: ẋ = Ax. (2.71) Escuela de Ingeniería Eléctrica Universidad de Costa Rica 53 Se puede suponer una respuesta del tipo: x(t) = b0 + b1 t + b2 t2 + . . . + bk tk + . . . (2.72) Siguiendo el procedimiento anterior, se llega a las relaciones: b1 = Ab0 , 1 1 b2 = Ab1 = A2 b0 , 2 2 1 1 b3 = Ab2 = A3 b0 , 3 6 ... 1 1 bk = Abk−1 = Ak b0 . k k! De igual manera, se tiene que b0 = x0 , con lo que se llega a: 1 1 x(t) = I + At + A2 t2 + · · · + Ak tk + . . . x(0). 2 k! (2.73) Como la expresión en paréntesis es prácticamente igual a la expansión de eat , pero matricial, se le da el nombre de matriz exponencial y se denota como eAt : eAt = ∞ X Ak tk , k=0 k! (2.74) de manera que la solución de la ecuación es entonces: x(t) = eAt x(0). (2.75) Propiedades de la matriz exponencial Muchas de las propiedades de la matriz exponencial recuerdan las propiedades de la función exponencial escalar: 1. eA0 = I. 2. d At e dt = AeAt . 3. eA(t+s) = eAt eAs . 4. La inversa de eAt es igual a e−At . 5. e(A+B)t = eAt eBt si y solo si AB = BA. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 54 Forma cerrada de la matriz exponencial Existe una manera de calcular la matriz exponencial sin necesidad de recurrir a la serie infinita que la define. Aplicando la transformada de Laplace sobre la ecuación homogénea: L {ẋ(t)} = L {Ax(t)} , sX(s) − x(0) = AX(s), (sI − A) X(s) = x(0), X(s) = (sI − A)−1 x(0). Al aplicar la transformada inversa, se obtiene que: x(t) = L −1 {(sI − A)−1 }x(0). (2.76) Al comparar (2.76) con (2.75) se llega a la conclusión que: eAt = L −1 {(sI − A)−1 }, (2.77) lo que da una forma cerrada de calcular la matriz exponencial y evitar recurrir a la serie infinita. Matriz de transición de estados Se le llama matriz de transición de estados a la matriz Φ(t) de dimensión n × n que es solución de la ecuación de estados homogénea: tal que, ẋ(t) = Ax(t), (2.78) x(t) = Φ(t)x(0), (2.79) y además es solución única de: Φ̇(t) = AΦ(t), Φ(0) = I. La matriz exponencial cumple todos estos requisitos y por lo tanto, puede ser vista como una matriz de transición de estados, de manera que: n o Φ(t) = eAt = L −1 (sI − A)−1 , (2.80) Φ(t) es una matriz variable en el tiempo, que realiza una transformación lineal de los estados iniciales hasta el estado en el instante t cuando las entradas son nulas y el sistema evoluciona solamente como producto de su estado inicial. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 55 Propiedades de la matriz de transición de estados Φ(0) = I. Φ−1 (t) = Φ(−t). Φ(t1 + t2 ) = Φ(t1 )Φ(t2 ). [Φ(t)]n = Φ(nt). Φ(t2 − t1 )Φ(t1 − t0 ) = Φ(t2 − t0 ). Si A es diagonal y tiene n valores propios distintos λ1 , λ2 ,. . .,λn entonces: Φ(t) = eλ1 t 0 .. . .. . 0 0 eλ2 t .. . .. . ··· 0 0 ... .. . ··· ··· ··· .. . .. . ··· 0 0 .. . .. . eλn t . Si se observa cuidadosamente cuando se tiene un sistema del tipo ẋ = Ax, lo que se tiene es la descripción de un campo vectorial que muestra la variación del estado en función de su valor. Si se dibuja el vector ẋ en un plano, donde los ejes son precisamente los estados del sistema, tendremos un campo vectorial como el que se muestra en la Figura 2.9. En esta figura, las flechas representan el valor de ẋ para cada uno de los valores de x, si el sistema viene dado por: " ẋ = −1 2 −4 −3 # x. La línea continua, representa la trayectoria de los estados desde su estado inicial [−4, −4]T . Como el sistema es lineal e invariante con el tiempo (LTI, por sus siglas en inglés) y además es estable 3 , ante una entrada cero, el sistema terminará en el estado cero cuando t → ∞. Sin embargo la trayectoria que siga estará determinada por la dinámica del sistema (en este caso, la matriz A). También se puede dibujar la trayectoria temporal que seguirá el sistema, tal y como se muestra en la Figura 2.10. Esta respuesta viene dada por la matriz Φ(t). 3 Más adelante se estudiará la idea de estabilidad de los sistemas lineales. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 56 Respuesta a entrada cero de un sistema 6 4 x2 2 0 −2 −4 −6 −6 −4 −2 0 x1 2 4 6 Figura 2.9: Diagrama de fase de un sistema. 3 Respuesta temporal a una entrada cero x1 2 x2 1 Amplitud 0 −1 −2 −3 −4 −5 0 1 2 3 4 5 tiempo (s) Figura 2.10: Respuesta temporal. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 57 La respuesta completa del sistema se puede obtener también en función de la matriz de transición de estados. Partiendo de: ẋ(t) = Ax(t) + Bu(t), (2.81) al aplicar la transformada de Laplace a (2.81) se obtiene la siguiente respuesta en el plano complejo s: X(s) = (sI − A)−1 x(0) + (sI − A)−1 BU(s). (2.82) Al aplicar las transformada inversa se llega a: x(t) = Φ(t)x(0) + Z t 0 Φ(t − τ )Bu(τ ) dτ . (2.83) Y en el caso de que el instante inicial sea diferente de cero, la expresión cambia como: Z t x(t) = Φ(t − t0 )x(t0 ) + Φ(t − τ )Bu(τ ) dτ , (2.84) t0 para cualquier tiempo inicial t0 . Si la salida del sistema en el dominio de Laplace está dada por: Y(s) = CX(s) + DU(s). (2.85) Al sustituir (2.82) en esta última expresión, la salida queda: Y(s) = C (sI − A)−1 x(0) + C (sI − A)−1 B + D U(s). (2.86) Al aplicar la transformada inversa de Laplace, se llega a: y(t) = CΦ(t)x(0) + Z t 0 (CΦ(t − τ )B + Dδ(t − τ )) u(τ ) dτ . (2.87) (CΦ(t − τ )B + Dδ(t − τ )) u(τ ) dτ , (2.88) Y si t0 es diferente de cero: y(t) = CΦ(t − t0 )x(t0 ) + Z t t0 para todo t ≥ t0 . Nótese que esta expresión es igual a la RESE del sistema obtenido a partir del MVE. En caso de que el estado sea igual al estado cero, la integral de (2.87), sería entonces igual a la respuesta a estado cero del sistema. Es interesante notar que la respuesta a entrada cero y la respuesta a estado cero se pueden calcular de manera independiente y luego sumarse para obtener la respuesta completa. A esta propiedad se le llama Escuela de Ingeniería Eléctrica Universidad de Costa Rica 58 propiedad de descomposición, es decir, si la RESE del sistema viene dada por Ŝ(x(t0 ), ū): Ŝ(x(t0 ), ū) = Ŝ(x(t0 ), 0) + Ŝ(θ, ū) ∀ū ∈ Rn , ∀x(t0 ) ∈ Σ, (2.89) donde x(t0 ) es el estado inicial, θ es el estado cero del sistema, Σ es el espacio de estados y u(t) es la entrada del sistema. La respuesta a estado cero tiene otra propiedad interesante si se estudia directamente desde la RESE (Loría y Mazón, 1989). Si se supone un sistema S de una entrada y una salida, con una RESE Ŝ(x(t0 ), ū) y que originalmente se encuentra en su estado cero, (2.87) se puede escribir de forma general como: yθ (t) = Z t 0 h(t − τ )u(τ ) dτ . (2.90) Si se supone que la entrada es igual a la función Delta de Dirac4 u(t) = δ(t), se obtiene: Z t h(t − τ )δ(τ ) dτ . (2.91) y(t) = 0 Aplicando la transformada de Laplace se llega a: L {y(t)} = L Z t 0 h(t − τ )δ(τ ) dτ , Y (s) = H(s)L {δ(t)} , Y (s) = H(s), y por lo tanto, h(t) es igual a la respuesta del sistema ante una entrada impulsiva con condiciones iniciales iguales a cero. De acá se desprenden dos conclusiones importantes: Tomando en cuenta (2.87), es claro que la respuesta al impulso de un sistema sólo depende de sus parámetros, y por lo tanto, la respuesta al impulso es como una “huella” que caracteriza completamente al sistema. Al tomar en cuenta (2.90) para cualquier entrada u(t), se concluye que “la respuesta a estado cero de un modelo lineal se determina como la convolución de la entrada y su respuesta impulsional” (Loría y Mazón, 1989). 4 Esta función se define como: +∞ R −∞ Escuela de Ingeniería Eléctrica δ(τ )u(τ ) dτ = u(0), con δ(t) = 0, ∀t 6= 0, donde +∞ R δ(τ ) dτ = 1. −∞ Universidad de Costa Rica 59 2.4. La función de transferencia 2.4.1. Definición de función de transferencia La función de transferencia es otra manera de modelar los sistemas físicos. Se define como la transformada de Laplace de la salida del sistema dividida por la transformada de Laplace de la señal de entrada suponiendo condiciones iniciales nulas: G(s) = Y (s) , U (s) (2.92) donde Y (s) = L {y(t)} y U (s) = L {u(t)} con las condiciones iniciales iguales a cero. Si se supone un sistema lineal dado por: dn y(t) dn−1 y(t) dy(t) + a + . . . + a1 + a0 y(t) n−1 n n−1 dt dt dt dm u(t) dm−1 u(t) du(t) = bm + b + . . . + b + b0 u(t), m−1 1 dtm dtm−1 dt (2.93) entonces, aplicando la transformada de Laplace a ambos lados de la igualdad considerando condiciones iniciales iguales a cero, se obtiene sn + an−1 sn−1 + · · · + a1 s + a0 Y (s) = bm sm + bm−1 sm−1 + · · · + b1 s + b0 U (s). (2.94) Con lo que la función de transferencia vendría dada por: G(s) = p(s) bm sm + bm−1 sm−1 + · · · + b1 s + b0 Y (s) = = . U (s) q(s) sn + an−1 sn−1 + · · · + a1 s + a0 (2.95) La variable s, es una variable compleja que está relacionada con la frecuencia del sistema, como se verá en capítulos posteriores. Normalmente, las componentes de s se escriben como: s = σ + jω. A grandes rasgos, se dice que ω está relacionada con la oscilación de la respuesta del sistema, mientras que σ está relacionada con su amortiguamiento. Las propiedades de la función de transferencia son (Kuo, 1996): Solo está definida para sistemas lineales e invariantes en el tiempo. Las condiciones iniciales siempre son iguales a cero. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 60 Es independiente de la entrada del sistema. La información del cambio de unidades entre la entrada y la salida ya está incluida en la función de transferencia, aunque se pierden los detalles físicos del sistema. Solo depende de la variable s, es decir, no tiene ninguna dependencia del tiempo. Una función de transferencia es estrictamente propia si el grado del polinomio p(s) es menor que el grado del polinomio q(s), es decir m < n. Si m = n, se dice que la función de transferencia es propia. Si se tiene que m > n, la función de transferencia es impropia, lo que implica además que el sistema no es físicamente realizable. 2.4.2. La función de transferencia a partir de la respuesta a estado cero Supóngase que la respuesta a estado cero viene dada por (2.90), que se repite a continuación por comodidad: yθ (t) = Z t 0 h(t − τ )u(τ ) dτ . Al aplicar la transformada de Laplace a ambos lados, se obtiene que: Y (s) = H(s)U (s), con lo que se llega a que: G(s) = Y (s) = H(s). U (s) (2.96) (2.97) Este es un resultado muy importante, pues la ecuación (2.97) implica que la función de transferencia es igual a la transformada de Laplace de la respuesta al impulso del sistema. Aún más, si se conoce la función de transferencia, es posible obtener la respuesta del sistema ante cualquier entrada conocida, puesto que la salida será la multiplicación de la función de transferencia por la transformada de Laplace de la entrada. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 61 2.4.3. La ecuación característica del sistema Se le llama ecuación característica de un sistema, a la ecuación que surge de igualar el denominador de la función de transferencia a cero, es decir: q(s) = sn + an−1 sn−1 + · · · + a1 s + a0 = 0. (2.98) A las raíces de esta ecuación se les conoce como polos del sistema, y entre otras cosas, definen la estabilidad del sistema tal y como se mostrará en capítulos posteriores. La ecuación: p(s) = bm sm + am−1 sm−1 + · · · + b1 s + b0 = 0, (2.99) no recibe ningún nombre en particular, sin embargo, sus raíces son llamadas ceros del sistema. Ejemplo 2.4 3 2 Obtener los polos y los ceros del sistema dado por d dty(t) + 2 d dty(t) + 5 dy(t) + 6y(t) = 3 2 dt du(t) 3 dt + u(t). Graficar los polos y ceros en el plano complejo σ + jω. Solución: Primero se obtiene la función de transferencia correspondiente al sistema. Aplicando la transformada de Laplace a ambos lados de la igualdad tomando en cuenta condiciones iniciales iguales a cero, se obtiene: s3 Y (s) + 2s2 Y (s) + 5sY (s) + 6Y (s) = 3sU (s) + U (s). La función de transferencia vendría dada entonces por: G(s) = Y (s) 3s + 1 = 3 . U (s) s + 2s2 + 5s + 6 Los polos entonces se obtienen a partir de la ecuación s3 +2s2 +5s+6 = 0 y los ceros a partir de 3s + 1 = 0 Resolviendo numéricamente la primera ecuación, se obtienen los siguientes polos: p1 = −1,433, p2 = −0,283 + j2,027, p3 = −0,283 − j2,027. Con la segunda ecuación se obtiene un cero en z1 = −1/3. Como convención, se suele utilizar una x para representar los polos y un ◦ para representar los ceros. En la Figura 2.11 se muestra el gráfico de los polos y ceros del sistema siguiendo esta convención. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 62 Mapa de polos y ceros 2.5 2 Eje imaginario (j ω) 1.5 1 0.5 0 −0.5 −1 −1.5 −2 −2.5 −1.5 −1 −0.5 0 Eje real (σ) Figura 2.11: Mapa de polos y ceros para el ejemplo 2.4. 2.4.4. Función de transferencia para sistemas multivariables Hasta ahora, la función de transferencia se ha tratado para sistemas de una entrada y una salida. Si se tienen varias entradas, lo que se hace es sumar el efecto que tiene cada entrada sobre cada una de las salidas, es decir, lo que se hace es una superposición de las entradas. Por ejemplo, si en un sistema de varias entradas y una salida, se tiene que el efecto que tiene la entrada Ui (s) sobre la salida del sistema Y (s) viene dada por la función de transferencia Gi (s), entonces, la salida del sistema se calcula como la superposición del efecto de cada una de las entradas, es decir: Y (s) = G1 (s)U1 (s) + G2 (s)U2 (s) + · · · + Gn (s)Un (s), Y (s) = n X (Gi (s)Ui (s)). (2.100) i=1 Entonces, para un sistema con n entradas y m salidas, se deberán definir n × m funciones de transferencia. Esto se puede expresar en forma matricial de la siguiente manera: si las entradas se escriben como U(s) = [U1 (s), U2 (s), . . . , Un (s)]T y las salidas como Y(s) = [Y1 (s), Y2 (s), . . . , Ym (s)]T entonces la función de transferencia se transforma en una matriz de transferencia: Y(s) = G(s)U(s), Escuela de Ingeniería Eléctrica (2.101) Universidad de Costa Rica 63 con G(s) = G11 (s) G21 (s) .. . G12 (s) G22 (s) .. . ··· ··· .. . Gm1 (s) Gm2 (s) · · · G1n (s) G2n (s) .. . Gmn (s) . (2.102) En el caso de las funciones de transferencia dentro de la matriz, el término Gji (s) representa la función de transferencia entre la entrada Ui (s) y la salida Yj (s). 2.4.5. Circuitos eléctricos utilizando funciones de transferencia Con los circuitos eléctricos es posible obtener la función de transferencia directamente, utilizando para ello las ecuaciones de los elementos en el dominio de Laplace. Por ejemplo, tómese la ecuación de un resistor: vR (t) = RiR (t). Al aplicar la transformada de Laplace, se obtiene la relación: VR (s) = RIR (s). (2.103) Realizando esto mismo para el modelo de los inductores: diL (t) , ) (dt diL (t) , ⇒ L {vL (t)} = L L dt VL (s) = L (sIL (s) − iL (0)) . vL (t) = L Considerando condiciones iniciales iguales a cero se llega a: VL (s) = sLIL (s). (2.104) Como se puede notar, esta ecuación es prácticamente igual a la ecuación del resistor, pero con la salvedad que la “resistencia” es un valor complejo sL. Es más, de los cursos de análisis de circuitos lineales, se reconoce que si se cambia la variable s por s = jω, obtenemos la expresión conocida de la reactancia inductiva. Un resistor y un inductor en serie, tendrían una impedancia equivalente a R + sL o realizando el mismo cambio de variable R + jωL. Más adelante, se utilizará el cambio s = jω para analizar el comportamiento en frecuencia de los sistemas. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 64 Figura 2.12: Circuito para el ejemplo 2.5. Realizando el mismo procedimiento para el capacitor, se obtiene: dvC (t) , (dt ) dvC (t) ⇒ L {iC (t)} = L C , dt IC (s) = C (sVC (s) − vc (0)) . iC (t) = C Considerando de nuevo condiciones iniciales iguales a cero: IC (s) = sCVC (s), 1 IC (s). VC (s) = sC (2.105) 1 En este caso, la reactancia capacitiva vendría dada por sC . Las leyes de Kirchhoff permanecen iguales en el dominio de Laplace, así como las ecuaciones de las fuentes de tensión y de corriente. Ejemplo 2.5 Obtener la función de transferencia del circuito dado en la Figura 2.12 si la entrada es vin (t) y la salida es vout (t). Solución: En este caso, se procede directamente en el dominio de Laplace. Las ecuaciones del circuito serían las siguientes: VR (s) = RI(s), VL (s) = sLI(s), 1 Vout (s) = I(s), sC Escuela de Ingeniería Eléctrica Universidad de Costa Rica 65 de la ley de lazos: Vin (s) − VR (s) − VL (s) − Vout (s) = 0, introduciendo las ecuaciones de los elementos se llega a: Vin (s) − RI(s) − sLI(s) − Vout (s) = 0, Vin (s) − sRCVout (s) − s2 LCVout (s) − Vout (s) = 0, s2 LC + sRC + 1 Vout (s) = Vin (s). Por lo que la función de transferencia es igual a: 1 Vout (s) = 2 RLC Vin (s) s + Ls + 2.5. 1 LC . Relaciones entre los modelos matemáticos Como se ha visto a lo largo de este capítulo, existen diferentes maneras de pasar de un modelo a otro. En esta sección se sistematizan estas transformaciones y se presentan en forma resumida. 2.5.1. Partiendo de la RES Desde la RES es relativamente sencillo obtener cualquiera de los otros modelos. Por ejemplo, para obtener la RESE, simplemente lo que se hace es resolver la ecuación diferencial que define la RES para las condiciones iniciales dadas. Para obtener el MVE se utiliza alguna de las herramientas que se vieron en la sección 2.3.2, es decir, el método de los integradores puros, estados de fase o el método de Jordan. Y por último, para obtener la función de transferencia, se aplica la transformada de Laplace a la RES con condiciones iniciales iguales a cero y se obtiene la relación Y (s)/U (s). 2.5.2. Partiendo del MVE En el caso que se desee la RESE y se tenga el modelo en variables de estado, basta simplemente con encontrar la matriz de transición de estados como en (2.88) para Escuela de Ingeniería Eléctrica Universidad de Costa Rica 66 obtener la RESE directamente. En el caso de la función de transferencia, también se puede obtener directamente de la aplicación de la transformada de Laplace. Si se parte de la forma general del MVE: ẋ(t) = Ax(t) + Bu(t) y(t) = Cx(t) + Du(t). Al aplicar Laplace con condiciones iniciales iguales a cero se obtiene sX(s) = AX(s) + BU(s) Y(s) = CX(s) + DU(s). Así se obtiene una expresión para los estados en el dominio de Laplace: X(s) = (sI − A)−1 BU(s). (2.106) Al sustituir esta relación en la ecuación de salida se obtiene Y(s) = C (sI − A)−1 B + D U(s). (2.107) De esta manera es posible obtener la función de transferencia directamente desde el MVE G(s) = C (sI − A)−1 B + D . (2.108) Si lo que se desea es obtener la RES, lo que se debe hacer es obtener la transformada de Laplace inversa de (2.107) para cada uno de los componentes de y(t), con condiciones iniciales iguales a cero. Se debe dejar todo en función de las derivadas, es decir: dy(t) L −1 {sY (s)} = . (2.109) dt Hay que notar que cuando las condiciones iniciales son iguales a cero, el operador derivada p actúa igual que la variable compleja s en el dominio de Laplace. Ejemplo 2.6 Obtener la función de transferencia y la RES a partir del MVE " ẋ(t) = y= Escuela de Ingeniería Eléctrica h −1 5 −3 −2 1 0 i # " x(t) + 1 0 # u(t), x(t). Universidad de Costa Rica 67 Solución: A partir de (2.108), la función de transferencia se obtiene como G(s) = C (sI − A)−1 B, = h = h 1 1 0 i 0 i " " s 0 0 s s+1 3 # " − −1 5 −3 −2 −5 s+2 #!−1 " #!−1 " 1 0 1 0 # , # , 1 s+2 5 = 1 0 −3 s + 1 (s + 1)(s + 2) + 15 " #" h i s+2 1 5 1 0 = −3 s + 1 (s + 1)(s + 2) + 15 " # h i 1 1 s+2 5 , = 0 (s + 1)(s + 2) + 15 s+2 = , (s + 1)(s + 2) + 15 s+2 . = 2 s + 3s + 17 A partir de acá se puede obtener la RES del sistema puesto que: h " i #" 1 0 # 1 0 # , , Y (s) s+2 = 2 , U (s) s + 3s + 17 s2 + 3s + 17 Y (s) = (s + 2) U (s), s2 Y (s) + 3sY (s) + 17Y (s) = sU (s) + 2U (s). Aplicando la transformada de Laplace inversa, considerando condiciones iniciales iguales a cero, se obtiene la RES equivalente del MVE original: d2 y(t) dy(t) du(t) +3 + 17y(t) − − 2u(t) = 0. 2 dt dt dt 2.5.3. A partir de la función de transferencia Obtener la RES a partir de la función de transferencia es sencillo, simplemente hay que considerar a la variable compleja s equivalente al operador derivada (p) y de esa Escuela de Ingeniería Eléctrica Universidad de Costa Rica 68 manera es posible obtener la ecuación diferencial correspondiente. Utilizando esta misma equivalencia, es posible obtener el MVE a partir de la función de transferencia, por medio del método de variables de estado de fase o con el método de las variables de Jordan. Si se requiere la RESE, es recomendable primero obtener la RES para luego resolver la ecuación diferencial resultante. En la Figura 2.13 se presenta un diagrama que relaciona los distintos modelos y la manera de pasar de uno a otro. Funciónbde Transferencia Usar sbcomo operador derivada Identificarblabrespuesta albimpulsobabpartirbdebla respuestababestadobcero ybaplicarlebLaplace Métodobde estadosbdebfasebo variablesbdebJordan, usandobsbcomobelb operadorbderivada MVE Laplace c.i.b=b0 Laplace c.i.b=b0 Métodobde integralesbpuras, estadosbdebfasebo variablesbdebJordan RES Soluciónbdeblabecuación diferencialbconbc.i.bdadas Obtenerblabmatrizbde transiciónbdebestados ybusarblabecuaciónbde salidas RESE Figura 2.13: Relación entre los distintos modelos y la forma de obtenerlos. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 69 2.6. Ejercicios Resueltos Relación Entrada-Salida (RES) Ejercicio 2.1 Calcule la RES del circuito de la Figura 2.14 utilizando: 1. Expresiones en el dominio del tiempo. 2. Expresiones en el dominio de la frecuencia. + La salida es la tensión en el capacitor y la entrada es la tensión vin Figura 2.14: Circuito RLC. Solución: La relación entrada salida es la relación únicamente entre la entrada del sistema y sus derivadas, la salida del sistema y sus derivadas y los parámetros del sistema; por lo tanto, variables tales como condiciones iniciales, no pueden aparecer en la relación entrada salida. Esto implica que jamás se debe integrar cuando se está tratando de determinar la RES de un sistema, por otro lado, ésta siempre se debe presentar de la forma: S (ū, ȳ) = 0 A partir de estas premisas se puede resolver el ejercicio. 1. Utilizando expresiones en el dominio del tiempo. Siempre es adecuado escribir primero las relaciones de los elementos almacenadores de energía, para este caso se tiene: ic = C · v̇c = C · ẏc Escuela de Ingeniería Eléctrica vL = L · i̇L (2.110) Universidad de Costa Rica 70 Aplicando la Ley de Corrientes de Kirchhoff (LCK) en el nodo superior se tiene: ir1 = il + ic . (2.111) Sustituyendo (2.110) en (2.111) y sabiendo que la corriente en la resistencia R1 es: ir1 = vin − y , R1 se obtiene: vin − y = iL + C ẏ. (2.112) R1 Aplicando la Ley de Tensiones de Kirchhoff (LTK) en la malla de la derecha se tiene: vR2 + vL = vC = y. (2.113) Sustituyendo (2.110) en (2.113) y aplicando la ley de Ohm sobre la resistencia R2 se obtiene: R2 · iL + L · i̇L = y. (2.114) Ahora, despejando de (2.112) y sustituyendo en (2.114): R2 vin − y d vin − y − C · ẏ + L − C · ẏ = y ⇒ R1 dt R1 R2 R2 L L vin − y − R2 · C · ẏ + v̇in − ẏ − L · C · ÿ = y ⇒ R1 R1 R1 R1 L R2 L R2 L · C · ÿ + R2 · C + ẏ + +1 y− v̇in − vin = 0. R1 R1 R1 R1 Sustituyendo los valores de los parámetros se obtiene: 10−6 · ÿ + 10−3 + 10−6 ẏ + 10−3 + 1 y − 10−6 · v̇in − 10−3 · vin = 0 ⇒ ÿ + 1001 · ẏ + 1001 · 103 · y − v̇in − 1000 · vin = 0. 2. Utilizando expresiones en el dominio de la frecuencia. Por división de tensiones se puede escribir: Y (s) = Z Vin (s), Z + R1 (2.115) donde Z es la impedancia mostrada en el circuito de la Figura 2.15. Pero esta Escuela de Ingeniería Eléctrica Universidad de Costa Rica + 71 Figura 2.15: Impedancia Z en el circuito RLC. impedancia es: Z = (R2 + ZL ) k Zc ⇒ Z = (R2 + s · L) k 1 ⇒ s·C 1 Z= +s·C R2 + s · L −1 1 + (R2 + s · L·)s · C Z= R2 + s · L " Z= ⇒ #−1 ⇒ R2 + s · L . 1 + (R2 + s · L·)s · C Sustituyendo el valor de Z en (2.115) se obtiene: Y (s) = Y (s) = Y (s) = R2 +s·L 1+(R2 +s·L·)s·C Vin (s) R2 +s·L + R 1 1+(R2 +s·L·)s·C ⇒ R2 + s · L Vin (s) ⇒ R2 + s · L + R1 (1 + s · R2 · C + s2 · L · C) R2 + s · L Vin (s) ⇒ R2 + R1 + s(L + R1 · R2 · C) + s2 · L · C · R1 R2 + R1 + s(L + R1 · R2 · C) + s2 · L · C · R1 Y (s) − (R2 + s · L)Vin (s) = 0. Sustituyendo el valor de los parámetros se obtiene: 1001 · Y (s) + 1, 001 · s · Y (s) + 0, 001 · s2 · Y (s) − Vin (s) − s · 0, 001Vin (s) = 0 ⇒ Escuela de Ingeniería Eléctrica Universidad de Costa Rica 72 s2 · Y (s) + 1001 · s · Y (s) + 1001 · 103 · Y (s) − 0,001 · s · Vin (s) − Vin (s) = 0, y aplicando la transformada inversa de Laplace5 se obtiene: 0 = ÿ + 1001ẏ + 1001 · 103 y − v̇in − 1000vin , expresión que corresponde a la RES del sistema. + Ejercicio 2.2 Determine la RES del sistema mostrado en la Figura 2.16, donde la salida es la corriente del circuito. Grafique además, la salida del sistema cuando la entrada es un escalón de tensión de 0 V a 5 V. Figura 2.16: Circuito CL con fuente de tensión. Solución: Para cada elemento almacenador de energía se tiene: ic = C · v̇c y aplicando la LTK: pero: vL = L · i̇l = L · ẏ, (2.116) vin = vc + vL , vin = L · i̇L + vc , (2.117) iL = ic = C · v̇c . (2.118) 5 Debe recordarse que la relación entrada salida siempre se da en el dominio del tiempo, por lo tanto, la respuesta final no puede contener la variable compleja s. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 73 Derivando (2.117), despejando la tensión del capacitor de (2.118) y sustituyendo en (2.117) se obtiene: vin = vL + vc vin = L · i̇L + vc ⇒ v̇in = L · ïl + v̇c v̇in = L · ïl + iCL ⇒ 0 = v̇in − L · ïL − iCL , y sustituyendo el valor de los componentes se obtiene: 0 = v̇in − 2 · ïL − 4 · iL , siendo la última expresión la RES del sistema. En la Figura 2.17 se muestra la respuesta del sistema ante un cambio escalón en la entrada. Como se puede observar, un cambio en la entrada hace que la salida comience a oscilar, cuando esto ocurre, se dice que el circuito está al borde de la inestabilidad. Figura 2.17: Circuito oscilador de corriente. Ejercicio 2.3 El circuito de la Figura 2.18 se puede utilizar para regular la tensión en la resistencia R2 , no obstante, por lo regular es deseable también tomar mediciones de la corriente que entra al circuito para actuar en caso de una sobrecarga. Si las salidas del sistema son la tensión en el capacitor y la corriente en el inductor y la entrada es la tensión V1 , determine el sistema de ecuaciones diferenciales que describen el comportamiento de cada salida respecto a la entrada, en otras palabras, determine la RES de este sistema. Escuela de Ingeniería Eléctrica Universidad de Costa Rica + 74 Figura 2.18: Circuito regulador de tensión. Solución: Como en este caso se tienen dos salidas, la expresión normal de la RES que es: S (ū, ȳ) = 0, será sustituida por: S (ū, ȳ) = 0, (2.119) nótese que ahora las variables son vectoriales. Ahora bien, para cada elemento almacenador de energía se tiene: ic = C · v̇c = C · y˙2 , vL = L · i̇L = L · y˙1 . (2.120) Realizando la LCK en el nodo superior se obtiene: iL = ic + iR2 , (2.121) y aplicando la LTK en la malla de la izquierda: v1 = vR1 + vL + vc , (2.122) por la ley de Ohm se obtiene que: iR2 = vc , R2 vR1 = iL · R1 . Escuela de Ingeniería Eléctrica (2.123) (2.124) Universidad de Costa Rica 75 Ahora, supóngase que se desea primero encontrar la RES para la tensión en el capacitor. Esta relación no puede contener a la corriente en el inductor ni a la corriente o tensión en las resistencias, por lo tanto, hay que eliminarlas. Si se toma (2.124) y se sustituye en (2.122) se tiene: v1 = iL · R1 + vL + vc , (2.125) por otro lado, sustituyendo (2.121) en (2.125): v1 = (ic + iR2 ) · R1 + vL + vc . (2.126) La corriente en la resistencia R2 se relaciona con la tensión en el capacitor por medio de (2.123), sustituyendo esta expresión en (2.126): vc · R1 + vL + vc , v1 = ic + R2 (2.127) por tanto, ahora solo hay que eliminar la tensión en el inductor y la corriente del capacitor, utilizando la expresión (2.120) se obtiene: vc v1 = C · v̇c + · R1 + L · i̇L + vc . R2 (2.128) Ahora solo hay que eliminar la derivada de la corriente en el inductor. Como se había indicado anteriormente, cuando se terminan relaciones entrada salida solo se puede derivar, no hay que integrar, por lo que una alternativa es derivar (2.121) a ambos lados y sustituirla en (2.128), de esta forma se tiene: iL = ic + iR2 ⇒ i̇L = i̇c + i̇R2 , y v1 = C · v̇c + vc · R1 + L · i̇c + i̇R2 + vc , R2 (2.129) derivando (2.123) e introduciendo el resultado en (2.129) se obtiene: v̇c vc v1 = C · v̇c + · R1 + L · i̇c + + vc , R2 R2 (2.130) y como la corriente en el capacitor es ic = C · v̇c ⇒ i̇c = C · v̈c , y entonces: vc v̇c v1 = C · v̇c + · R1 + L · C · v̈c + + vc . R2 R2 Escuela de Ingeniería Eléctrica Universidad de Costa Rica 76 Esta expresión solo depende de la entrada del sistema y de una de las salidas del mismo, simplificando la expresión se obtiene: R1 L L · C · v̈c + R1 · C + v̇c + + 1 vc − v1 = 0, R2 R2 dado que v1 = u,vc = y2 se tiene: R1 L ẏ2 + + 1 y2 − u = 0, L · C · ÿ2 + R1 · C + R2 R2 (2.131) con lo que se tiene la primera RES del sistema. Para encontrar la segunda RES, por comodidad, se copiarán de nuevo las ecuaciones que describen el comportamiento del sistema: ic = C · v̇c = C · y˙2 , vL = L · i̇L = L · y˙1 , (2.132) iL = ic + iR2 , (2.133) v1 = vR1 + vL + vc , vc iR2 = , R2 (2.134) (2.135) vR1 = iL · R1 . (2.136) La segunda RES es una relación exclusivamente de la entrada del sistema (v1 ), la corriente en el inductor y sus derivadas y de los parámetros del sistema (R1 , R2 , C, L). Hay que tener muy en cuenta esto. Para determinar esta expresión, se puede comenzar por sustituir (2.136) y (2.132) en (2.134), obteniendo: v1 = R1 · iL + L · i̇L + R2 · iR2 , (2.137) pero sustituyendo de (2.133) en (2.137) se obtiene: v1 = R1 · iL + L · i̇L + R2 (iL − ic ), (2.138) v1 = (R1 + R2 )iL + L · i̇L − R2 · ic , y como ic = C · v̇c : v1 = (R1 + R2 )iL + L · i̇L − R2 C · v̇c . (2.139) Ahora bien, derivando (2.134) a ambos lados y despejando v̇c se tiene: v̇c = v̇1 − R1 · i̇L − L · ïL , Escuela de Ingeniería Eléctrica (2.140) Universidad de Costa Rica 77 e introduciendo (2.140) en (2.139) se tiene: v1 = (R1 + R2 )iL + L · i̇L − R2 · C v̇1 − R1 · i̇L − L · ïL . (2.141) Esta expresión depende ahora solo de iL y v1 , reordenándola y sustituyendo iL = y1 y v1 = u se tiene: R2 · C · L · ÿ1 + (L + R1 · R2 · C)ẏ1 + (R1 + R2 )y1 − u − R2 · C · u̇ = 0, esta expresión corresponde a la segunda RES del sistema. Las dos relaciones entrada salida se pueden unir en una ecuación vectorial como se muestra a continuación: " R1 L · C · ÿ2 + R1 · C + RL2 ẏ2 + R + 1 y2 − u 2 R2 · C · L · ÿ1 + (L + R1 · R2 · C)ẏ1 + (R1 + R2 )y1 − u − R2 · C · u̇ # " = 0 0 # . Obsérvese que se mantiene la forma descrita por (2.119). + Ejercicio 2.4 Utilizando el método de las impedancias, determine la RES del circuito mostrada en la Figura 2.19, siendo la salida la tensión en la resistencia R2 y la entrada la fuente de tensión v1 . Figura 2.19: Circuito con almacenadores de energía. Solución: Se pueden definir las tensiones de nodo de este circuito como se muestra en la Figura 2.20. Por lo tanto, aplicando el método de nodos al circuito se tiene: Nodo V1 : V1 + Escuela de Ingeniería Eléctrica V1 − V2 = 0, R1 (2.142) Universidad de Costa Rica + 78 Figura 2.20: Tensiones de nodo para el circuito. Nodo V2 : V2 V2 − V1 V2 − V3 + 1 + = 0, R1 R2 s·C (2.143) V3 − V2 V3 + = 0. R2 s·L (2.144) Nodo V3 : De (2.144) se tiene que: R2 + s · L V3 , s·L sustituyendo (2.145) en (2.143) se obtiene: V2 = R2 +s·L V3 s·L − V1 R1 + R2 +s·L V3 s·L 1 s·C + (2.145) R2 +s·L V3 s·L − V3 R2 = 0, (2.146) y despejando V3 resulta: V3 = s·L V1 . C · L · R1 · s2 + (C · R1 · R2 + L)s + R1 + R2 (2.147) Sustituyendo (2.147) en (2.145) se tiene: V2 = C · L · R1 · s2 R2 + s · L V1 , + (C · R1 · R2 + L)s + R1 + R2 (2.148) y como Y (s) = V2 − V3 utilizado (2.148) y (2.147) se tiene: R2 + s · L V1 CLR1 + (CR1 R2 + L)s + R1 + R2 s·L − V1 , 2 CLR1 s + (CR1 R2 + L)s + R1 + R2 Y (s) = Escuela de Ingeniería Eléctrica s2 Universidad de Costa Rica 79 Y (s) = R2 V1 ⇒ C · L · R1 · s2 + (C · R1 · R2 + L)s + R1 + R2 Y (s) C · L · R1 · s2 + (C · R1 · R2 + L)s + R1 + R2 = R2 · V1 ⇒ h i C · L · R1 · s2 · Y (s) + (C · R1 · R2 + L)s · Y (s) + (R1 + R2 )Y (s) − R2 · V1 = 0 Aplicando la transformada inversa de Laplace sabiendo que L −1 {sn · F (s)} = se obtiene: dn f (t) dtn C · L · R1 · ÿ(t) + (C · R1 · R2 + L)ẏ(t) + (R1 + R2 )y(t) − R2 · v1 = 0, que corresponde a la relación entrada salida del sistema. Relación Entrada Salida Estado (RESE) Ejercicio 2.5 Calcule la RESE del sistema mostrado en la Figura 2.21. La salida es la corriente en la resistencia y la entrada es la tensión u. Suponga régimen permanente antes de t0 = 0s. Figura 2.21: Circuito regulador de tensión. Solución: Utilizando el método de las impedancias para determinar la relación entrada salida del sistema se obtiene que: Escuela de Ingeniería Eléctrica VR (s) = (R k Zc ) · U (s) ⇒ (R k Zc ) + ZL IR (s) = 1 (R k Zc ) · · U (s) R (R k Zc ) + ZL Universidad de Costa Rica 80 −1 3 1 + 2s 1 1 · U (s) IR (s) = · −1 3 1 1 + + 3s 1 2s 1 · U (s) ⇒ + 3s + 1 2s2 · IR (s) + 3s · IR (s) + IR (s) = U (s) IR (s) = 2s2 (2.149) Cuando se utiliza método de las impedancias, implícitamente se suponen condiciones iniciales no nulas, por lo tanto, las condiciones iniciales deben ser insertadas para poder calcular adecuadamente la relación entrada-salida-estado. Para ello, se puede utilizar la propiedad: ( L dn f (t) dtn ) = sn F (s) − sn−1 f (t0 ) − sn−2 f (1) (t0 ) − ... − f (n−1) (t0 ) Insertando las condiciones iniciales en (2.149) se obtiene: 2 s2 · IR (s) − s · iR (t0 ) − i̇R (t0 ) + 3 [s · IR (s) − iR (t0 )] + IR (s) = U (s) ⇒ h i 2s + 3 2 1 · iR (t0 ) + 2 · i̇R (t0 ) + 2 · U (s) (2.150) + 3s + 1 2s + 3s + 1 2s + 3s + 1 y aplicando la transformada inversa de Laplace a (2.150) se tiene: IR (s) = 2s2 iR (t) = −e−t + 2e−t/2 · iR (t0 ) + −2e−t + 2e−t/2 · i̇R (t0 ) + Z t 0 −e−(t−τ ) + e−(t−τ )/2 · u(τ )dτ (2.151) Pero, ¿cuáles son los estados iniciales; iR (t0 ) e i̇R (t0 )? Suponiendo régimen permanente antes de t0 , el circuito de la Figura 2.21 se puede re-dibujar como se muestra en la Figura 2.226 . Por tanto, la corriente inicial iR (t− 0 ) es: iR (t− 0) = u 5 = = 5A R 1 Luego, como la resistencia está en paralelo con el capacitor, su tensión no puede variar instantáneamente, por lo tanto: −1 i̇R (t− 0 ) = 0 As 6 En régimen permanente, los inductores se comportan como cortocircuitos y los capacitores como circuitos abiertos. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 81 Figura 2.22: Circuito para determinar las condiciones iniciales. Como el sistema es continuo: + i̇R (t− 0 ) = i̇R (t0 ) = i̇R (t0 ) + iR (t− 0 ) = iR (t0 ) = iR (t0 ) Sustituyendo los estados iniciales en (2.151) se tiene: iR (t) = −e−t + 2e−t/2 · 5 + Z t 0 −e−(t−τ ) + e−(t−τ )/2 · u(τ )dτ Ejercicio 2.6 El circuito de la Figura 2.23 está constituido por un par de sensores de nivel para dos tanques, donde las tensiones v1 y v2 modelan las lecturas del nivel de cada uno y se consideran como entradas para el sistema. Para monitorear la diferencia de nivel entre los dos tanques se ha tomado como salida del sistema la tensión diferencia v, tal y como se define en la figura. Como es importante que la salida del sistema esté monitoreada siempre, se le solicita determinar una expresión para ello. Obtenga una expresión tal que le permita monitorear la salida del sistema en todo momento. Debe además configurar su respuesta de forma que se aprecie su similitud con alguna forma de modelado vista en el curso para un sistema lineal e invariante en el tiempo. Solución: Como se debe encontrar una expresión que permita determinar directamente la tensión v en todo el tiempo, se debe utilizar la relación entrada salida estado (si se usa el modelo en variables de estado o la relación entrada salida se utilizarían ecuaciones diferenciales que no “tienen despejada” la salida de forma directa). Ahora bien, se puede observar por un análisis simple que: v = vc + vR − i, (2.152) donde se han definido las polaridades de las tensiones y las direcciones de las corrientes como se muestra en la Figura 2.24. Escuela de Ingeniería Eléctrica Universidad de Costa Rica + + 82 Figura 2.23: Circuito con dos sensores. Así, si se encuentra vc ,vR e i, se podría calcular la tensión v. Del circuito de la izquierda se tiene, por la ley de tensiones de Kirchhoff: (2.153) + + v1 (t) = R · ic (t) + vc (t) + R · ic (t), v1 (t) = vc (t) + 2R · ic (t), v1 (t) = vc (t) + 2R · C · v̇c (t), V1 (s) = Vc (s) + 2R · C · [s · Vc (s) − vc (0)] ⇒ 2R · C 1 Vc (s) = vc (0) + V1 (s) ⇒ 2R · C · s + 1 2R · C · s + 1 1 1 1 Vc (s) = · 1 vc (0) + 1 V1 (s) ⇒ 2R · C s + 2R·C s + 2R·C t 1 Z t − (t−τ ) − 2R·C e 2R·C · v1 (τ )dτ. vc (t) = e · vc (0) + 2R · C 0 Figura 2.24: Circuitos con dos sensores definiendo polaridades y direcciones. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 83 Un error muy común a la hora de realizar esta operación es que se suponga que v1 (t) es una constante. Eso nunca se puede suponer, y por ello se deja la expresión de la convolución en el último miembro del lado derecho de (2.153). Ahora bien, teniendo la expresión para la tensión en el capacitor se puede calcular la tensión en la resistencia, ya que: vR (t) = R · iR (t), vR (t) = R · ic (t), vR (t) = R · C · v̇c (t), (2.154) por tanto, sustituyendo (2.153) en (2.154) se tendría la tensión en la resistencia como: vR (t) = R · C · v̇c (t), 1 Z t − (t−τ ) d − t 2R·C vR (t) = R · C · e · vc (0) + e 2R·C · v1 (τ )dτ , dt 2R · C 0 i d h − t d 1 Z t − (t−τ ) 2R·C 2R·C vR (t) = R · C · e · vc (0) + R · C · e · v1 (τ )dτ , dt dt 2R · C 0 1 − t d 1 Z t − (t−τ ) e 2R·C · v1 (τ )dτ ⇒ vR (t) = − · e 2R·C · vc (0) + 2 dt 2 0 t 1 1 Z t − (t−τ ) v1 (t) e 2R·C · v1 (τ )dτ + vR (t) = − · e− 2R·C · vc (0) − . (2.155) 2 4R · C 0 2 Un error muy común es suponer que: Z t d Zt d f (t, τ )dτ = f (t, τ )dτ dt 0 0 dt eso no es cierto, de hecho: Z t d Zt d f (t, τ )dτ = f (t, τ )dτ + f (t, t) dt 0 0 dt de ahí sale el v12(t) en la expresión (2.155). Ahora bien, solo falta la tensión i (nótese que es una tensión, aunque de valor i). Analizando la malla derecha del circuito de la derecha se tiene que: v2 (t) = vR (t) + vL (t) v2 (t) = R · iL (t) + Li̇L (t) ⇒ V2 (s) = R · IL (s) + L [s · IL (s) − iL (0)] ⇒ Escuela de Ingeniería Eléctrica Universidad de Costa Rica 84 L 1 iL (0) + V2 (s) ⇒ L·s+R L·s+R 1 1 1 IL (s) = · V2 (s) ⇒ R iL (0) + L s+ R s+ L L IL (s) = iL (t) = e− t·R L iL (0) + 1 Z t −(t−τ ) R L v (τ )dτ, e 2 L 0 y como iL (t) = i(t), se tiene que: i(t) = e − t·R L 1 Z t −(t−τ ) R L v (τ )dτ. e iL (0) + 2 L 0 (2.156) Entonces de (2.152), (2.153), (2.155) y (2.156): v(t) = vc (t) + vR (t) − i(t) ⇒ t 1 Z t − (t−τ ) 1 e 2R·C · v1 (τ )dτ − · e− 2R·C · vc (0) 2R · C 0 2 Z t (t−τ ) 1 v1 (t) 1 Z t −(t−τ ) R − 2R·C − t·R L L v (τ )dτ ⇒ − e · v1 (τ )dτ + −e iL (0) + e 2 4R · C 0 2 L 0 t v(t) = e− 2R·C · vc (0) + 1 Z t − (t−τ ) v1 (t) 1 − t 2R·C v(t) = e vc (0) + e 2R·C · v1 (τ )dτ + 2 4R · C 0 2 Z t R t·R 1 e−(t−τ ) L v2 (τ )dτ. − e− L iL (0) + L 0 No obstante, esta expresión, aunque describe la tensión v(t), no está reducida como un modelo lineal invariante en el tiempo. Para que esté de esa forma, se puede ingresar la variable v12(t) en la integral utilizando la propiedad del muestreo de la función Delta de Dirac: Z t f (t) = δ(t − τ )f (τ )dτ. 0 Utilizando esta propiedad se tendría: t 1 1 Z t − (t−τ ) v1 (t) e 2R·C · v1 (τ )dτ + v(t) = e− 2R·C vc (0) + 2 4R · C 0 2 Z t t·R R 1 − e− L iL (0) − e−(t−τ ) L v2 (τ )dτ ⇒ L 0 t 1 1 Z t − (t−τ ) v(t) = e− 2R·C vc (0) + e 2R·C · v1 (τ )dτ 2 4R · C 0 Escuela de Ingeniería Eléctrica Universidad de Costa Rica 85 t·R 1Z t 1 Z t −(t−τ ) R L v (τ )dτ δ(t − τ )v1 (τ )dτ − e− L iL (0) − e 2 2 0 L 0 t t·R 1 Z t − (t−τ ) 1 1 e 2R·C + δ(t − τ ) · v1 (τ )dτ − e− L iL (0) v(t) = e− 2R·C vc (0) + 2 4R · C 0 2 Z t R 1 e−(t−τ ) L v2 (τ )dτ − L 0 + h v(t) = + Z th (t−τ ) 1 e− 2R·C 4R·C 0 + 1 e 2 t − 2R·C 1 δ(t 2 − t·R L −e 1 L − τ) − i " · vc (0) iL (0) 1 −(t−τ ) R L e L i # " · v1 (τ ) v2 (τ ) # dτ, donde además se ha reducido la expresión para dejarla de la forma: y(t) = hΨ(t), x(t)i + Z t 0 hh(t − τ ), u(τ )i dτ, la cual es la forma de una relación entrada salida estado lineal e invariante en el tiempo. Sistemas y modelos lineales Ejercicio 2.7 Un objeto abstracto posee la siguiente RESE: y(t) = e −2t q y(0) + 10 5 − y(0) + e −5t ẏ(0) + Z t 0 e−5(t−τ ) u(τ )dτ. (2.157) e−5(t−τ ) u(τ )dτ (2.158) Determine si el objeto es lineal. Solución: Un objeto abstracto es lineal si es: Lineal a estado cero. Lineal a entrada cero y Cumple con la propiedad de descomposición. El estado cero se determina a partir de: q y(t) = 0 = e−2t y(0) + 10 5 − y(0) + e−5t ẏ(0) + Escuela de Ingeniería Eléctrica Z t 0 u(t)=0 Universidad de Costa Rica 86 q (2.159) ẏ(0) = 0 , y(0) + 10 5 − y(0) = 0 ⇒ y(0) = −104, 7 (2.160) ⇒e ( y(0) + 10 5 − y(0) + e−5t ẏ(0) = 0 ⇒ −2t q por lo que el vector de estado cero es: y(0) −104, 7 θ= = ẏ(0) 0 " # " # (2.161) Luego, para determinar si el objeto es lineal a estado cero se debe cumplir: b b b yθ = S(θ, k(u1 + u2 )) = k S(θ, u1 ) + k S(θ, u2 ). (2.162) Así, sustituyendo (2.161) en (2.157): b S(θ, k(u 1 + u2 )) = e −2t + Z t 0 Z t 0 (2.163) e−5(t−τ ) k(u1 + u2 )dτ, = =k √ −104, 7 + 10 5 + 104, 7 + e−5t · 0 Z t 0 e−5(t−τ ) k(u1 + u2 )dτ, e−5(t−τ ) u1 dτ + k Z t 0 (2.164) e−5(t−τ ) u2 dτ , (2.165) b b = k S(θ, u1 ) + k S(θ, u2 ), (2.166) por lo que el sistema es lineal a estado cero. Para determinar si el objeto es lineal a entrada cero se debe dar que: b b b S(k(α 1 + α2 ), 0) = k S(α1 , 0) + k S(α2 , 0). (2.167) y (0) y (0) α1 = 1 , α2 = 2 , y˙1 (0) y˙2 (0) (2.168) Definiendo: " # " # se tiene: q −2t b S(k(α k(y1 (0) + y2 (0)) + 10 5 − k(y1 (0) + y2 (0)) 1 + α2 ), 0) = e +e−5t k(y˙1 (0) + y˙2 (0)), Escuela de Ingeniería Eléctrica (2.169) Universidad de Costa Rica 87 y b 1 , 0) + k S(α2 , 0) b k S(α =k e −2t q y1 (0) + 10 5 − y1 (0) + e q −5t y˙1 (0) +k e−2t y2 (0) + 10 5 − y2 (0) + e−5t y˙2 (0) . (2.170) Como se puede ver, la constante k no puede salir de la raíz en la expresión (2.169), por lo que no se cumple que (2.169) sea igual a (2.170). De esta forma, el sistema no es lineal a entrada cero. No se requiere determinar si el objeto cumple con la propiedad de descomposición: el sistema es no lineal. Función de transferencia Ejercicio 2.8 Un objeto abstracto S tiene la siguiente RESE: y(t) = 4e−(t−t0 ) − 3e−2(t−t0 ) y(t0 ) + e−(t−t0 ) − e−2(t−t0 ) ẏ(t0 ) + Z t t0 5 e−(t−τ ) − e−2(t−τ ) u(τ )dτ (2.171) Determine la función de transferencia del modelo. Solución: La función de transferencia se determina a partir de condiciones iniciales nulas, en este caso es fácil demostrar (se deja como ejercicio) que el vector de estado cero es: y(0) 0 θ= = ẏ(0) 0 " # " # (2.172) Luego, la respuesta a estado cero es: yθ (t) = Z t 0 = Escuela de Ingeniería Eléctrica 5 e−(t−τ ) − e−2(t−τ ) u(τ )dτ Z t 0 h(t − τ )u(τ )dτ (2.173) Universidad de Costa Rica 88 de donde se deduce que: h(t) = 5 (e−t − e−2t ) ⇒ H(s) = L{h(t)} = L {5 (e−t − e−2t )} (2.174) = 5L {e−t } − 5L {e−2t } =5 1 1 −5 s+1 s+2 = s2 5 + 3s + 2 siendo esta la función de transferencia. Ejercicio 2.9 La RESE de un sistemas con dos entradas y dos salidas (TITO, por sus siglas en inglés) está dada por: α11 (0) α (0) · 12 α21 (0) α22 (0) y1 (t) e−t e−2t 0 0 = y2 (t) 0 0 e−2t e−t " + Z t" 0 # " # (2.175) 3e−4(t−τ ) + 1 e−(t−τ ) + 6δ(t − τ ) u (τ ) · 1 dτ −5(t−τ ) −(t−τ ) −(t−τ ) u2 (τ ) 5e +e e # " # Determine la matriz de transferencia del sistema. Solución: De la RESE dada se puede deducir que la matriz de respuestas impulsionales es: 3e−4t + 1 e−t + 6δ(t) h(t) = 5e−5t + e−t e−t " Escuela de Ingeniería Eléctrica # (2.176) Universidad de Costa Rica 89 Por lo que la matriz de transferencia sería: H(s) = L {h(t)} 3e−4t + 1 e−t + 6δ(t) 5e−5t + e−t e−t (" =L #) L {3e−4t + 1} L {e−t + 6δ(t)} = L {5e−5t + e−t } L {e−t } " # 3 1 s+4 + s = 1 5 + s+5 s+1 (2.177) 1 + 6 s+1 1 s+1 Así, las señales de salida se pueden obtener de las señales de entrada como: 3 1 + s+4 s Y1 (s) = Y2 (s) 5 1 + s+5 s+1 " # Escuela de Ingeniería Eléctrica 1 + 6 " # s+1 U1 (s) · U (s) 2 1 s+1 (2.178) Universidad de Costa Rica 3. Representación gráfica de modelos La representación gráfica de sistemas es una herramienta valiosa para la comprensión de la estructura interna del mismo. Esto debido a que permite saber o explicar cómo se conectan los distintos subsistemas que conforman al sistema general mediante la relación causa-efecto que los gobierne. Particularmente, en el análisis de los sistemas de control, la representación gráfica de sistemas es útil para entender varias estrategias de control, las cuales, se verán en el curso de sistemas de control. 3.1. Diagramas de bloques El diagrama de bloques de un modelo o un sistema, es la representación gráfica de las distintas unidades que lo componen, mostrando además la forma en la que estas se conectan. Para ello, se utilizan bloques, los cuales pueden o no ser lineales y puntos de suma y ramificación de señales. Particularmente para la creación de un diagrama de bloques se utiliza una combinación de los siguientes elementos: Bloques lineales: Los cuales están formados por funciones de transferencia o por ganancias estáticas. Cualquiera que sea el caso, la salida de un bloque lineal es: Y (s) = P (s)U (s), donde Y (s) es la salida del bloque, P (s) es su relación causa-efecto y U (s) es la entrada del bloque. En la Figura 3.1 se muestra la representación de ambos casos. Por lo general, si se habla de una función de transferencia, se utiliza un rectángulo (Figura 3.1a) para representar el bloque lineal, mientras que si la relación causa-efecto es una constante, el bloque usado suele representarse por un triángulo (Figura 3.1b). Puntos de suma o resta: Son utilizados, como su nombre lo indica, para sumar o restar señales. En la Figura 3.2 se muestra su símbolo. Por lo general, se coloca el signo de la operación para indicar si las señales se están sumando o 90 91 (a) Función de transferencia. (b) Ganancia estática. Figura 3.1: Bloques lineales. Figura 3.2: Puntos de suma o resta. restando. No obstante, en algunos textos el signo de resta se sustituye usando un semicírculo coloreado, como se muestra también en la Figura 3.2. Si no se indica la operación, la convención es que las señales se están sumando. Por supuesto, la señal de salida para el punto de suma de la Figura 3.2 está dada por: Y (s) = U1 (s) − U2 (s). Ramificaciones: Son usadas para transmitir señales a más de un bloque o punto de suma. Un ejemplo de una ramificación se muestra en la Figura 3.3, por supuesto, las salidas del diagrama de bloques de la Figura 3.3 son: Y1 (s) = KP1 (s)U (s), Y2 (s) = KP2 (s)U (s). Ramificación Figura 3.3: Ramificación en un diagrama de bloques. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 92 Figura 3.4: Algunos bloques no lineales. Bloques no lineales: Modelan operaciones no lineales que se aplican a un conjunto de entradas. Debido a que hay un gran número de operaciones no lineales, por lo general el bloque tiene el símbolo de la función que relaciona la entrada y la salida. Algunos ejemplos de estos bloques se muestran en la Figura 3.4. Es importante aclarar que muchas operaciones no lineales no son formalmente aplicables a señales en el dominio de la frecuencia, pero sí se pueden aplicar a su respectiva señal en el dominio del tiempo. 3.1.1. Creación del diagrama de bloques En esta sección se analizará el problema de obtener un diagrama de bloques, en el dominio de la frecuencia compleja s, a partir de una ecuación diferencial. Para exponer la metodología a seguir, se considerará una ecuación diferencial dada por: ÿ(t) + a1 ẏ(t) + a0 y(t) = bu(t − L), (3.1) donde y(t) es la salida del modelo y u(t) es la entrada, el lector recordará que esta ecuación diferencial corresponde a la de un sistema de segundo orden. Ahora bien, si se despeja ÿ(t) de (3.1) se obtiene: ÿ(t) = bu(t − L) − a1 ẏ(t) − a0 y(t), (3.2) y de (3.2) se deduce que ÿ(t) se puede representar como la suma o resta de varias señales. En la Figura 3.5a se muestra un punto de suma con las señales necesarias para “construir” la señal ÿ(t). Ese mismo punto de suma y resta puede ser separado aún más si las señales a1 ẏ(t), a0 y(t) y bu(t − L) se ven como señales multiplicadas por una constante, tal y como muestra la Figura 3.5b. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 93 Luego, las únicas señales que no se conocen explícitamente son ẏ(t) y y(t), no obstante, el lector debe estar de acuerdo en que: Z ÿ(t) dt = ẏ(t), Z ẏ(t) dt = y(t), por lo que se puede utilizar el operador integral para obtener ẏ(t) a partir de ÿ(t) y y(t) a partir de ẏ(t). Este procedimiento se muestra en la Figura 3.5c. Como se observa en la Figura 3.5d, las señales obtenidas en la salida de los integradores se pueden utilizar para ser realimentadas al punto de suma, con esto, ya el diagrama de bloques tiene solo una señal de entrada y una señal de salida. Finalmente, el diagrama de bloques de la Figura 3.5d está en el dominio del tiempo, si se desea un diagrama en el dominio de la frecuencia compleja s, basta con hacer las siguientes sustituciones: L {y(t)} = Y (s), L {ẏ(t)} = sY (s), L {ÿ(t)} = s2 Y (s), L {u(t − L)} = U (s)e−Ls , Z 1 dt ≡ , s y el diagrama quedará como el mostrado en la Figura 3.5e, donde además se representó el tiempo muerto e−Ls como un bloque, siendo por tanto U (s) la entrada del diagrama. Ejemplo 3.1 Determine un diagrama de bloques que represente la ecuación diferencial: 2ÿ(t) + 4ẏ(t) + y(t) = 5u̇(t) − u(t). (3.3) Solución: Cuando la entrada se encuentra derivada, lo mejor es utilizar el operador p para lograr formar las derivadas que eventualmente se integrarán para realimentarlas al punto de suma. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 94 (a) Punto de suma (b) Descomposición (c) Integración (d) Realimentación (e) Paso al dominio s Figura 3.5: Construcción de un diagrama de bloques a partir de una ecuación diferencial. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 95 (a) Punto de suma. (b) Punto de prealimentación. (c) Definición de la salida. (d) Sistema completo. Figura 3.6: Diagrama de bloques de 2ÿ(t) + 4ẏ(t) + y(t) = 5u̇(t) − u(t). Utilizando dicho operador sobre (3.3) resulta: 2p2 y(t) + 4py(t) + y(t) = 5pu(t) − u(t), (3.4) expresión que se puede reordenar como: p [2py(t) + 4y(t) − 5u(t)] = −y(t) − u(t) ⇒ y(t) + u(t) [2py(t) + 4y(t) − 5u(t)] = − . p (3.5) (3.6) De la sección 2.3.2 se sabe que la expresión dada por 2py(t) + 4y(t) − 5u(t) puede seleccionarse como variable de estado, haciendo esto resulta: x1 (t) = 2py(t) + 4y(t) − 5u(t), (3.7) siendo X1 (s) la salida del punto de suma en la Figura 3.6a, que resulta de formar la expresión − y(t)+u(t) en un diagrama de bloques. p Como se necesita conocer la señal y(t) para realimentar el diagrama, se puede despejar py(t) de (3.7) para obtener: py(t) = Escuela de Ingeniería Eléctrica x1 (t) − 4y(t) + 5u(t) , 2 (3.8) Universidad de Costa Rica 96 y con la información dada por el lado derecho de (3.8) se puede construir el diagrama de bloques de la Figura 3.6b. El punto de suma que se muestra en la Figura 3.6b recibe el nombre de punto de prealimentación, esto debido a que la información transportada tiene una dirección hacia “adelante” y no hacia atrás, como lo es en el caso de la realimentación. Así, integrando (3.8) se puede definir un segundo estado, el cual será la salida del sistema, como se muestra en la Figura 3.6c. Finalmente, en la Figura 3.6d se muestra el diagrama final realimentando las señales de interés y sin colocar la asignación de estados descrita con anterioridad. 3.1.2. Simplificación de diagramas de bloques Una vez que se ha conformado el diagrama de bloques de un sistema a partir de las ecuaciones diferenciales que lo modelan, es posible reducir dicho diagrama para el efecto de la entrada sobre la salida por medio de la función de transferencia del sistema. Es importante aclarar que la reducción de los diagramas de bloques se puede aplicar solo a ciertas estructuras. Por simplicidad, aquí solo se reducirán diagramas de bloques lineales, los cuales están formados por bloques lineales, puntos de suma y ramificaciones. Considérese por ejemplo el diagrama de la Figura 3.7a. Si el objetivo es reducir el diagrama a solo un bloque que relacione r(s) y y(s), lo primero podría ser reducir los dos bloques C(s) y P (s). Para ello, puede observar que: y y(s) = P (s)u(s), (3.9) u(s) = C(s)e(s), (3.10) sustituyendo (3.10) en (3.9), se obtiene que: y(s) = P (s) C(s)e(s) . | Así, se podría definir que: {z u(s) A(s) = P (s)C(s). (3.11) } (3.12) Con lo que el diagrama de bloques se puede simplificar como el mostrado en la Figura 3.7b. Por supuesto, a partir de esta deducción, se demuestra que n bloques Escuela de Ingeniería Eléctrica Universidad de Costa Rica 97 (a) Diagrama original. (b) Cascada. (c) Realimentación. Figura 3.7: Simplificación de un diagrama de bloques. en serie se pueden simplificar en solo uno que sea equivalente al producto de los n bloques en serie. Ahora bien, obsérvese en el diagrama de bloques de la Figura 3.7b que la señal e(s) se puede escribir como: e(s) = r(s) − ŷ(s), (3.13) pero además: y y(s) = A(s)e(s), (3.14) ŷ(s) = H(s)y(s). (3.15) Así, sustituyendo (3.15) y (3.14) en (3.13) se obtiene que: y(s) = r(s) − H(s)y(s) ⇒ A(s) y(s) + H(s)y(s) = r(s) ⇒ A(s) " # 1 y(s) + H(s) = r(s) ⇒ A(s) " # 1 + A(s)H(s) y(s) = r(s) ⇒ A(s) A(s) r(s), 1 + A(s)H(s) y(s) = M (s)r(s). y(s) = Escuela de Ingeniería Eléctrica Universidad de Costa Rica 98 Con lo que el diagrama queda como el mostrado en la Figura 3.7c. Por supuesto, la idea de simplificar un diagrama de bloques no es realizar las operaciones matemáticas necesarias para simplificarlo, sino, más bien trabajar con la estructura del diagrama y “mover” los bloques adecuadamente. Algunas transformaciones de diagramas de bloques son bastante comunes. Normalmente a este tipo de simplificaciones se le llama álgebra de bloques, porque permite realizar de manera gráfica, las operaciones algebraicas que se harían con las ecuaciones. Éstas se presentan en el Cuadro 3.1. 3.1.3. El modelo en variables de estado a partir del diagrama de bloques En la primera parte de este capítulo se explicó como obtener un diagrama de bloques a partir de una ecuación diferencial. Esta idea puede ser extendida a un conjunto de ecuaciones diferenciales para formar el diagrama de bloques de un sistema. Pero, es sabido que de un conjunto de ecuaciones diferenciales se puede obtener un modelo en variables de estado, entonces, surge la pregunta ¿Es posible obtener un modelo en variables de estado a partir de un diagrama de bloques? La respuesta es sí. Para obtener un modelo en variables de estado a partir de un diagrama de bloques, es importante considerar algunas propiedades de los estados de un sistema, las cuales se citan de nuevo por simplicidad: 1. Las variables de estado no pueden cambiar inmediatamente, es decir, deben ser continuas. 2. El conjunto de variables de estado debe ser linealmente independiente. 3. La derivada de un estado se debe poder describir como una función de las entradas y de los estados sin derivar. Para mostrar el procedimiento de obtener un modelo en variables de estado a partir de un diagrama de bloques, obsérvese el diagrama de bloques de la Figura 3.8. En este diagrama se han marcado varias señales de interés como fi . Tomando en cuenta que las variables de estado no pueden cambiar inmediatamente, se puede deducir que la señal: f1 (s) = u1 (s) − u2 (s), no puede ser variable de estado, pues depende de las entradas, las cuales pueden cambiar inmediatamente. Caso contrario ocurre con las señales f2 , f3 , f4 , f5 , f6 y f7 , Escuela de Ingeniería Eléctrica Universidad de Costa Rica 99 Inicial Transformación Final Combinación en paralelo Combinación en cascada Mover punto de suma anterior a un bloque Mover punto de suma posterior a un bloque Mover punto de bifurcación posterior a un bloque Mover punto de bifurcación anterior a un bloque Eliminar lazo de realimentación Cuadro 3.1: Transformaciones de bloques. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 100 Figura 3.8: Diagrama de bloques. pues al ser la salida de bloques con más polos que ceros o venir su entrada de un bloque de este tipo, no pueden cambiar inmediatamente. Se deja como ejercicio al lector probar que estas señales no pueden cambiar inmediatamente. Por otro lado, obsérvese que: f4 = f3 − f7 , y f3 = Kf2 , lo cual indica que f4 , f3 y f7 son señales linealmente dependientes, al igual que f3 y f2 . Como las variables de estado deben ser linealmente independientes, se concluye que entre f4 , f3 y f7 solo se pueden elegir dos señales como variables de estado, análogamente, solo se puede seleccionar f3 o f2 como variables de estado. Finalmente, si se observa la señal f7 se puede concluir que: f7 (s) = b f6 (s), a2 s 2 + a1 s + a0 expresión que si se traslada al dominio del tiempo se tendría: a2 f7¨(t) + a1 f7˙(t) + a0 f7 (t) = bf6 (t). (3.16) Obsérvese de (3.16) que la ecuación diferencial que relaciona f6 y f7 es de segundo orden, lo cual es incompatible con un modelo en variables de estado. No obstante, el modelo en variables de estado de la Figura 3.8 puede ser modificado al mostrado en la Figura 3.9, donde se descompuso la función de transferencia de segundo orden utilizando integradores. En este punto se le deja al lector dos tareas; demostrar esta descomposición y demostrar que las señales f7a y f7b son las únicas necesarias para representar los estados de la sección que se extendió. Así, considerando los análisis realizados sobre el diagrama de bloques, se puede crear uno nuevo que incorpore en forma explícita las variables de estado que se pueden elegir. Este diagrama se muestra en la Figura 3.10. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 101 Figura 3.9: Diagrama de bloques extendido. Figura 3.10: Diagrama de bloques con la selección de estados. Ahora bien, para formar un modelo en variables de estado se necesitan ecuaciones que relacionen la primera derivada de los n estados con los estados sin derivar y las entradas. Para el caso de x1 se tiene que: 1 [u1 (s) − u2 (s)] ⇒ Ts + 1 T sx1 (s) + x1 (s) = u1 (s) − u2 (s) ⇒ u1 (s) − u2 (s) − x1 (s) sx1 (s) = , T x1 (s) = si se cambia esta última expresión al dominio de tiempo se tiene que: ẋ1 (t) = u1 (t) u2 (t) x1 (t) − − , T T T (3.17) siendo (3.17) una ecuación válida para el modelo en variables de estado. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 102 Por otro lado, del diagrama se tiene que: x2 (s) = Kx1 (s) − x5 (s) ⇒ s −s [x2 (s) − Kx1 (s)] = x5 (s) ⇒ −ẋ2 (t) + K ẋ1 (t) = x5 (t). Esta última expresión no se puede utilizar para un modelo en variables de estado, pues tiene la derivada de dos estados. No obstante, sustituyendo el valor de ẋ1 (t) usando (3.17) se tiene: u1 (t) u2 (t) x1 (t) − − = x5 (t) ⇒ −ẋ2 (t) + K T T T " # K K K u1 (t) − u2 (t) − x1 (t) − x5 (t) (3.18) T T T siendo (3.18) una ecuación de la forma buscada. En el caso de x3 (s) se tiene: ẋ2 (t) = 1 x2 (s) ⇒ Ts + 1 T sx3 (s) + x3 (s) = x2 (s) ⇒ T ẋ3 (t) + x3 (t) = x2 (t) ⇒ x3 (s) = 1 1 x2 (t) − x3 (t), T T con lo que se tiene la expresión necesaria para ẋ3 (t). En el caso de x4 (s) se cumple que: (3.19) ẋ3 (t) = x4 (s) = ab u2 (s) ⇒ s ẋ4 (t) = abu2 (t). (3.20) Obsérvese que no se necesitó describir ẋ4 en función de los otros estados. Finalmente, para x5 (s) se tiene que: x5 (s) = 1 1 x (s) − a0 [Kx1 (s) − x2 (s)] −a1 x5 (s) ⇒ 4 {z } | s a2 f7b ẋ5 (t) = Escuela de Ingeniería Eléctrica 1 a0 K a0 a1 x4 (t) − x1 (t) + x2 (t) − x5 (t), a2 a2 a2 a2 (3.21) Universidad de Costa Rica 103 siendo (3.21) la última ecuación necesaria para formar la parte diferencial del modelo en variables de estado. La única ecuación que se necesita ahora es una que relacione la salida del sistema con la entrada y los estados. Esta se deduce como: y(s) = x3 (s) + u2 (s), o lo que es equivalente: y(t) = x3 (t) + u2 (t). (3.22) Así, a partir de (3.17) a (3.21) y de (3.22) se puede formar el modelo en variables de estado como: − T1 0 0 0 0 −K T 0 0 0 0 1 T − T1 0 0 0 0 0 -1 0 · 0 − Ka a2 a0 a2 0 1 a2 ẋ1 ẋ2 ẋ3 = ẋ4 ẋ5 0 − aa21 1 T K x2 T x3 + 0 x4 0 x1 3.2. h 0 0 1 0 0 0 x5 y= i · x1 − T1 −K # T " u1 0 · , (3.23) u2 ab 0 x2 x3 + u2 . x4 x5 (3.24) Diagramas de flujo Los diagramas de flujo, también llamados reogramas, son una forma de expresar ecuaciones algebraicas lineales y funciones de transferencia de una manera gráfica. Las ecuaciones que pueden representarse con estos diagramas tienen la forma (Kuo, 1996): xj = N X ajk xk j = 1, 2, . . . , N, (3.25) k=1 donde xj es la variable j-ésima del sistema de ecuaciones, ajk es una constante. En el caso que se trate de funciones de transferencia, las ecuaciones que se pueden Escuela de Ingeniería Eléctrica Universidad de Costa Rica 104 Figura 3.11: Diagrama de flujo con 3 nodos y dos ramas. representar por medio de esta gráfica tienen la forma: Xj (s) = N X Gjk (s)Xk (s) j = 1, 2, . . . , N. (3.26) k=1 En este caso, Gjk (s) es la función de transferencia desde Xk (s) hasta Xj (s). Estos diagramas tienen dos elementos fundamentales: Nodo: Punto de unión que representa una de las variables. Se dibuja como un pequeño círculo con el símbolo de la variable asociada. Ramas: Segmentos lineales con ganancia y dirección asociada. Las ramas llevan la señal que corresponde al valor del nodo de origen multiplicada por su ganancia asociada. Todas las ramas que llegan a un nodo suman su señal correspondiente para obtener la relación de la variable de ese nodo con respecto a los otros nodos de origen. Por ejemplo, si se tiene que la relación entre tres variables es: x3 = a31 x1 + a32 x2 . La representación en diagrama de flujo de esta relación vendría dada en la Figura 3.11. Hay que notar que la dirección de las ramas se representa con una flecha en medio de la rama. En general, los nodos se colocan horizontalmente en una sola línea y las ramas se dibujan con líneas curvas. Ejemplo 3.2 Considere el conjunto de ecuaciones siguiente (tomado de Kuo (1996)) y2 y3 y4 y5 Escuela de Ingeniería Eléctrica = a21 y1 + a23 y3 , = a32 y2 + a34 y4 , = a42 y2 + a43 y3 + a44 y4 , = a52 y2 + a54 y4 . Universidad de Costa Rica 105 Figura 3.12: Diagrama de Flujo del Ejemplo 3.2. En este caso se tienen 5 variables diferentes. Cada una de las ecuaciones define la relación que existe entre cada variable y las demás. Nótese que no existe una ecuación para y1 , lo que quiere decir que ninguna rama llega a este nodo, pero sí puede ser que salga de él. El diagrama de flujo completo sería como el que se presenta en la Figura 3.12. 3.2.1. Propiedades de los diagramas de flujo De acuerdo con Kuo (1996), los diagramas de flujo tienen las siguientes propiedades: 1. Se aplica solo a sistemas lineales, al contrario de los diagramas de bloques, que podían utilizarse para sistemas no lineales. 2. Las ecuaciones algebraicas tienen que estar en la forma de causa-efecto. 3. Nodos se utilizan para expresar variables. Se arreglan de izquierda a derecha en una sola línea horizontal, aunque esto puede cambiarse de ser necesario. 4. La señal viaja a través de las ramas en una sola dirección. 5. Una señal yj que viaja a través de una rama entre yj y yk se multiplica por la ganancia de la rama akj , por lo que la señal resultante akj yj es entregada en yk . 3.2.2. Fórmula de Mason La fórmula de Mason permite encontrar la ganancia (o función de transferencia) de un diagrama de flujo, desde un nodo de entrada hasta un nodo de salida, de una manera directa sin tener que reducir el diagrama, como es en el caso de los diagramas de bloques. Para poder aplicar esta fórmula, se deben buscar la ganancia de las Escuela de Ingeniería Eléctrica Universidad de Costa Rica 106 Sin nodos de salida Con un nodo de salida Figura 3.13: Diagrama de flujo en el que se ha creado un nodo de salida. trayectorias directas y de las mallas. Estos términos se definen a continuación (Kuo, 1996): Nodo fuente o nodo de entrada: Es un nodo que solo tiene ramas salientes. Nodo sumidero o de salida: Es un nodo que tiene solo nodos entrantes. Cualquier variable puede convertirse en un nodo de salida. Basta simplemente con hacer una copia del nodo, con una rama de ganancia unitaria, tal y como se muestra en la Figura 3.13. Trayectoria: Cualquier colección de una sucesión continua de ramas que se dirigen en la misma dirección. Se puede atravesar un mismo nodo varias veces si es necesario y empezar o terminar en cualquier nodo del diagrama. Trayectoria directa: Trayectoria que empieza en un nodo de entrada y termina en uno de salida, a lo largo del cual ningún nodo se atraviesa más de una vez. Por ejemplo, en la Figura 3.12 hay tres trayectorias directas: la trayectoria que pasa por y1 y2 y3 y4 y5 , la que pasa por y1 y2 y4 y5 y la que pasa por y1 y2 y5 . Malla: Trayectoria que se origina y termina en el mismo nodo y en donde ningún otro nodo se encuentra más de una vez. De nuevo, en la Figura 3.12 hay cuatro mallas diferentes: y2 y3 y2 , y3 y4 y3 , y4 y4 y y2 y4 y3 y2 . Mallas que no se tocan: Dos partes de un diagrama de señal no se tocan si no comparten un nodo en común. En la Figura 3.12 las mallas y2 y3 y2 y y4 y4 son las únicas que no se tocan. Ganancia de trayectoria: Producto de las ganancias de las ramas que atraviesan una trayectoria. Si esta trayectoria es directa, se dice que la ganancia es de trayectoria directa y si esta es una malla, entonces se dice que es una ganancia de malla. Con estas definiciones es posible enunciar la fórmula de Mason: Dado un diagrama con N trayectorias directas y L mallas, la ganancia entre el nodo de entrada y el Escuela de Ingeniería Eléctrica Universidad de Costa Rica 107 nodo de salida viene dado por: M= Mk ∆k , ∆ k=1 N X (3.27) donde M es la ganancia (o función de transferencia), Mk es la ganancia de la trayectoria directa k, ∆ es el determinante que viene dado por: ∆=1− X Li1 + X i Lj2 − X j Lk3 + · · · , k ! =1+ X p (−1) p X Lqp p = 1, 2, . . . , (3.28) q y se tiene que: P i Li1 es la suma de las ganancias de todas las mallas individuales. j Lj2 es la suma de los productos de todas las combinaciones posibles de dos mallas que no se tocan. P Lk3 es la suma de los productos de todas las combinaciones posibles de tres mallas que no se tocan. P k q Lqp es la suma de los productos de todas las combinaciones posibles de p mallas que no se tocan. P y ∆k se le llama cofactor y se calcula igual que el determinante ∆, pero eliminando antes las mallas que tocan la k-ésima trayectoria directa. Para clarificar esta fórmula, se calculará la ganancia del diagrama de flujo de la Figura 3.12. Ejemplo 3.3 Encuentre la función de transferencia de la Figura 3.12. Solución: En el diagrama de la Figura 3.12, se pueden encontrar tres trayectorias directas: P1 = y1 y2 y3 y4 y5 que tiene una ganancia de a21 a32 a43 a54 . P2 = y1 y2 y4 y5 que tiene una ganancia de a21 a42 a54 . P3 = y1 y2 y5 que tiene una ganancia de a21 a52 . y se tiene cuatro mallas: Escuela de Ingeniería Eléctrica Universidad de Costa Rica 108 P l1 = y2 y3 y2 que tiene una ganancia de L1 = a32 a23 . P l2 = y3 y4 y3 que tiene una ganancia de L2 = a43 a34 . P l3 = y2 y4 y3 y2 que tiene una ganancia de L3 = a42 a34 a23 . P l4 = y4 y4 que tiene una ganancia de L4 = a44 . El determinante se debe obtener utilizando (3.28): ∆=1− X i Li1 + X Lj2 , j = 1 − (L1 + L2 + L3 + L4 ) + (L1 L4 ) , = 1 − (a32 a23 + a43 a34 + a42 a34 a23 + a44 ) + (a32 a23 a44 ) . Y ahora se deben calcular los cofactores. ∆1 se obtiene de quitar del determinante, todas las mallas que tocan la trayectoria directa P1 . Como esta trayectoria toca todas las mallas, ∆1 = 1. Lo mismo sucede con el cofactor ∆2 = 1. En el caso de ∆3 , las mallas que no tocan esta trayectoria directa son P l2 y P l4 , por lo que el cofactor queda como ∆3 = 1 − (a43 a34 + a44 ). Entonces la ganancia que se obtiene a partir del diagrama viene dada por: M= 3.3. P k a21 a32 a43 a54 + a21 a42 a54 + a21 a52 (1 − a43 a34 − a44 ) Mk ∆k = . ∆ 1 − (a32 a23 + a43 a34 + a42 a34 a23 + a44 ) + (a32 a23 a44 ) Ejercicios resueltos Diagramas de bloques Ejercicio 3.1 En la Figura 3.14 se muestra el diagrama de bloques de un sistema de control de un crucero (problema adaptado de Dorf y Bishop (2005)), determine la función de transferencia del sistema utilizando álgebra de bloques. Solución: Observando la Figura 3.14, se nota que no se tiene ningún bloque en serie o paralelo, Escuela de Ingeniería Eléctrica Universidad de Costa Rica 109 aunque hay una realimentación, esta es difícil de ver, pero si se descompone el punto de suma triple en la parte central del diagrama, tal y como se muestra en la Figura 3.15, es más fácil de observar. Posteriormente se puede simplificar la realimentación negativa. Notando que el resultado quedará en serie con el bloque G2 (s), se puede definir: A(s) = G1 (s)G2 (s) , 1 + G1 (s)H3 (s) (3.29) con lo que se obtiene el diagrama de la Figura 3.16. En la Figura 3.16 se observa que el bloque A y el bloque H2 (s) forman un lazo de realimentación negativa, no importa la presencia del bloque H1 (s), debido a que a éste llega la misma señal que saldría de la simplificación de la realimentación, la cual se define como: A(s) , (3.30) B(s) = 1 + A(s)H2 (s) con lo que se puede crear el diagrama de la Figura 3.17. Al simplificar la realimentación negativa formada por los bloques B(s) y H1 (s), el resultado quedará en serie con los bloques k y 1/s. Si se define: C(s) = k B(s) , s B(s)H1 (s) + 1 (3.31) el diagrama quedaría como se muestra en la Figura 3.18 Al final, se tendría que: y(s) = C(s) y(s) C(s) u(s) ⇒ = G(s) = C(s) + 1 u(s) C(s) + 1 (3.32) Figura 3.14: Diagrama de bloques de un sistema de control. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 110 Figura 3.15: Diagrama de bloques de un sistema de control. Figura 3.16: Diagrama de bloques de un sistema de control con una realimentación simplificada. Tomando en cuenta todas las ecuaciones, después de simplificar, se llega a que: G(s) = kG1 (s)G2 (s) kG1 (s)G2 (s) + (G1 (s)G2 (s)H1 (s) + G1 (s)G2 (s)H2 (s) + G1 (s)H3 (s) + 1) s Diagramas de flujo Ejercicio 3.2 Encontrar la ganancia del diagrama de flujo que se presenta en la Figura 3.19. Solución: En este caso, se tienen 3 trayectorias directas, las cuales se presentan en la Figura 3.20. Las ganancias correspondientes son: M1 = G1 G2 G3 G4 G5 G6 Escuela de Ingeniería Eléctrica Universidad de Costa Rica 111 Figura 3.17: Diagrama de bloques de un sistema de control con otra realimentación simplificada. Figura 3.18: Diagrama de bloques de un sistema de control más simplificado. M2 = G1 G2 G7 G6 M3 = G1 G2 G3 G4 G8 Por otro lado, las mallas del sistema se representan en la Figura 3.21 y sus ganancias vendrían dadas por: L1 = −G1 G2 G3 G4 G5 G6 H3 L2 = −G2 G3 G4 G5 H2 L3 = −G2 G7 H2 L4 = −G1 G2 G3 G4 G8 H3 L5 = −G1 G2 G7 G6 H3 L6 = −G4 H4 Figura 3.19: Diagrama de Flujo para el Ejercicio 3.2. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 112 (a) Primera trayectoria directa. (b) Segunda trayectoria directa. (c) Tercera trayectoria directa. Figura 3.20: Trayectorias directas del diagrama de flujo. L7 = −G8 H1 L8 = −G5 G6 H1 Hay tres combinaciones de mallas que no se tocan: L6 con L3 , L6 con L5 y L3 con L7 , todas las demás mallas se tocan en por lo menos un nodo. Con esta información se puede calcular el determinante del diagrama: ∆=1− X i Li1 + X Lj2 j = 1 − (L1 + L2 + L3 + L4 + L5 + L6 + L7 + L8 ) + (L3 L6 + L3 L7 + L5 L6 ) Para el caso del cofactor ∆k , hay que sustraer de ∆ las mallas que tocan la k-ésima trayectoria directa: En el caso de M1 , todas las mallas tocan esta trayectoria directa, por lo que ∆1 = 1. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 113 (a) L1 (b) L2 (c) L3 (d) L4 (e) L5 (f) L6 (g) L7 (h) L8 Figura 3.21: Mallas del diagrama de flujo. En el caso de M2 , solo la malla L6 no toca esta trayectoria directa, por lo que, si solo se conserva esta del determinante, se obtiene ∆2 = 1 − L6 . En el caso de M3 , todas las mallas tocan esta trayectoria directa, por lo que ∆3 = 1. Entonces ya se puede calcular la ganancia de este diagrama: Mk ∆k ∆ G1 G2 G3 G4 G5 G6 + (G1 G2 G7 G6 ) (1 − L6 ) + G1 G2 G3 G4 G8 M= 1 − (L1 + L2 + L3 + L4 + L5 + L6 + L7 + L8 ) + (L3 L6 + L3 L7 + L5 L6 ) M= P k Escuela de Ingeniería Eléctrica Universidad de Costa Rica 4. Caracterización en el dominio del tiempo En este capítulo se presenta un análisis del comportamiento de los sistemas de primer y segundo orden en el dominio del tiempo y el estudio de la estabilidad para sistemas lineales e invariantes con el tiempo. Aunque parezca un poco contradictorio, la manera más sencilla de caracterizar estos sistemas en el dominio del tiempo es utilizando su función de transferencia. El análisis de la estabilidad depende fundamentalmente de la posición de los polos de la función de transferencia. Para estudiar la respuesta, se procede a utilizar una entrada escalón unitario. Sin embargo, como los sistemas son lineales, los resultados se pueden generalizar para cualquier entrada. En la sección 4.2, se presenta la manera en que se caracteriza el retardo en los sistemas lineales. Luego, en la sección 4.3 se caracterizarán los sistemas de primer orden con retardo mientras que en la sección 4.4 se muestra el caso de los sistemas de segundo orden con retardo. En la sección 4.5 se presenta el efecto de los ceros en la respuesta al escalón. En la sección 4.6, se introduce el concepto de dominancia de polos, para mostrar que un sistema lineal de orden alto, se puede aproximar mediante un sistema de orden bajo. 4.1. Análisis de estabilidad Existen varias definiciones de estabilidad. Si ante una entrada acotada, la salida de un sistema permanece acotada, se dice que el sistema es BIBO estable (BIBO viene del inglés Bounded-Input Bounded-Output). Un sistema es asintóticamente estable cuando, ante una entrada cero, el sistema tiende a cero cuando el tiempo tiende a infinito. En esta sección se analiza estas características de estabilidad para los sistemas lineales e invariantes en el tiempo (LTI). 114 115 4.1.1. Relación entre los polos y el MVE Supóngase que se tiene un sistema cuya ecuación diferencial (RES) viene dada por: dn y(t) dn−1 y(t) dy(t) + a0 y(t) + a + · · · + a n−1 1 dtn dtn−1 dt dm u(t) dm−1 u(t) du(t) + b0 u(t) = 0. + bm + b + · · · + b1 m−1 m m−1 dt dt dt (4.1) La función de transferencia correspondiente viene dada por: G(s) = bm sm + bm−1 sm−1 + · · · + b1 s + b0 . sn + an−1 sn−1 + · · · + a1 s + a0 (4.2) La ecuación característica entonces vendría dada por: sn + an−1 sn−1 + · · · + a1 s + a0 = 0, (4.3) cuyas raíces son los polos del sistema. Partiendo de un MVE equivalente dado por: ẋ(t) = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t). (4.4) La función de transferencia que se obtendría a partir de este MVE vendría dado por: G(s) = C (sI − A)−1 B + D, adj (sI − A) =C B + D, |sI − A| C adj (sI − A) B + |sI − A| D = . |sI − A| (4.5) Por lo que la ecuación característica también se podría obtener mediante: |sI − A| = 0. (4.6) Es más, la expresión en (4.6) es exactamente igual a la ecuación con la que se determinan los valores propios de la matriz A: |λI − A| = 0. (4.7) De esto se concluye que los polos del sistema son iguales a los valores propios de la matriz A. Este resultado es muy importante para las pruebas de estabilidad que se realizan más adelante. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 116 4.1.2. Estabilidad BIBO La estabilidad BIBO de un sistema lineal, se puede estudiar a partir de la respuesta a estado cero(Ogata, 2003). Sea u(t) una entrada acotada, y(t) la salida del sistema y h(t) la respuesta al impulso. La respuesta del sistema vendría dada por su integral de convolución: Z ∞ y(t) = u(t − τ )h(τ ) dτ . (4.8) 0 Puesto que, se quiere verificar que la salida sea acotada, se toma el valor absoluto de (4.8): Z ∞ |y(t)| = 0 u(t − τ )h(τ ) dτ , (4.9) |u(t − τ )| |h(τ )| dτ , (4.10) que se puede escribir como: |y(t)| ≤ Z ∞ 0 puesto que u(t) es acotada, es decir |u(t)| ≤ M con 0 < M < ∞ se obtiene: |y(t)| ≤ M Z ∞ 0 |h(τ )| dτ , (4.11) y como lo que se quiere es que |y(t)| ≤ N con 0 < N < ∞, entonces: Z ∞ Z0∞ 0 |h(τ )| dτ ≤ N , M (4.12) |h(τ )| dτ ≤ Q < ∞, por lo tanto, para que una función sea BIBO estable, es necesario que el área bajo la curva |h(τ )| sea finita. Ahora bien, puesto que la función de transferencia es igual a la transformada de Laplace de la respuesta al impulso: G(s) = L {h(t)} = Z ∞ 0 h(t)e−st dt. (4.13) Aplicando el valor absoluto: |G(s)| = Z ∞ 0 −st h(t)e dt ≤ Z ∞ 0 |h(t)| e−st dt, (4.14) s es un número complejo dado por s = σ + jω, por lo tanto: e−s = e−(σ+jω) = e−σ e−jω = e−σ . Escuela de Ingeniería Eléctrica Universidad de Costa Rica 117 Cuando s es igual a alguno de los polos de G(s), se puede decir que G(s) = ∞, por lo que (4.14) toma la forma: ∞≤ Z ∞ 0 |h(t)| e−σt dt. (4.15) Si alguno de los polos de G(s) (es decir, alguno de los valores propios de A) tiene parte real mayor o igual a cero (está en el semiplano derecho del plano s o en el eje jω) se deduce que |e−σt | ≤ 1, por lo tanto, para este caso: ∞≤ Z ∞ 0 |h(t)| dt, (4.16) que no cumple con la condición dada en (4.12). Por lo tanto, si algún polo del sistema se encuentra en el eje jω o tiene parte real positiva, no se cumple la condición de estabilidad BIBO por lo tanto el sistema sería inestable. Solo los sistemas cuyos polos se encuentran en el semiplano izquierdo cumplen la condición de ser BIBO estables. 4.1.3. Estabilidad asintótica Si el sistema es estable asintóticamente, cuando se aplica una entrada cero al sistema con una condición inicial dada, la salida del mismo va desde su estado inicial hasta su estado cero cuando el tiempo tiende a infinito. Matemáticamente, esta condición se escribe de la siguiente manera. Si existe un número M positivo que depende del estado en el instante inicial t0 tal que: |y(t)| ≤ M ≤ ∞, y además: ∀t ≥ t0 , lı́m |y(t)| = 0. t→∞ (4.17) (4.18) Ahora se buscará la condición de un modelo LTI para que se cumplan estas condiciones. Si las entradas siempre son iguales a cero, la ecuación de estado de un MVE, se puede escribir como: ẋ(t) = Ax(t), y(t) = Cx(t), (4.19) entonces la transición de estado vendría dada por: x(t) = eAt x(t0 ), Escuela de Ingeniería Eléctrica (4.20) Universidad de Costa Rica 118 y la salida quedaría entonces: y(t) = CeAt x(t0 ). (4.21) La salida del sistema depende de las raíces de la ecuación característica, puesto que, de la Sección 2.3.3, se sabe que: n o eAt = L −1 (sI − A)−1 , (4.22) y dado que: 1 adj (sI − A) , |sI − A| entonces la forma que tome la ecuación de salidas dependerá de los polos del sistema. Si las n raíces de la ecuación característica se expresan como si = σi + jωi , con i = 1, 2, . . . , n y existen m raíces simples y el resto son de orden múltiple, (4.21) se puede escribir de la forma: (sI − A)−1 = y(t) = m X i=1 Ki e si t + n−m−1 X multi(i)−1 X i=0 Lj tj es(m+1+i) t , (4.23) j=0 donde Ki y Lj son constantes que dependen de las matrices A, C y de las condiciones iniciales x(t0 ) y multi(i) representa la multiplicidad del polo i-ésimo. Los términos exponenciales definen la respuesta del sistema cuando t → ∞. Por lo tanto para satisfacer las dos condiciones en (4.17) y (4.18), es necesario que la parte real de los polos si sean negativos para que el sistema sea asintóticamente estable. Si los polos son imaginarios (se encuentran en el eje jω) la salida del sistema no crecerá indefinidamente, pero será oscilatorio con una amplitud máxima constante. Cuando un sistema tiene polos imaginarios, se dirá que es marginalmente estable (o marginalmente inestable). Esta condición es la misma que para la condición de estabilidad BIBO. Por esta razón, para sistemas LTI, se puede decir que un sistema es estable o inestable, sin necesidad de entrar en detalles del tipo de estabilidad. Entonces, para sistemas LTI un sistema es estable si y solo si sus polos tienen parte real negativa (o lo que es lo mismo, sus valores propios tienen parte real negativa). En la Figura 4.1 se muestra el plano complejo s con las áreas en las que un sistema es estable, inestable o marginalmente estable en función de la posición de sus polos: σi < 0 : Si todos los polos tienen parte real negativa, entonces el sistema es estable. σi = 0 : Si hay por lo menos un polo simple en el eje imaginario y no hay polos con parte real positiva, el sistema es marginalmente estable. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 119 Región Estable Región Inestable Región Estable Región Inestable Figura 4.1: Estabilidad de un sistema en función de la posición de sus polos. σi > 0 : Si hay por lo menos un polo con parte real positiva, o un polo de orden múltiple en el eje imaginario, el sistema es inestable. Esta idea de estabilidad dependiente de la posición de los polos puede observarse en la Figura 4.2, donde se muestra la trayectoria de los estados de diferentes sistemas desde la condición inicial x(t0 ) = [1, −1]T durante un tiempo igual a diez segundos. El estado inicial se muestra con un círculo y su estado final con un diamante. En la Figura 4.2a se muestra un sistema cuyos polos son reales y negativos. Sin importar su estado inicial, el sistema siempre tiende a su estado cero. En el caso de polos complejos con parte real negativa, los sistemas se comportan como en la Figura 4.2b. En este caso el sistema también tiende hacia su estado cero, pero el valor de las variables de estado oscila un poco antes de alcanzar su estado cero, dando la sensación de rotación. La Figura 4.2c muestra un sistema oscilatorio, en el que el estado oscila indefinidamente sin alcanzar su estado cero, formando en este caso una trayectoria elíptica. Un caso de sistema inestable se presenta en la Figura 4.2d en el que el valor de los estados tiende a valores cada vez mayores. Las líneas de campo en lugar de apuntar hacia su estado cero, tienden a llevar el sistema hacia “afuera”. La trayectoria en espiral, se debe a que los polos del sistema son complejos con parte real positiva. 4.1.4. Criterio de estabilidad de Routh-Hurwitz Existe un criterio que permite verificar si un sistema es estable o no sin tener que calcular su determinante o resolver la ecuación característica. Este método se llama criterio de estabilidad de Routh-Hurwitz en honor a sus descubridores A. Hurwitz y E.J. Routh. Este método se basa en la función de transferencia del sistema, que se puede obtener mediante alguno de los métodos presentados en la Sección 2.5. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 120 Respuesta a entrada cero de un sistema Respuesta a entrada cero de un sistema 1.5 1 0.8 1 0.6 0.4 0.5 x2 x2 0.2 0 0 −0.2 −0.5 −0.4 −0.6 −1 −0.8 −1 −1.5 −1 −0.5 0 x1 0.5 1 −1.5 −1.5 1.5 (a) Sistema estable con polos reales −1 −0.5 0 x1 0.5 1 1.5 (b) Sistema estable con polos complejos Respuesta a entrada cero de un sistema Respuesta a entrada cero de un sistema 2.5 400 2 300 1.5 200 1 100 0 x2 x2 0.5 −0.5 0 −100 −1 −200 −1.5 −300 −2 −2.5 −2 −1.5 −1 −0.5 0 x1 0.5 1 1.5 (c) Sistema marginalmente estable 2 −400 −300 −200 −100 0 x1 100 200 300 (d) Sistema inestable con polos complejos Figura 4.2: Comportamiento de los estados, en función de la posición de los polos. Suponga que se tiene un sistema cuya función de transferencia se puede escribir como: p(s) bm sm + bm−1 sm−1 + · · · + b1 s + b0 H(s) = = . (4.24) q(s) an sn + an−1 sn−1 + · · · + a1 s + a0 El criterio de Routh-Hurwitz permite saber si la ecuación característica: q(s) = an sn + an−1 sn−1 + · · · + a1 s + a0 = 0, (4.25) tiene alguna raíz con parte real positiva sin tener que resolver la ecuación. Para ello se sigue el procedimiento presentado en Ogata (2003) y Dorf y Bishop (2005): 1. Si alguno de los coeficientes de (4.25) es cero o negativo, ante la presencia de por lo menos un coeficiente positivo, entonces el sistema tiene al menos un Escuela de Ingeniería Eléctrica Universidad de Costa Rica 121 polo en la parte real positiva del plano complejo o al menos un par de polos imaginarios, por lo que el sistema sería inestable. 2. Si todos los coeficientes son positivos, el sistema puede o no ser estable. Para saber si existen raíces con parte real positiva, se procede primero a crear un arreglo como se muestra a continuación (Dorf y Bishop, 2005): sn sn−1 sn−2 sn−3 .. . s0 an an−1 bn−1 cn−1 .. . an−2 an−3 bn−3 cn−3 .. . an−4 an−5 bn−5 cn−5 .. . an−6 an−7 bn−7 cn−7 .. . ··· ··· ··· ··· zn−1 Los coeficientes b a z se calculan de la siguiente manera: bn−1 = −1 an−1 an an−1 an−2 , an−3 bn−3 = −1 an−1 an an−1 an−4 , an−5 bn−5 = −1 an−1 an an−1 an−6 , an−7 cn−1 = −1 bn−1 an−1 bn−1 an−3 , bn−3 cn−3 = −1 bn−1 an−1 bn−1 an−5 , bn−5 y así sucesivamente hasta llegar a la fila s0 . Lo que dice el criterio de RouthHurwitz es que “el número de raíces de q(s) con parte real positiva es igual al número de cambios de signo de la primera columna del arreglo” (Dorf y Bishop, 2005), por lo tanto, un sistema es estable si los coeficientes de la primera columna tienen todos el mismo signo. El criterio de Routh-Hurwitz no solo permite saber si el sistema tiene polos inestables, sino que también permite saber el número de polos inestables del sistema, mediante los cambios de signo que se encuentren en el arreglo de Routh. 3. Ahora bien, existen casos especiales en los que en alguna de las filas, el primer elemento sea igual a cero. En estos casos, hay que cambiar un poco el procedimiento para poder realizar el análisis sin problemas: Escuela de Ingeniería Eléctrica Universidad de Costa Rica 122 Caso 1: solo el primer elemento de la fila es igual a cero, mientras que los otros elementos restantes son diferentes de cero, o no existen términos restantes. En este caso, lo que se hace es cambiar el cero por un que se considera como un número muy pequeño positivo. Si el signo del elemento de la fila anterior tiene el mismo signo que el elemento de la fila posterior, entonces el sistema tiene polos imaginarios; si los signos son diferentes, hay un cambio de signo y por lo tanto habrán polos en el semiplano derecho. Caso 2: todos los coeficientes de una fila son iguales a cero: Esto sucede cuando existen raíces que tienen igual magnitud, pero signo contrario o existen dos raíces imaginarias conjugadas. En este caso, lo que se hace es crear un polinomio auxiliar P (s) con los coeficientes de la fila anterior a la fila de ceros. Este polinomio siempre es par, es decir tiene grado 2n. Luego se deriva el polinomio característico con respecto a s y se sustituye la fila de ceros por los coeficientes de este polinomio derivado. Una vez sustituida, se prosigue con el método hasta finalizarlo. A continuación se presentan algunos ejemplos que ayudan a clarificar este procedimiento y sus casos especiales. Ejemplo 4.1 Considere las ecuaciones características dadas por (Ogata, 2003): 2s4 + s3 + 3s2 + 5s + 10 =0, s3 + 2s2 + s + 2 = 0, s5 + 2s4 + 24s3 + 48s2 − 25s − 50 = 0. Analice la estabilidad de los sistemas a los que corresponden esas ecuaciones características. Solución: Para el primer caso, se debe primero encontrar el arreglo de Routh-Hurwitz para este polinomio característico: s4 s3 s2 s1 s0 Escuela de Ingeniería Eléctrica 2 1 1·3−2·5 = −7 1 −7·5−1·10 = 6,43 −7 3 5 10 10 0 10 Universidad de Costa Rica 123 El primer coeficiente de la fila s2 es negativo, lo que implica que el sistema tiene dos cambios de signo, por lo que el sistema tendrá dos polos con parte real positiva y por lo tanto es inestable. En el segundo caso, al hacer el arreglo de Routh, se obtiene un cero en el primer coeficiente de la fila s1 , tal y como se muestra a continuación: s3 s2 s1 s0 1 1 2 2 0≈ 2 Como después de ese cero, ya no había más coeficientes restantes, se trata de un caso especial tipo 1. Por ello se cambia el cero por y se sigue el arreglo suponiendo que es un número positivo pequeño. Como no hay cambios de signo, entonces este sistema tiene raíces imaginarias puras. En el último caso, el arreglo de Routh tiene una fila llena de ceros en la fila s3 , tal y como se muestra a continuación: s5 s4 s3 1 2 0 24 −25 48 −50 . 0 La fila s3 tiene todos los coeficientes iguales a cero, por lo que se trata de un caso especial de tipo 2. Como la fila que volvió cero fue la s3 , entonces se construye un polinomio auxiliar con los coeficientes de la fila s4 : P (s) = 2s4 + 48s2 − 50, y se deriva para encontrar los coeficientes necesarios para sustituir la fila de ceros del arreglo: P (s) = 8s3 + 96s. ds Luego se sustituye estos coeficientes en el arreglo, y se sigue calculando el resto de los coeficientes del arreglo de Routh: s5 s4 s3 s3 s2 s1 s0 Escuela de Ingeniería Eléctrica 1 24 −25 2 48 −50 0 0 . 8 96 24 −50 112,7 −50 Universidad de Costa Rica 124 Sensor de peso Figura 4.3: La banda transportadora es un caso típico en el que aparece un retardo. Y como se puede observar hay un cambio de signo, por lo que el sistema tiene un polo con parte real positiva. 4.2. Representación del retardo en sistemas lineales Se dice que la versión retardada de una señal f (t) viene dada por: fr (t) = f (t − L)µ(t − L), (4.26) donde µ(t − L) es el escalón unitario. Esta relación se escribe de esta manera porque, como es costumbre, se supone que antes del instante inicial, el valor de todas las señales eran iguales a cero. Un caso típico en el que una señal aparece retardada son las bandas transportadoras. Véase el caso de la Figura 4.3. Si se está midiendo el peso del material que cae sobre la banda transportadora, pero el sensor solo se puede colocar al final de la banda, la señal que se podrá recuperar del sistema tendrá un retardo con respecto al peso en el punto donde cae el material. Por ejemplo, la señal del peso que cae sobre la banda puede ser similar al que aparece en la Figura 4.4. La señal punteada representa el peso del material sobre la banda, mientras que la señal continua representa la medición del sensor, la cual está atrasada por un valor L = 3 s. Las señales tienen la misma forma, pero están desplazadas temporalmente. La transformada de Laplace de (4.26), viene dada por: L {f (t − L)µ(t − L)} = e−Ls F (s), (4.27) en este caso aparece un factor exponencial en el dominio de la frecuencia que debe ser tomado en cuenta en los análisis. Supóngase que se tiene un sistema cuya ecuación Escuela de Ingeniería Eléctrica Universidad de Costa Rica 125 1.4 1.2 Amplitud 1 0.8 0.6 0.4 0.2 0 0 Señal original Versión retardada 1 2 3 4 5 Tiempo (s) 6 7 8 Figura 4.4: Señal retardada en el tiempo. diferencial viene dada por: dn−1 y(t) dm u(t − L) dn y(t) + a + · · · + a y(t) = b n−1 0 m dtn dtn−1 dtm m−1 d u(t − L) + bm−1 + · · · + b0 u(t − L), dtm−1 (4.28) donde se está tomando en cuenta el retardo del sistema en la entrada. Como se supone que los sistemas son invariantes en el tiempo, da lo mismo obtener la respuesta del sistema con la entrada retardada que obtenerla con la señal sin retardo y luego retardar la salida. Al aplicar la transformada de Laplace con condiciones iniciales iguales a cero, se llega a la siguiente función de transferencia: Y (s) (bm sm + bm−1 sm−1 + · · · + b0 ) e−Ls = , U (s) sn + an−1 sn−1 + · · · + ao (4.29) en donde el retardo del sistema queda representado de manera explícita por el factor e−Ls en el numerador. 4.3. Sistemas de primer orden La forma canónica de un sistema de primer orden está dado por G(s) = Escuela de Ingeniería Eléctrica Ke−Ls , τs + 1 (4.30) Universidad de Costa Rica 126 amplitud entrada salida 0 0 tiempo Figura 4.5: Respuesta al escalón de un sistema de primer orden más tiempo muerto. donde K es la ganancia del sistema en estado estacionario (o simplemente, ganancia), L es el retardo del sistema (también llamado tiempo muerto) y τ se conoce como constante de tiempo del sistema. A los sistemas de este tipo se les conoce como sistemas de primer orden más tiempo muerto (POTM). La definición de estos tres parámetros es clara si se analiza la respuesta al escalón del sistema. La respuesta de un sistema a una entrada escalón es conocida como curva de reacción y es muy utilizada para caracterizar la respuesta transitoria de un sistema. En la Figura 4.5 se muestra una curva de reacción de un sistema POTM en el que un escalón de magnitud u0 fue aplicado en el instante t0 . La relación entre los parámetros del sistema y la curva de reacción es: Ganancia (K): Corresponde a la ganancia en estado estacionario del sistema. Si la magnitud del escalón es u0 y el valor final de la respuesta del sistema viene dado por: yf = lı́m y(t) = lı́m sY (s). t→∞ s→0 Entonces, la ganancia es simplemente: K= yf . u0 (4.31) Retardo (L): Es el tiempo que tarda en reaccionar la salida a partir del instante que se aplica el escalón. Constante de tiempo (τ ): Es el tiempo que tarda el sistema en alcanzar el 63.2 % del valor final (es decir y = 0,632yf ), una vez que ha pasado el tiempo muerto. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 127 Si el instante en el que la salida llega a y = 0,632yf viene dado por tτ , entonces, la constante de tiempo se puede calcular simplemente como: τ = tτ − t0 − L. (4.32) Existen algunas consideraciones importantes con respecto a la respuesta del sistema de primer orden: El tiempo que le toma al sistema alcanzar su nuevo valor estacionario viene dado aproximadamente por el retardo más cuatro veces la constante de tiempo. Una vez que ha transcurrido el retardo, el sistema de primer orden reacciona rápidamente a la respuesta escalón (Su pendiente en t = t0 + L tiene un valor de Kτ ). El polo del sistema de primer orden es igual al inverso de la constante de tiempo, por lo que, polos pequeños representan sistemas lentos (constantes de tiempo grandes) mientras que los polos grandes representan sistemas más rápidos. 4.4. Sistemas de segundo orden Las funciones de segundo orden tienen un polo más que las funciones de primer orden. Como el polinomio característico es de orden dos, los polos pueden llegar a ser complejos, lo que produciría una respuesta más oscilatoria. La forma general de un sistema de segundo orden más tiempo muerto (SOTM) viene dado por: G(s) = Kωn2 e−Ls , s2 + 2ξωn s + ωn2 (4.33) donde K es la ganancia en estado estacionario, ωn es la frecuencia natural del sistema, ξ es el factor de amortiguamiento y L es el retardo. El valor de ξ es el que determina si los polos son complejos o no. Se pueden discernir los siguientes casos que se presentan en la Figura 4.6: Caso sobreamortiguado (ξ > 1): En este caso, el sistema tiene dos polos reales diferentes. Esto produce que la respuesta del sistema sea muy parecida a la del caso de primer orden, tal y como se puede observar en la Figura 4.6a. La diferencia es que, al comienzo, el sistema no empieza a responder de manera casi inmediata, sino que inicia con una pendiente de cero antes de aumentar su amplitud. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 128 Caso críticamente amortiguado (ξ = 1): En este caso, el sistema tiene dos polos reales iguales. Su respuesta es muy parecida al caso sobreamortiguado, con la diferencia de que es un poco más rápida. De hecho, el sistema críticamente amortiguado es el más rápido sin sobrepaso, como se puede observar en la Figura 4.6b. Caso subamortiguado (0 <ξ < 1): Este es el caso en que los polos son complejos. Esta característica produce la aparición de sobrepasos en la respuesta, tal y como se presenta en la Figura 4.6c. Caso oscilatorio (ξ = 0): Cuando los polos del sistema son imaginarios puros, la respuesta del sistema presenta una oscilación mantenida en el tiempo con una frecuencia igual a la frecuencia natural del sistema, tal y como se muestra en la Figura 4.6d. Caso inestable (ξ < 0): En este caso, el sistema tiene polos en el semiplano derecho, por lo que la respuesta tenderá a infinito. 4.4.1. Especificación de la respuesta subamortiguada La respuesta subamortiguada aparece muchas veces cuando se tiene un sistema controlado con realimentación. Por ello es importante caracterizarla de manera completa. La respuesta típica de este tipo de sistemas se presenta en la Figura 4.7. Si la entrada es un escalón de magnitud u0 , la respuesta del sistema sin tomar en cuenta el retardo, vendría dada por: Y (s) = Kωn2 u0 . 2 2 s + 2ξωn s + ωn s (4.34) Nótese que los polos de este sistema vienen dados por: q s = −ξωn ± jωn 1 − ξ 2 . (4.35) La transformada inversa de Laplace para esta señal es entonces: " !# ξ sen(ωd t) , cos(ωd t) + √ y(t) = Ku0 1 − e 1 − ξ2 " !!# √ 2 1 − ξ e−ξωn t y(t) = Ku0 1 − √ sen ωd t + tan−1 , ξ 1 − ξ2 −ξωn t Escuela de Ingeniería Eléctrica (4.36) (4.37) Universidad de Costa Rica 1 1 0.9 0.9 0.8 0.8 0.7 0.7 0.6 Amplitude Amplitude 129 0.5 0.4 0.6 0.5 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 0 0.5 1 1.5 2 2.5 3 Tiempo (seconds) 3.5 4 0 0 4.5 0.5 1 1.5 2 Tiempo (seconds) 2.5 3 (a) Respuesta de un sistema sobreamorti- (b) Respuesta de un sistema críticamente guado. amortiguado. 1.4 2 1.2 1.8 1 1.6 0.8 Amplitude 1.4 0.6 0.4 1.2 1 0.8 0.6 0.2 0.4 0 0 1 2 3 4 5 0.2 6 0 0 2 (c) Respuesta de un sistema subamorti- 4 6 8 10 12 Tiempo (seconds) 14 16 18 20 (d) Respuesta de un sistema oscilatorio. guado. Figura 4.6: Diferentes respuestas de un sistema de segundo orden. √ con ωd = ωn 1 − ξ 2 , conocida como frecuencia natural amortiguada. Con esta ecuación, se pueden obtener las especificaciones de la respuesta que se detallan en la Figura 4.7: Tiempo de subida (tr ): Se define como el tiempo necesario para que la respuesta del sistema vaya del 0 % al 100 % de su valor final. En (4.36), el valor final de la respuesta viene dado por yf = K ∗ u0 , por lo que todo lo que está dentro de los paréntesis cuadrados es precisamente el porcentaje del valor final en función del tiempo. Tomando en cuenta esto, el tiempo de subida se puede calcular como: y(tr ) = 1, ! 1−e Escuela de Ingeniería Eléctrica −ξωn tr ξ cos(ωd tr ) + √ sen(ωd tr ) = 1. 1 − ξ2 Universidad de Costa Rica 130 Amplitud Tolerancia permitida 0 0 Tiempo (s) Figura 4.7: Caracterización de una respuesta subamortiguada. Como el factor exponencial es diferente de cero siempre, se llega a la ecuación: ξ cos(ωd tr ) + √ sen(ωd tr ) = 0. 1 − ξ2 Si se define σ = ξωn , se llega a que: √ tan (ωd tr ) = − 1 − ξ2 ωd =− , ξ σ es decir, el tiempo de subida se puede calcular como: 1 ωd tan−1 . tr = ωd −σ (4.38) Sin embargo, como las funciones trigonométricas inversas solo están definidas en un dominio limitado, se debe corregir esta ecuación para que los resultados tengan sentido. Una función trigonométrica inversa se puede interpretar como una función que recibe un número real y devuelve un “ángulo” en radianes. Tomando en cuenta esto y siguiendo el procedimiento de Ogata (2003), así como la relación geométrica de los parámetros del modelo en el plano complejo, como se muestra en la Figura 4.8, es posible obtener que el ángulo que en realidad se está buscando no es el que saldría si se realizara el cálculo directamente con Escuela de Ingeniería Eléctrica Universidad de Costa Rica 131 Figura 4.8: Relación geométrica para calcular tr . (4.38), sino que el ángulo que se está buscando vendría dado por π − β, con β el ángulo que se define en la Figura 4.8. Con esta corrección, el tiempo de subida se calcula entonces como: √ 1−ξ 2 −1 ω π − tan π − tan−1 σd ξ √ tr = . = 2 ωd ωn 1 − ξ (4.39) Tiempo al pico (tp ): El tiempo al pico es el tiempo que le toma al sistema alcanzar el valor máximo de la salida. Por lo tanto, para encontrar este tiempo, lo que se debe hacer es derivar (4.36), e igualar el resultado a cero. Al hacer esto, se obtiene la siguiente ecuación: dy(t) dt = sen(ωd tp ) √ t=tp que tiene como solución: ωn e−ξωn tp = 0, 1 − ξ2 ωd tp = 0, π, 2π, . . . El tiempo al pico que se busca es precisamente el que corresponde al primer sobrepaso, por lo que: π tp = . (4.40) ωd Escuela de Ingeniería Eléctrica Universidad de Costa Rica 132 Sobrepaso (Mp ): El sobrepaso corresponde a la sobreelongación máxima del sistema por encima de su valor final. Este parámetro se da en porcentaje con respecto al valor final de la respuesta. Si se evalúa el valor de la salida en tp , se obtiene: " !# ξ d cos(π) + √ y(tp ) = Ku0 1 − e sen(π) 1 − ξ2 √ −σ π (−ξ/ 1−ξ 2 )π ωd = Ku0 1 + e = Ku0 1 + e . −ξωn ωπ , Entonces, el sobrepaso vendría dado por: y(tp ) − yf = Mp = yf −σ Ku0 1 + e ωd por lo que, se llega a: Mp = e π Ku0 √−ξπ 1−ξ2 . − Ku0 , (4.41) Como se puede notar, el sobrepaso solo depende de ξ. En la Figura 4.9 se muestra el efecto de variar el valor de ξ desde 1 hasta 0,1. Conforme ξ disminuye, el sobrepaso aumenta y el sistema se vuelve más oscilatorio. Tiempo de asentamiento (ts ): Este es el tiempo que le toma al sistema llegar a una franja del ±2 % o ±5 % alrededor del valor final, para no volver a salir de ella. En la Figura 4.10 se presenta gráficamente el concepto de tiempo de asentamiento, tanto para una banda del 2 % como del 5 %. A partir de (4.37), se puede obtener una aproximación de este tiempo. Los términos exponenciales de esta ecuación forman una envolvente dentro de la cual se expande la respuesta del sistema. Estas envolventes vienen dadas por las curvas: e−ξωn t 1± √ . 1 − ξ2 De esta ecuación, se observa que las curvas envolventes tienen una constante de tiempo igual a T = ξω1n . Entonces, por conveniencia, se utiliza la siguiente definición de tiempo asentamiento, que es similar a la que se utiliza para los sistemas de primer orden: 4 4 ts,2 % = 4T = = criterio de 2 %, (4.42) σ ξωn 3 3 ts,5 % = 3T = = criterio de 5 %. (4.43) σ ξωn Escuela de Ingeniería Eléctrica Universidad de Costa Rica 133 1.8 1.6 1.4 amplitud 1.2 1 0.8 0.6 0.4 0.2 0 0 2 4 tiempo (s) 6 8 10 Figura 4.9: Efecto en la respuesta al escalón al variar el factor de amortiguamiento. banda del 5% amplitud banda del 2% tiempo (s) Figura 4.10: Tiempo de asentamiento con los criterios del 2 % y 5 %. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 134 5 4.5 4 3.5 amplitud 3 2.5 2 1.5 1 0.5 0 0 1 2 3 4 5 6 tiempo (s) 7 8 9 10 Figura 4.11: Efecto de agregar un cero de fase mínima a un sistema de segundo orden. Es importante que se note que el tiempo de asentamiento del sistema depende de la parte real de los polos, por lo que la posición de los mismos define la velocidad del sistema. 4.5. Efecto de los ceros en el sistema 4.5.1. Ceros de fase mínima Un cero de fase mínima es aquel que tiene parte real negativa. Su nombre se debe al efecto que tiene este cero sobre el diagrama de fase del sistema (que se estudiará en el capítulo 7). Cuando se agrega un cero de fase mínima a una función de segundo orden, como la vista en la sección 4.4, disminuye el tiempo de levantamiento e incrementa el sobrepaso máximo de la respuesta escalón (Kuo, 1996). Si se tiene un sistema dado por: Kω 2 (τc s + 1) G(s) = 2 , (4.44) s + 2ξωs + ω 2 y se varía τc desde 0 hasta 5 con K = 1, ω = 3 y ξ = 0,5, el efecto de la variación de τc se puede observar en la Figura 4.11. Es claro que la adición de un cero hace que el sistema reaccione más rápido ante un cambio en la entrada (un cero en una función de transferencia representa una derivada de la entrada en el dominio del tiempo). Escuela de Ingeniería Eléctrica Universidad de Costa Rica 135 2 1 amplitud 0 −1 −2 −3 −4 0 2 4 tiempo (s) 6 8 10 Figura 4.12: Respuesta de un sistema de segundo orden cuando se agrega un cero de fase no mínima. Sin embargo, esto provoca que el sobrepaso aumente conforme τc aumenta, es decir, conforme el cero se acerca más al eje imaginario. 4.5.2. Ceros de fase no mínima Los ceros de fase no mínima son aquellos que tienen parte real positiva. A diferencia de los polos inestables, los ceros con parte real positiva no vuelven inestable al sistema, pero provocan que la salida presente una respuesta inversa ante una entrada escalón. Es decir, cuando se aplica un escalón positivo al sistema, la respuesta primero se hace negativa para luego terminar siendo positiva. En la Figura 4.12 se muestra la respuesta ante una entrada escalón del sistema dado por (4.44). La respuesta es similar a la del caso de ceros de fase mínima en el sentido de que el sistema comienza a oscilar más, pero con la diferencia de que el sobrepaso toma más bien valores negativos. Este comportamiento no se debe confundir con la ganancia negativa. Cuando un sistema tiene ganancia negativa, la respuesta al escalón tiende hacia los valores negativos, también, pero siempre varía en la misma dirección. En cambio, cuando el sistema presenta ceros de fase no mínima, el sistema primero cambia en una dirección para luego seguir en sentido contrario al original. Para efectos de control, la presencia de ceros de fase no mínima limita el desempeño que se puede esperar del sistema y hacen que el sistema sea más difícil de controlar. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 136 4.6. Concepto de polos dominantes Cuando los sistemas son de orden superior a dos, normalmente es posible aproximar su comportamiento mediante un modelo de primer o segundo orden. Esto es debido a que, normalmente los polos que dominan la respuesta son los que están más cerca del eje imaginario. Un polo que está cerca del eje imaginario se dice que es dominante porque su efecto sobre la respuesta tarda más en desaparecer. En la sección 4.3 se observó que la constante de tiempo es la que indica qué tan lento es un sistema. Una constante de tiempo grande conlleva a que el sistema tarde más en alcanzar un nuevo estado estacionario. Pero como el polo del sistema de primer orden es igual al inverso de la constante de tiempo, entonces un sistema lento, tiene polos pequeños, o lo que es lo mismo, polos cercanos al eje imaginario. En el caso de los sistemas de segundo orden, la parte real de los polos es la que define la velocidad del sistema (el tiempo de asentamiento). Específicamente, el inverso de la parte real de los polos es proporcional al tiempo de asentamiento. Si un sistema tiene más de dos polos, los que se encuentren más a la izquierda tendrán un efecto que se desvanecerá más rápido que el de los polos dominantes. Por ello estos polos son menos importantes. De acuerdo con Kuo (1996), si la parte real de un polo es de cinco a diez veces mayor que la de los polos dominantes, entonces esos polos son despreciables en lo que concierne a la respuesta transitoria. En muchos casos, sobretodo para el área del control de procesos, es normal que los sistemas se aproximen a modelos de primer orden más tiempo muerto o a sistemas de segundo orden sobreamortiguados. Esto se debe a que, normalmente, los sistemas tienen un comportamiento parecido a uno de primer orden (es decir sin sobrepaso) por lo que esta aproximación resulta apropiada, sobre todo para el diseño de controladores. Una de las reglas más sencillas presentada en la literatura para reducir el orden de un sistema, es la “Half Rule” de Skogestad (Skogestad, 2003). Este método intenta aproximar un sistema de orden alto mediante un sistema de primer o segundo orden más tiempo muerto. El único requisito del sistema es que todos sus polos sean reales. En general, se desea obtener una planta de la forma: G(s) = K e−Ls . (τ1 s + 1)(τ2 s + 1) (4.45) En este caso, K es la ganancia estacionaria, τ1 es la constante de tiempo más grande del sistema, L es el retardo efectivo y τ2 es una constante de tiempo de segundo orden. Si solo se busca un modelo de primer orden, τ2 = 0 y τ1 entonces se conoce como constante de tiempo efectiva. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 137 Aproximación retardo Factor original 1 amplitud 0.8 0.6 0.4 0.2 0 0 0.2 0.4 0.6 0.8 tiempo (s) 1 1.2 1.4 Figura 4.13: Ejemplo de la aproximación de un factor utilizando un retardo efectivo. 4.6.1. Aproximación de polos con retardos La primera aproximación que Skogestad propone es la de reunir todas las constantes de tiempo rápidas del sistema en un solo retardo efectivo. De acuerdo con Skogestad (2003), el retardo podría aproximarse de la siguiente manera: e−Ls = 1 1 ≈ . Ls e 1 + Ls (4.46) 1 Por lo que un factor de la forma τ0 s+1 se podría considerar como un retardo e−τ0 s . En la Figura 4.13, se presenta un ejemplo de como un factor de primer orden se aproxima mediante un retardo efectivo. En el caso de que se tengan ceros de fase no mínima, estos se pueden aproximar también mediante un retardo efectivo: inv s − T0inv s + 1 = e−T0 (4.47) . Con estos dos criterios, se podría aproximar todas las constantes de tiempo pequeñas mediante retardos y encapsularlos todos junto con el retardo del sistema original, puesto que: −Toinv s + 1 −L0 s inv inv e ≈ e−L0 s e−τ0 s e−To s = e−(L0 +τ0 +To )s = e−Ls . τ0 s + 1 Escuela de Ingeniería Eléctrica (4.48) Universidad de Costa Rica 138 4.6.2. Procedimiento utilizando la Half rule Supóngase que el sistema viene dado por: Q j inv −T0j s+1 i (τ0i s + 1) Q (4.49) e−L0 s , donde las constantes de tiempo τ0i están ordenadas de mayor a menor. Nótese que este sistema no tiene polos complejos conjugados, por lo que este método solo es válido para sistemas sobreamortiguados o críticamente amortiguados. La regla del Half Rule dice que “la constante de tiempo en el denominador más grande que se desprecia se debe repartir de manera equitativa entre el retardo efectivo y la constante de tiempo más pequeña que se retiene” (Skogestad, 2003). Si por ejemplo se desea representar el sistema con un modelo de primer orden más retardo dado por: K G1 (s) = e−Ls , (4.50) τ1 s + 1 entonces, de todas las constantes de tiempo del sistema, solo se debe retener la más grande (que se representaría con τ01 ). La siguiente constante de tiempo más grande (τ02 ) se debe repartir entre la constante de tiempo efectiva (τ1 ) y el retardo efectivo (L). Entonces los parámetros del modelo reducido dado en (4.45) se calcularían de la siguiente manera: τ02 τ1 = τ01 + , (4.51) 2 X τ02 X inv L = L0 + + τ0i + T0j , (4.52) 2 j i≥3 τ2 = 0. (4.53) Si más bien, se desea un modelo de segundo orden dado por: G2 (s) = K e−Ls , ((τ1 s + 1) (τ2 s + 1)) (4.54) se deben mantener τ01 y τ02 y empezar a despreciar las constantes de tiempo de ahí en adelante. En este caso, los parámetros del sistema se calcularían como: Escuela de Ingeniería Eléctrica τ1 = τ01 , (4.55) τ03 τ2 = τ02 + , 2 X τ03 X inv L = L0 + + τ0i + T0j . 2 j i≥4 (4.56) (4.57) Universidad de Costa Rica 139 En ambos casos, la ganancia del modelo equivalente sería igual a la ganancia del sistema original. No obstante, la forma de la función de transferencia en (4.49) no toma en cuenta los ceros de fase mínima que pueden existir. El método que presenta Skogestad es útil para efectos de control, pero no representa apropiadamente el efecto de los ceros en el sistema. Por ello, para este curso, solo se debe utilizar la Half Rule para los polos y los ceros de fase no mínima del sistema. Los ceros de fase mínima se conservarán en el modelo reducido. A continuación se presentan unos ejemplos para mostrar el uso de estas reglas en la reducción de orden de sistemas. Ejemplo 4.2 Obtener una aproximación de primer orden para el sistema: G(s) = 3 . (s + 1)(0,2s + 1) Solución: En este caso, la ganancia del sistema es K = 3 y la constante de tiempo más grande es τ01 = 1. Esta es la constante que se debe conservar. La siguiente constante más grande τ02 = 0,2 se debe repartir entre el retardo y la constante de tiempo efectiva. Entonces en este caso: τ1 = 1 + L= 0,2 = 1,1 , 2 0,2 = 0,1. 2 Por lo tanto, la aproximación de primer orden G0 (s) para este sistema vendría dado por: 3 G0 (s) = e−0,1s . 1,1s + 1 En la Figura 4.14 se presenta la respuesta al escalón del sistema original y de la aproximación de primer orden. Como se puede observar, la aproximación es bastante buena, con un pequeño error al inicio debido a las aproximaciones con los tiempos muertos. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 140 3 G G 0 2.5 amplitud 2 1.5 1 0.5 0 0 1 2 3 4 tiempo (s) 5 6 7 Figura 4.14: Comparación de resultados para el ejemplo 4.2. Ejemplo 4.3 Obtener una aproximación de primer y segundo orden para el sistema: G(s) = 2(15s + 1) . (20s + 1)(s + 1)(0,1s + 1)2 Solución: En este caso el sistema tiene una ganancia K = 2, un cero de fase mínima cuya constante de tiempo es T0 = 15. Las constantes de tiempo del sistema vienen dadas por τ01 = 20, τ02 = 1, τ03 = 0,1 y τ04 = 0,1. Primero se aproximará el sistema con un modelo de primer orden, pero conservando los ceros del modelo original. Para este caso la constante de tiempo que se conserva es τ01 y se desprecian las demás. Por ello, el retardo efectivo viene dado por: L= 1 + 0,1 + 0,1 = 0,7. 2 La constante de tiempo efectiva vendría dada por: τ1 = 20 + 1 = 20,5, 2 por lo que el sistema aproximado de primer orden G01 (s) vendría dado por: G01 (s) = Escuela de Ingeniería Eléctrica 2(15s + 1) −0,7s e . 20,5s + 1 Universidad de Costa Rica 141 2 1.8 G(s) G01(s) 1.6 G02(s) 1.4 amplitud 1.2 1 0.8 0.6 0.4 0.2 0 0 20 40 60 tiempo(s) 80 100 120 Figura 4.15: Respuesta al escalón del sistema y de los modelos reducidos del ejemplo 4.3. Si se prefiere una aproximación de segundo orden, las constantes de tiempo que se deben conservar son τ01 y τ02 . Por lo que, en este caso, el retardo equivalente vendría dado por: 0,1 L= + 0,1 = 0,15. 2 Las constantes de tiempo del sistema serían entonces: τ1 = 20, τ2 = 1 + 0,1 = 1,05. 2 Puesto que ahora es τ2 el que se tiene que repartir la constante de tiempo más grande que se está descartando. Con estos cálculos, la aproximación de segundo orden viene dada por: 2(15s + 1) G02 = e−0,15s . (20s + 1)(1,05s + 1) En la Figura 4.15, se muestra el resultado de la respuesta escalón para el sistema y las dos aproximaciones que se calcularon. Como se puede observar, en este caso el modelo de primer orden no logra aproximar muy bien la respuesta al inicio, sin embargo, el resultado no es muy malo. El sistema de segundo orden en cambio, es capaz de aproximar muy bien la respuesta del sistema durante toda la prueba. Esto se debe principalmente a que la diferencia entre el polo más dominante y el resto de polos es muy marcada. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 142 4.7. Ejercicios resueltos Sistemas de segundo orden Ejercicio 4.1 Un sistema de segundo orden tiene la siguiente función de transferencia: G(s) = s2 32 + 4s + 16 (4.58) Determine: 1. La frecuencia natural del sistema. 2. El coeficiente de amortiguamiento del sistema. ¿El sistema es sobreamortiguado, críticamente amortiguado o subamortiguado? 3. Las unidades de la ganancia si las unidades de entrada son ampers y las unidades la salida son litros por segundo. Solución La forma general de la función de transferencia de un sistema de segundo orden es: kωn2 , (4.59) G(s) = 2 s + 2ξωn s + ωn2 comparando la forma general de (4.59) con (4.58): kωn2 32 = , s2 + 4s + 16 s2 + 2ξωn s + ωn2 (4.60) de acá se deduce que ωn2 = 16 ⇒ ωn = 4rad/s. Tomando en cuenta el segundo coeficiente de los denominadores en (4.60), se llega a que: 4 = 2ξωn ⇒ ξ = 4 2 = = 0,5. 2ωn 4 Como se cumple que 0 < ξ < 1, el sistema es subamortiguado y su salida presentará oscilaciones en régimen transitorio. Tomando en cuenta los numeradores en (4.60), se tiene que: 32 = kωn2 , por lo que k = 2. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 143 80 70 60 salida (V) 50 40 30 20 10 0 0 1 2 3 4 5 6 tiempo (s) 7 8 9 10 Figura 4.16: Curva de reacción de segundo orden para el Ejercicio 4.2. La ganancia de un sistema de segundo orden subamortiguado es igual a: k= ∆y . ∆u Si la entrada está dada en amper y la salida en litros por segundo, se tendría que: k= ∆y L/s L = = , ∆u A As (4.61) por lo que las unidades de k son litros por amper por segundo. En la práctica para evitar que k tenga unidades, tanto la señal de entrada como la salida se manejan en porcentajes con respecto a las valores máximo y mínimo que las variables pueden alcanzar. Si se hace esta normalización, entonces la ganancia sería adimensional. Ejercicio 4.2 En la Figura 4.16, se muestra la curva de reacción de un sistema de segundo orden con una frecuencia natural ωn = 5 rad/s. Determine: La sobreelongación porcentual. El coeficiente de amortiguamiento del sistema. El tiempo de asentamiento para una banda del 5 %. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 144 El tiempo de subida. Compare cada resultado con la medición directa a partir de la gráfica. Solución: La sobreelongación porcentual se determina a partir de la curva como: Mp = ymax − yf · 100 %, yf donde ymax es el valor máximo de la respuesta del sistema (el valor que toma en el tiempo al pico) y yf es el valor de la salida en estado estacionario. De la Figura 4.16, se puede obtener que ymax = 73,3 y yf = 48 por lo tanto: 73,3 − 48 · 100 % = 52,7 %, 48 Conociendo la sobreelongación porcentual, se puede determinar el coeficiente de amortiguamiento del sistema: Mp = Mp = 100e √−ξπ 1−ξ2 ⇒ 52,7 = 100e √−ξπ 1−ξ2 , esta es una ecuación no lineal de una sola variable (ξ) que se puede resolver fácilmente con la ayuda de logaritmos naturales. Al resolverlo se llega a que ξ = 0,2. Conociendo ωn y ξ, el tiempo de asentamiento para una banda de 5 % se puede calcular como: 3 3 ta5 % = = =3s ξωn 0,2 · 5 Si se grafica la respuesta escalón junto con la banda de ±5 % (entre 45,59 y 50,39) como en la Figura 4.17, el tiempo que se mide es 3,8 s. Como el escalón se aplica en el instante t0 = 1 s, eso quiere decir que el tiempo de asentamiento medido de la gráfica es 2,8 s. Esto concuerda bastante bien con la aproximación de 3 s que se calculó con los parámetros del sistema obtenidos. El tiempo de subida se define como el tiempo que le toma al sistema pasar del 0 % al 100 % de su valor final la primera vez. Conociendo los parámetros, esto se calcula como: !! √ 2 1 ω 1 − ξ n tr = √ π − tan−1 = 0,3617 ξωn ωn 1 − ξ 2 Cuando se mide el tiempo de subida en la gráfica (ver Figura 4.18), se puede observar que la ecuación predice correctamente este tiempo. En la gráfica, se mide que el tiempo en que el sistema llega por primera vez al 100 % de su valor final es 1,36 s. Como el escalón se aplicó en el instante t0 = 1 s, se llega a la conclusión que el tiempo de subida medido en la gráfica es 0,36, que coincide con el cálculo anterior. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 145 80 70 60 salida (V) 50 X: 3.8 Y: 45.59 40 30 20 10 0 0 1 2 3 4 5 6 tiempo (s) 7 8 9 10 Figura 4.17: Respuesta escalón junto con la banda del tiempo de asentamiento del 5 %. 80 70 salida (V) 60 50 X: 1.36 Y: 47.99 40 30 20 10 0 0 2 4 6 8 10 tiempo (s) Figura 4.18: Medición del tiempo de subida directamente desde la curva de reacción. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 146 Concepto de polos dominantes Ejercicio 4.3 Suponga que se le solicita elegir un sensor para conectar a la salida de una planta de segundo orden con las siguiente características: Mp % = 20 %, ta2 % = 4 s. El sensor solo puede ser de primer orden, es decir, corresponde a la función de transferencia: k Gs (s) = Ts + 1 Determine los valores de T y k para que la salida del conjunto sensor planta sea aproximadamente la salida de la planta. Solución: Al conectar un sensor a una planta, la función de transferencia equivalente corresponde a: GE (s) = Gp (s)Gs (s) donde: GE (s) es la función de transferencia equivalente, Gp (s) es la función de transferencia de la planta y Gs (s) es la función de transferencia del sensor. El objetivo es que se logre que: GE (s) = Gp (s)Gs (s) ≈ Gp (s) por lo que es necesario conocer la función de transferencia de la planta. De las especificaciones dadas se obtiene que: √−πξ Mp % = 20 = 100e 1−ξ2 ⇒ ξ = 0,456, 1 4 ta2 % = 4 = ⇒ ωn = = 2,2. ωn ξ ξ Entonces, la planta tendría una función de transferencia dada por: Gp (s) = kp ωn2 4,84kp ≈ 2 , 2 2 s + 2ξωn s + ωn s + 2s + 4,84 por lo tanto se necesita que: GE (s) = Escuela de Ingeniería Eléctrica (s2 4,84kp k 4,84kp ≈ 2 , + 2s + 4,84)(T s + 1) s + 2s + 4,84 Universidad de Costa Rica 147 12 10 Salida=(V) 8 6 4 Planta Conjunto=Planta−Sensor,=T=0.1 Conjunto=Planta−Sensor,=T=0.05 2 0 0 1 2 3 Tiempo=(s) 4 5 6 Figura 4.19: Respuesta de conjunto Planta-Sensor con dos valores de T . De donde se deduce inmediatamente que k = 1, por otro lado, el polo de la planta ubicado en −1/T debe ser, por lo menos, 10 veces menor a la parte real de los polos de la función de segundo orden, por lo tanto: −1 1 1 −1 ≤ −10ξωn ⇒ ≤ −10 ⇒ ≥ 10 ⇒ T ≤ . T T T 10 En resumen k = 1 y T ≤ 0,1. En la Figura 4.19 se muestra el comportamiento de la salida del sensor con respecto a la salida de la planta con un valor de T = 0,1 y un valor T = 0,05. Cómo se puede observar, cuánto más pequeño es T (el sensor es más rápido) la salida que da el sensor se parece más a la salida de la planta. Ejercicio 4.4 Encontrar un modelo de orden reducido para el sistema: G(s) = (−0,3s + 1)(0,08s + 1) . (2s + 1)(s + 1)(0,4s + 1)(0,2s + 1)(0,05s + 1)3 Solución: Este sistema tiene siete polos, un cero de fase mínima y un cero de fase no mínima. El cero de fase no mínima se puede aproximar con un retardo puro, el cual se suma al retardo efectivo que aparece con los polos que se descartan. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 148 Si se obtiene un modelo de primer orden, la constante de tiempo que se retiene es τ01 = 2, por lo que, la constante de tiempo efectiva vendría dada por: τ1 = 2 + 1 = 2,5. 2 El retardo efectivo entonces vendría dado por: L = 0,3 + 1 + 0,4 + 0,2 + 3 · 0,05 = 1,55. 2 por lo que el modelo equivalente de primer orden sería: G01 = 0,08s + 1 −1,55s e . 2,5s + 1 Para un sistema de segundo orden, las constantes de tiempo efectivas vendrían dadas por: τ1 = 2, τ2 = 1 + 0,4 = 1,2. 2 El retardo efectivo se calcula entonces con el resto de constantes de tiempo que se descartan 0,4 L = 0,3 + + 0,2 + 3 · 0,05 = 0,85. 2 Entonces el modelo equivalente sería: G02 = 0,08s + 1 e−0,85s . (2s + 1)(1,2s + 1) En la Figura 4.20, se muestra la respuesta al escalón del sistema original y los dos modelos reducidos. Al igual que en los ejemplos anteriores, la mejor aproximación se obtuvo mediante el modelo de segundo orden más tiempo muerto sobreamortiguado. En este caso, la respuesta del sistema real y la del modelo reducido son casi indistinguibles. Por supuesto, si el efecto del cero de fase no mínima fuera más notorio, la aproximación podría no ser muy buena. Sin embargo, es claro que el método “Half Rule” es una manera sencilla de obtener modelos aproximados de orden bajo. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 149 1.2 1 amplitud 0.8 0.6 0.4 0.2 G(s) G01(s) 0 G (s) 02 −0.2 0 2 4 6 8 10 tiempo (s) 12 14 16 18 Figura 4.20: Respuesta al escalón del sistema del ejercicio 4.4. Escuela de Ingeniería Eléctrica Universidad de Costa Rica Parte II. Modelado e Identificación 150 5. Modelado analítico de sistemas En este capítulo se presentan las ecuaciones físicas de varios sistemas comunes. El modelado de los sistemas es el primer paso para el análisis y el diseño de los sistemas de control. En la sección 5.1, se presenta una breve descripción de las leyes fundamentales que se van a considerar en este capítulo. En la sección 5.2 se presenta un breve repaso de los sistemas eléctricos, que ya se estudiaron en la sección 2.2. En la sección 5.3 se introducen los sistemas mecánicos traslacionales mientras que los rotacionales se presentan en la sección 5.4. En la sección 5.5.1, el motor de corriente directa se presenta como un ejemplo de un sistema electromecánico. El modelado analítico termina con los modelos de sistemas térmicos e hidráulicos, que se presentan en la sección 5.6 y 5.7 respectivamente. En la sección 5.8, se presenta un tipo de modelo que estudia la relación entre las variables del sistema, pero en régimen permanente, es decir, cuando los estados tienen valores constantes. Por último, muchos de estos modelos son modelos no lineales que no se pueden escribir en la forma lineal de un MVE. Por ello en la sección 5.9 se presenta un método para linealizar las ecuaciones diferenciales alrededor de un punto de operación. 5.1. Leyes fundamentales A partir de la experimentación y la observación, se han encontrado ciertas relaciones en la naturaleza que al parecer se cumplen siempre. A estas relaciones se les llama “leyes fundamentales” y están relacionadas con la conservación de la energía y la materia. Sumado a esto, hay algunas características comunes a todos los sistemas que se pueden utilizar como una forma más general de modelado y que pueden ser útiles a la hora de analizar y simular los sistemas bajo estudio. 5.1.1. Balance de masa Este principio establece que en un sistema, la cantidad de masa total permanece constante, es decir, no se puede crear ni destruir masa. En la actualidad se sabe que existe una relación entre masa y energía y por ello, una parte de la masa se puede 151 152 transformar en energía, pero el total, masa más energía, permanece constante. Sin embargo, en los procesos normales (bajas temperaturas y bajas velocidades) esta conversión es tan pequeña, que se suele hacer un balance de masa separado del balance de energía. En el caso de la masa, la relación se puede escribir como sigue (Loría y Mazón, 1989): n m X X d (ρv (t)V (t)) (ρi (t)qi (t)) − (ρj (t)qj (t)) = , (5.1) dt i=1 j=1 donde: ρi (t) es la densidad de la i-ésima sustancia que entra al sistema (kg/m3 ). ρj (t) es la densidad de la j-ésima sustancia que sale del sistema (kg/m3 ). qi (t) es el caudal de la i-ésima sustancia que entra al sistema (m3 /s). qj (t) es el caudal de la j-ésima sustancia que sale del sistema (m3 /s). ρv (t) es la densidad de la sustancia que está dentro del sistema (kg/m3 ). V (t) es el volumen de la sustancia que se encuentra dentro del sistema. Si se tiene J componentes diferentes, esta ecuación se debe cumplir para la totalidad de la masa del sistema, sin embargo, si ocurre alguna reacción química durante el proceso, esta ecuación no será válida para cada componente por separado, puesto que hay transformaciones de por medio. Para tomar en cuenta estas transformaciones, se puede escribir una ecuación de continuidad para cada j-ésimo componente: dmj = ηje − ηjs + ηjf , dt (5.2) donde: ηje es el flujo de moles de la j-ésima sustancia que entra al sistema (mol/s). ηjs es el flujo de moles de la j-ésima sustancia que sale del sistema (mol/s). ηjf es la tasa de formación de moles, por la reacción química, de la j-ésima sustancia (mol/s). mj son los moles de la j-ésima sustancia dentro del sistema (mol). Escuela de Ingeniería Eléctrica Universidad de Costa Rica 153 La tasa de formación de moles dependerá de la estequiometría de la reacción y de la cantidad de reactantes que haya en el sistema. Si el volumen V (t) del sistema es constante, esta reacción se podría escribir como: ηjf = V υj rj , (5.3) donde υj depende de la estequiometría y rj es la tasa de variación que depende de la naturaleza de la reacción y de la cantidad de reactantes. Por lo tanto, si se tienen J componentes dentro del sistema, se pueden escribir J ecuaciones de continuidad. Sin embargo, el balance de masas total del sistema no es independiente de estas ecuaciones, por lo que, en realidad, se podrían escribir el balance de masas total y J − 1 ecuaciones que serían linealmente independientes. 5.1.2. Balance de energía Al igual que la masa, la energía no se puede crear ni destruir. La ecuación de balance de energía se puede plantear de la siguiente forma: Ue − Us + Q − W = dU , dt (5.4) donde Ue es el flujo de energía cinética y potencial que entra al sistema (J/s). Us es el flujo de energía cinética y potencial que sale del sistema (J/s). Q es la cantidad de calor agregado al sistema, por unidad de tiempo (J/s). W es el trabajo hecho por el sistema, por unidad de tiempo, en sus alrededores (J/s). U es la cantidad de energía interna del sistema (J). 5.1.3. Conservación de la cantidad de movimiento Esta ley indica que, en un sistema cerrado, la cantidad de movimiento (esto es, el producto de la masa de un cuerpo y su velocidad) se mantiene constante si no actúan fuerzas sobre él. En caso de que existan fuerzas externas, la razón de cambio de la cantidad de movimiento es igual a la fuerza neta sobre el cuerpo: n dM v X = Fj , dt j=1 (5.5) con Escuela de Ingeniería Eléctrica Universidad de Costa Rica 154 v es el vector de velocidad (m/s). Fj es el vector de la j-ésima fuerza (N). M es la masa (kg). Si la masa no varía, esta ecuación se reduce a la ecuación de la segunda ley de Newton. Esta ecuación vectorial se puede dividir en ecuaciones escalares, una para cada dimensión que se esté considerando. 5.1.4. Otras leyes de conservación Junto con estas leyes de conservación, existen otras leyes que son importantes en el análisis de sistemas, como la ley de conservación de la cantidad de movimiento angular, que es una ley análoga a la de la cantidad de movimiento, pero referida a sistemas que se mueven con respecto a un punto en particular. También existe la ley de conservación de carga eléctrica, que es similar a la de la conservación de la masa, que indica que la carga neta de un sistema cerrado se mantiene constante, y no se puede crear ni destruir la carga eléctrica. 5.1.5. La red generalizada Los sistemas que se estudian en este curso pueden ser modelados mediante ecuaciones diferenciales lineales de coeficientes constantes. Por lo tanto, es de esperar que entre ellas existan ciertas similitudes. Es posible describir estas similitudes de manera que cualquier sistema físico, se pueda describir como si fuera un circuito eléctrico equivalente. A esta equivalencia se le llama red generalizada (Alfaro, 2005). Algunas de las variables de los sistemas pueden ser catalogadas como transvariables, es decir, variables que necesitan de dos puntos para ser medidas. Un ejemplo de esto es la tensión a través de un elemento eléctrico, puesto que la tensión siempre se mide como la diferencia de potencial eléctrico entre los dos terminales de dicho elemento1 . Otros ejemplos de transvariables son la velocidad, la presión y la temperatura. Otras variables son del tipo pervariable, o sea, que solo se necesita un punto para medirlas. Estas variables se pueden asociar como a un flujo a través de los elementos que no se ve afectado, es decir, el valor de la pervariable en una de las terminales de un elemento generalizado es igual al valor en la otra terminal, tal y como se muestra en la Figura 5.1. Como ejemplos de este tipo de variables se tienen la corriente eléctrica, la fuerza, el caudal y el flujo de calor. La relación entre las transvariables y las 1 El potencial eléctrico de una terminal, tampoco se puede medir con solo este punto, sino que es necesario medirlo con respecto a la tierra, que se considera como el cero de referencia. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 155 Figura 5.1: Elemento generalizado y la relación entre pervariables y transvariables. Elemento Impedancia Generalizada Resistencia generalizada Capacitancia generalizada Inductancia generalizada Rg 1 Cg p Lg p Cuadro 5.1: Impedancias generalizadas. pervariables viene dada por: v21 (t) = Zg (p)f21 (t), (5.6) donde Zg (p) es la impedancia generalizada y p es el operador derivada, v21 representa la transvariable medida entre el terminal 2 y el terminal 1, es decir v21 = v20 − v10 , donde v10 representa el valor de la transvariable tomando una referencia dada (la tierra generalizada) y f21 es el valor de la pervariable que fluye desde el punto 2 al punto 1. Cada uno de los elementos generalizados tendrá su propia impedancia generalizada, tal y como se muestra en el Cuadro 5.1. Sumados a estos elementos, también se cuenta con fuentes generalizadas, tanto de transvariables como pervariables que son análogas a las fuentes de tensión y corriente de los circuitos eléctricos. Para formar la red, cada uno de los elementos se debe interconectar y a cada punto de interconexión se le llama nodo. Cada nodo tiene una transvariable asociada que se mide con respecto un nodo de referencia que sería la tierra del sistema. Cada elemento o “rama” entre dos nodos tendrá asociada una pervariable. En la Figura 5.2, se muestra un ejemplo de una red generalizada. Esta red podría representar tanto un sistema eléctrico, mecánico, térmico o hidráulico. Sumado a las ecuaciones de los elementos, se deben tener unas leyes de interconexión. Estas leyes Escuela de Ingeniería Eléctrica Universidad de Costa Rica 156 Figura 5.2: Ejemplo de una red generalizada. son análogas a las leyes de Kirchhoff para circuitos eléctricos: Ley de incidencias de las pervariables: La suma de todas las pervariables que inciden en un nodo cualquiera de la red generalizada es cero. En el caso de la Figura 5.2 se tendría: fi − f10 − f12 = 0, f12 − f20a − f20b − f23 = 0, f23 − f30 = 0. Ley de contorno de las transvariables: La suma de todas las transvariables tomadas alrededor de cualquier contorno cerrado de la red generalizada es cero. En la Figura 5.2 se tendrían las siguientes ecuaciones: v10 − v12 − v20 = 0, v20 − v23 − vi = 0. En las secciones siguientes, se presentarán las distintas ecuaciones que modelan los sistemas físicos y en forma paralela, se presentará la relación que existe entre estas ecuaciones y la red generalizada. 5.2. Modelado de sistemas eléctricos Los circuitos eléctricos ya fueron estudiados en la sección 2.2. Aquí, solo se presenta un pequeño resumen de las ecuaciones de los elementos, utilizando la notación de la red generalizada. Los principales elementos eléctricos se presentan en el Cuadro 5.2. La diferencia con respecto a la Sección 2.2, es que se hace énfasis en que, la tensión en los elementos es en realidad una diferencia de potencial, de manera que Escuela de Ingeniería Eléctrica Universidad de Costa Rica 157 Elemento Capacitor Parámetro Capacitancia (F) i21 (t) = (t) C dv21 dt L di21dt(t) Inductor Inductancia (H) v21 (t) = Resistor Resistencia (Ω) v21 (t) = Ri21 (t) Transformador Relación de transformación a v43 (t) = a1 v21 (t) i21 (t) = a1 i34 (t) Ganancia K v30 (t) = Kv12 (t) i1 (t) = 0 i2 (t) = 0 Amplificador operacional Símbolo Ecuación + - + - + - + + - + - Cuadro 5.2: Modelos de los elementos de los sistemas eléctricos. v21 (t) = v2 (t) − v1 (t) con v2 (t) y v1 (t) los potenciales de los nodos 2 y 1, medido con respecto a un nodo de referencia (la tierra). Además se ha agregado un elemento transformador de variables, que en el caso eléctrico es precisamente un transformador eléctrico. Acá se supone que las pérdidas en el transformador son despreciables, por lo que, siguiendo la ley de conservación de energía, en un transformador se debe cumplir v21 (t)i21 (t) = v43 (t)i34 (t), (5.7) es decir, los valores de la corriente y la tensión pueden variar, pero no así, la cantidad de energía que se está trasegando. También se ha incluido un elemento amplificador diferencial: el amplificador operacional. Este es un dispositivo ampliamente utilizado en circuitos electrónicos y especialmente en sistemas de instrumentación. El modelo ideal de este elemento tiene Escuela de Ingeniería Eléctrica Universidad de Costa Rica 158 - + Figura 5.3: Circuito con amplificador operacional para el Ejemplo 5.1. como ecuación: v30 (t) = K (v10 (t) − v20 (t)) , = Kv12 (t). (5.8) Idealmente, el valor de K es constante y muy grande (del orden de 106 ) aunque a veces, para simplificar el análisis se supone un valor infinito. Cuando K se supone infinito, el valor de la tensión entre los terminales de entrada se supone que es igual a cero (v12 = 0). El modelo ideal del amplificador operacional, también supone que la corriente que entra al dispositivo a través de sus terminales 1 y 2 es prácticamente igual a cero y que a la salida, la tensión de salida del amplificador (v30 ) es independiente de la corriente de salida (i3 ). Esta corriente dependerá del resto del circuito, por lo que no necesariamente es igual a cero. La ganancia en los amplificadores operacionales reales depende de la frecuencia de las señales de entrada. Según Ogata (2003), la ganancia de un amplificador operacional se mantiene en el orden de los 106 hasta frecuencias alrededor de los 10 Hz. Ya para frecuencias mayores de 1 MHz, la ganancia K es cercana a la unidad. Por lo tanto, un modelo más realista de este elemento tomaría en cuenta la variación de esta ganancia con respecto a la frecuencia. Ejemplo 5.1 Para la Figura 5.3, obtener la ecuación que relaciona la salida del circuito vout (t) con la entrada vin (t). Solución: Dado el modelo del amplificador operacional con K grande pero finita, se puede obtener que: vout (t) = −Kv10 (t), (5.9) Escuela de Ingeniería Eléctrica Universidad de Costa Rica 159 porque vout (t) es igual a la salida del amplificador y la patilla positiva del amplificador está conectada a tierra (0 V). Puesto que la corriente que entra al amplificador operacional es prácticamente cero, se cumple que: i1 (t) = i2 (t). (5.10) Utilizando el modelo para los resistores se obtiene que: vin − v10 (t) , R1 v10 − vout (t) i2 (t) = , R2 i1 (t) = (5.11) por lo tanto, introduciendo las relaciones (5.11) en (5.10), se llega a: v10 (t) = R2 R1 vin + vout . R1 + R2 R1 + R2 (5.12) Introduciendo (5.12) en (5.9), se llega a la relación: vout (t) = −R2 vin (t). R1 + (R1 + R2 ) 1 K (5.13) Que es la relación que se solicita en el enunciado del ejemplo. Si se simplifica el modelo mediante K → ∞, se llega a que: vout (t) = −R2 vin (t), R1 por este resultado, a esta configuración de circuito se le conoce como amplificador inversor: la ganancia de amplificación del circuito depende de los valores de R1 y R2 , pero la polaridad de la tensión de salida siempre será la inversa a la de la tensión de entrada. 5.3. Modelado de sistemas mecánicos traslacionales Los sistemas mecánicos traslacionales están relacionados con el movimiento de los cuerpos debido al efecto de fuerzas sobre ellos. Las principales variables implicadas corresponden a la fuerza, velocidad y posición de los distintos elementos. En el Escuela de Ingeniería Eléctrica Universidad de Costa Rica 160 cuadro 5.3 se presentan los principales elementos y sus ecuaciones. Para efectos de este curso, solo se considerará el movimiento en una sola dimensión. En el caso de más dimensiones, estas mismas ecuaciones serán válidas para cada una de las dimensiones consideradas, o bien, se podrá reescribir las ecuaciones en una forma vectorial. El primer elemento con el que se trabaja en los sistemas mecánicos es la masa. De acuerdo con la segunda ley de Newton, la fuerza que se aplica a un cuerpo es igual al cambio en la cantidad de movimiento del mismo d (M (t)v(t)) = f (t), dt (5.14) donde M (t) es la masa del cuerpo medida en kilogramos (kg), v(t) es la velocidad en m/s y f (t) es la fuerza que se aplica sobre el cuerpo medida en newtons (N). Si la masa es constante, se obtiene la forma común de la segunda ley de Newton, sabiendo que la aceleración de un cuerpo es igual a la tasa de cambio de la velocidad del mismo. M d (v(t)) = f (t). dt (5.15) La masa se considera como un almacenador de energía cinética (gracias a su velocidad). Si el sistema se mueve en dirección vertical bajo el efecto de la gravedad, la masa también es capaz de almacenar energía potencial en función de su altitud con respecto al suelo. Si el cuerpo se ve sujeto a un campo gravitacional que provoca una aceleración g, la energía potencial de un cuerpo a una altura h viene dada por: U = mgh. (5.16) Si además el cuerpo está en movimiento, su energía cinética vendría dada por: 1 T = mv 2 , 2 (5.17) v corresponde a la magnitud de la velocidad, por lo que si el cuerpo se mueve en más de una dimensión, debe tomarse en cuenta todas las componentes. Hay que recordar además que, debido a la ley de la conservación de la energía, el cambio en la energía del sistema (en el caso mecánico, la suma de la energía potencial y la cinética) es igual al trabajo realizado por la fuerza externa que actúa sobre el sistema. Como se mencionó en la Sección 5.1.5, la velocidad se puede tomar como una transvariable y la fuerza como una pervariable, por lo que la masa de un cuerpo es un caso particular de la capacitancia generalizada en la que la impedancia generalizada 1 vendría dada por Z(p) = pM . Escuela de Ingeniería Eléctrica Universidad de Costa Rica 161 Elemento Parámetro Ecuación f (t) Masa Masa (kg) Resorte Lineal Constante del resorte (N/m) f (t) o df (t) dt Símbolo = M a(t) 2 = M d dtx(t) 2 = M dv(t) dt = K∆x(t) = K (x2 (t) − x1 (t)) = K (v2 (t) − v1 (t)) Amortiguador Coeficiente de fricción (N/(m/s)) f (t) = B (v2 (t) − v1 (t)) 1 (t)) f (t) = B d(x2 (t)−x dt Palanca Ideal - x1 (t) = x2 (t) ab f2 (t) = f1 (t) ab Cuadro 5.3: Modelos de los elementos de los sistemas mecánicos. Normalmente se suelen definir los desplazamientos de los sistemas tomando como referencia la posición inicial de las masas. En este curso se supondrá que las masas son cuerpos rígidos que no se deforman y que la fuerza y la velocidad de cada cuerpo está aplicada en el centro de masa. El otro elemento importante es el resorte lineal ideal. Este elemento es capaz de deformarse y almacenar energía potencial. La fuerza que se aplica en el resorte es directamente proporcional a la deformación. f (t) = k∆x(t), f (t) = k (x2 (t) − x1 (t)) , (5.18) k es la constante del resorte (N/m), ∆x(t) = x2 (t) − x1 (t) es la deformación neta. Se debe tomar en cuenta que x1 y x2 se deben elegir de manera que para x1 = x2 = 0 la elongación del resorte sea igual a cero. Esto se hace así, porque la ecuación de la fuerza del resorte es válida para los desplazamientos tomados desde su posición de reposo. Se supondrá además que la masa del resorte es despreciable y por lo tanto las fuerzas que actúan en ambos extremos tienen la misma magnitud y sentido contrario. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 162 Derivando a ambos lados de (5.18) se obtiene: df (t) = k (v2 (t) − v1 (t)) , dt df (t) = kv21 (t), dt (5.19) v21 (t) es la velocidad relativa del extremo 2 del resorte con respecto al extremo 1. A partir de (5.19), se puede deducir que el resorte lineal ideal, es un caso particular de la inductancia generalizada, donde la impedancia generalizada vendría dada por Z(p) = k1 p. Hasta ahora, solo se han visto elementos mecánicos almacenadores de energía. El amortiguador en cambio es un elemento que solo es capaz de disipar energía. Al igual que el resorte, se considera que su masa es despreciable, y por lo tanto, las fuerzas aplicadas en sus extremos están balanceadas. La relación entre la fuerza y la velocidad en un amortiguador viene dada por: f (t) = Bv21 (t), (5.20) el parámetro B se conoce como coeficiente de amortiguamiento y sus unidades vienen dadas por (N s/m). A partir de su ecuación, se puede observar que los amortiguadores son un caso particular de resistencia generalizada, cuyo valor de impedancia es igual a Z(p) = B1 . El último elemento que se considera dentro de los sistemas mecánicos traslacionales es la palanca ideal. Una palanca ideal se define como “una barra rígida pivoteada en un punto, que no tiene masa, el pivote no presenta fricción, no tiene momento ni almacena energía” (Loría y Mazón, 1989). La relación entre el desplazamiento y el ángulo de la barra viene dado por: x1 (t) = a sen (θ(t)) , x2 (t) = b sen (θ(t)) , (5.21) pero para desplazamientos pequeños, se puede aproximar a: x1 (t) ≈ aθ(t), x2 (t) ≈ bθ(t). (5.22) Despejando θ en la ecuación de x2 e introduciendo en la ecuación de x1 : a x1 (t) = x2 (t). b Escuela de Ingeniería Eléctrica (5.23) Universidad de Costa Rica 163 Al derivar (5.23) con respecto al tiempo, se obtiene: a v1 (t) = v2 (t). b (5.24) Para encontrar la relación entre las fuerzas, como la palanca no tiene momento y el ángulo θ es pequeño, se obtiene que el par producido por la fuerza f1 tiene que ser igual al par producido por la fuerza f2 f1 (t)a = f2 (t)b, (5.25) lo que implica que b (5.26) f1 (t) = f2 (t). a Las leyes que relacionan los elementos son la segunda y tercera ley de Newton, y la ley de desplazamientos. La segunda ley de Newton expresa que la aceleración de un cuerpo dependerá de su masa y del efecto conjunto de las fuerzas que actúan sobre el cuerpo: n X dv(t) , (5.27) fi (t) = M dt i=1 donde n es el número total de fuerzas sobre la masa. Puesto que solo se trata con el movimiento traslacional en una dimensión, se supondrá que las fuerzas que actúan hacia la derecha serán positivas mientras que las fuerzas que actúan hacia la izquierda serán negativas. La tercera ley de Newton indica que si un elemento ejerce una fuerza sobre otro elemento, entonces existe una fuerza de reacción del segundo elemento sobre el primero, de igual magnitud pero sentido contrario. Esto es útil para determinar la dirección de las fuerzas al realizar un diagrama de cuerpo libre para determinar las ecuaciones del movimiento de los elementos. Por último, la llamada ley de desplazamientos indica que, dado que “los puntos de unión de los elementos mecánicos que están sometidos a una fuerza, se moverán a la misma velocidad y su desplazamiento también será el mismo. Por esta razón, la suma algebraica de las elongaciones (tomadas a partir de las referencias) y las velocidades alrededor de cualquier lazo cerrado debe ser cero” (Loría y Mazón, 1989). Ejemplo 5.2 Encuentre un MVE del sistema presentado en la Figura 5.4, si u es la entrada del sistema y x1 y x2 son las salidas. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 164 Figura 5.4: Figura del ejemplo 5.2. Figura 5.5: Diagrama del cuerpo libre del ejemplo 5.2. Dibujar la red generalizada correspondiente al sistema de la Figura 5.4. Solución: Para escribir las ecuaciones de este sistema, lo primero que se debe hacer es dibujar los diagramas de cuerpo libre de las masas presentes en el sistema tal y como se presenta en la Figura 5.5. Los diagramas de cuerpo libre representan a la masa y las fuerzas a las que se ve sometida, tomando cada una de las masas presentes por separado. fr1 , fr2 y fr3 son las fuerzas producidas por los resortes, mientras que fa1 y fa2 son las fuerzas producidas por los amortiguadores. La variable u es la fuerza externa que mueve el sistema. Nótese que la dirección de la fuerza fr3 para el diagrama del cuerpo libre de la masa 1 tiene sentido contrario a la fuerza fr3 del diagrama del cuerpo libre de la masa 2, siguiendo la tercera ley de Newton. Si x1 y x2 son los desplazamientos de la masa 1 y la masa 2 respectivamente y además v1 y v2 representan sus velocidades, a partir de la segunda ley de Newton se pueden escribir las siguientes ecuaciones: dv1 , dt dv2 = M2 . dt u − fr1 − fa1 − fr3 = M1 fr3 − fr2 − fa2 (5.28) (5.29) Es importante aclarar que x1 y x2 son los desplazamientos de las masas a partir de su posición en reposo y no la posición de las masas con respecto a una referencia. Un valor positivo de x1 indicará que la masa se ha movido hacia la derecha, mientras que un valor negativo corresponde a un desplazamiento hacia la izquierda. Las ecuaciones Escuela de Ingeniería Eléctrica Universidad de Costa Rica 165 de los resortes vendrían dadas por: fr1 = K1 x1 , fr2 = K2 x2 , fr3 = K3 (x1 − x2 ) , (5.30) (5.31) (5.32) para el caso de los amortiguadores: fa1 = B1 v1 , fa2 = B2 v2 . (5.33) (5.34) Si se introducen las ecuaciones de los elementos en las ecuaciones de la segunda ley de Newton, se obtienen las siguientes relaciones: dv1 , dt dv2 K3 (x1 − x2 ) − K2 x2 − B2 v2 = M2 . dt u − K1 x1 − B1 v1 − K3 (x1 − x2 ) = M1 (5.35) (5.36) Definiendo el vector de estados como x = [x1 , v1 , x2 , v2 ]T y el vector de salidas 1 2 como y = [x1 , x2 ]T . Sabiendo que v1 = dx y v2 = dx , el MVE del sistema queda de dt dt la siguiente manera: 0 ẋ = −(K1 +K3 ) M1 0 1 0 −B1 M1 K3 M1 0 0 K3 M2 " y= 1 0 0 0 0 1 0 0 0 −(K2 +K3 ) M2 0 0 1 −B2 M2 0 1 x + M1 0 0 u, (5.37) # x. Para obtener la red generalizada de este ejemplo, tenemos que considerar primero el número de nodos del sistema. A cada nodo se le debe asociar una transvariable y como en este caso solo se tienen dos velocidades, la red tendrá solo dos nodos más el nodo de referencia, que en este caso, son las velocidades del suelo y las paredes que se consideran como cero. Cada masa entonces corresponde a un capacitor generalizado, cada resorte a un inductor generalizado y cada amortiguador a una resistencia generalizada. La red equivalente se encuentra en la Figura 5.6. Si se aplica la ley de incidencia de pervariables a ambos nodos marcados con v1 y v2 , se obtiene Escuela de Ingeniería Eléctrica Universidad de Costa Rica 166 la siguiente relación: dv1 = 0, dt dv2 fr3 − fr2 − fa2 − M2 = 0. dt (5.38) u − fr1 − fa1 − fr3 − M1 (5.39) Y al comparar las ecuaciones (5.28) y (5.29) con (5.38) y (5.39) se puede comprobar que ambas ecuaciones son las mismas y, puesto que las ecuaciones de cada elemento son equivalentes, la red de la Figura. 5.6 representa el mismo sistema original. Figura 5.6: Red Generalizada correspondiente al sistema de la Figura 5.5. 5.4. Modelado de sistemas mecánicos rotacionales Los sistemas mecánicos rotacionales son aquellos en los que se estudian masas en rotación con respecto a un eje. Las ecuaciones y los elementos son análogos a los de los sistemas mecánicos traslacionales de la sección 5.3. Las variables que se utilizan normalmente son las siguientes: θ(t) es el desplazamiento angular (rad). τ (t) es el par (N m). ω(t) es la velocidad angular (rad/s). α(t) es la aceleración angular (rad/s2 ). Escuela de Ingeniería Eléctrica Universidad de Costa Rica 167 Elemento Parámetro Ecuación τ Inercia rotacional Inercia J (kg m ) Resorte torsional Constante del resorte K (N m/rad) 2 Amortiguador torsional Coeficiente de fricción B (N m s/rad) Engranaje ideal - τ o Símbolo = Jα 2 = J ddt2θ = J dω dt = K∆θ = K (θ2 − θ1 ) dτ dt = K (ω2 − ω1 ) τ τ = B (ω2 − ω1 ) = B d(θ2dt−θ1 ) θ1 = θ2 rr21 τ2 = τ1 rr12 Cuadro 5.4: Modelos de los elementos de los sistemas mecánicos rotacionales. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 168 En este caso, τ es la pervariable mientras que ω es la transvariable correspondiente. Los elementos principales de este tipo de sistemas se presentan en el Cuadro 5.4. El primero de los elementos es la inercia rotacional. La inercia rotacional J es la propiedad de un elemento de almacenar energía cinética debido a su movimiento rotacional (Kuo, 1996). La inercia rotacional cumple un papel similar a la masa de los sistemas mecánicos, con la diferencia que la inercia rotacional depende de la densidad y de la geometría del cuerpo. Para el caso de N masas puntuales mi , i = 1, . . . , N girando alrededor de un eje a una distancia ri cada una, la inercia rotacional vendría dado por: J= N X mi ri2 . (5.40) i=1 En el caso de un cuerpo rígido, esta inercia vendría dada por: J= Z V ρ(r)r2 dV (r), (5.41) donde r representa la posición de cada partícula en el cuerpo, r es la distancia de cada partícula al eje de rotación, V es el volumen y ρ(r) es la densidad volumétrica de cada partícula. Existen tablas que especifican la inercia rotacional de varios objetos alrededor de distintos ejes. Por ejemplo en Ogata (1987), se presenta un cuadro con varias figuras geométricas generales. Estos resultados se reproducen en el Cuadro 5.5. Así por ejemplo, la inercia rotacional de un disco circular rígido con densidad constante que gira alrededor de su eje geométrico viene dada por: 1 J = M r2 . 2 (5.42) La relación entre la inercia rotacional y las variables físicas es una analogía a la relación que existe para la masa en movimiento traslacional: τ (t) = Jα(t), dω(t) =J , dt d2 θ(t) . =J dt2 (5.43) A partir de (5.43), es posible deducir que la inercia rotacional corresponde a un caso particular de un capacitor generalizado con una capacitancia generalizada de C = J. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 169 Figura Nombre Inercia Disco completo t << R 2 Jx = Jy = M R4 2 Jz = M R2 Anillo t << R 2 2 Jx = Jy = M R 4+r 2 2 Jz = M R 2+r Cilindro Jx = Jy = M 3R 12+L 2 Jz = M R2 2 Cilindro hueco 2 R2 +r2 + 13 L2 Jx = Jy = M 4 2 2 Jz = M R 2+r Esfera En todas las direcciones J = 25 M R2 Barra Jx = M L12 2 Js = M (L sen(θ)) 12 2 Cuadro 5.5: Diferentes inercias rotacionales para formas generales. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 170 El siguiente elemento es el resorte de torsión . Este elemento ofrece resistencia al par aplicado. Se puede considerar igual a un resorte, con la diferencia de que la fuerza que produce no se aplica de manera longitudinal sino que se aplica en un arco circular. Se supone que la masa del resorte de torsión es despreciable, por lo que la magnitud del par aplicado en un extremo es igual al del otro extremo. La ecuación de este resorte viene dada por: τ (t) = K∆θ(t), = K (θ2 − θ1 ) , = Kθ21 . (5.44) con K igual al coeficiente del resorte torsional con unidades N m/rad. Al derivar esta ecuación, se obtiene: 1 dτ (t) , (5.45) ω12 = K dt lo que implica que el resorte de torsión es un caso particular de un inductor generalizado con inductancia L = K1 . El elemento disipador de energía es el amortiguador torsional. Este elemento opone resistencia al movimiento rotacional de los elementos con masa. Al igual que con el resorte torsional, se supone que su masa es despreciable y por lo tanto el par en ambos extremos del elemento tiene la misma magnitud. La relación entre el par y la velocidad angular viene dada por: τ (t) = Bω21 (t), (5.46) donde B es el coeficiente de amortiguamiento con unidades N m s /rad. Es claro que este es un caso particular de una resistor generalizado con resistencia R = B1 . El elemento que funciona como transformador generalizado en el caso rotacional son los engranes. Se supone que la masa y la fricción de los engranes son despreciables. Los dientes sobre la superficie de los engranes (N1 y N2 ) son proporcionales a los radios de los mismos (Kuo, 1996), es decir o lo que es lo mismo r1 N1 = , r2 N2 (5.47) r1 N2 = r2 N1 . (5.48) Puesto que los engranes están acoplados, la distancia lineal que se recorre es la misma en ambos engranes (cubren el mismo arco s), por lo tanto s1 = s2 , r1 θ1 = r2 θ2 , Escuela de Ingeniería Eléctrica (5.49) Universidad de Costa Rica 171 y como se supone que no hay fricción ni otras irreversibilidades, el trabajo y la potencia que se aplican en un engrane es igual al trabajo y la potencia que se aplica en el otro extremo: τ1 θ1 = τ2 θ2 , τ1 ω1 = τ2 ω2 . (5.50) Las leyes que rigen la relación entre los distintos elementos también son análogas a las de los sistemas traslacionales: La aceleración angular de un cuerpo es proporcional a la suma algebraica de los pares que actúan sobre él: N X i=1 τi = J dω(t) , dt (5.51) donde J es la inercia rotacional del cuerpo. Si dos cuerpos rotan sobre un mismo eje, para cualquier par que ejerza el cuerpo 1 sobre el cuerpo 2 existirá un par de igual magnitud, pero de sentido contrario ejercido por el cuerpo 2 sobre el cuerpo 1. En caso de que dos cuerpos se estén tocando, pero no tengan un mismo eje de rotación, la fuerza de contacto entre ellos seguirá la tercer ley de Newton, pero el par no necesariamente será igual. 5.4.1. Conversión entre traslación y rotación Existen dispositivos capaces de transformar un movimiento rotacional en uno traslacional. Estos son especialmente útiles cuando se quiere utilizar el par de un motor eléctrico para trasladar masas. En la Figura 5.7 se muestran algunos ejemplos de este tipo de sistemas (Ogata, 2003). Uno de los sistemas más simples es el de banda y polea de la Figura 5.7a. Si se desprecia la inercia de la polea, la inercia rotacional equivalente que “siente” el motor es igual a la masa del bloque (M ) a una distancia r del eje de giro, es decir J = M r2 . La relación que existe entre el desplazamiento x(t) y el desplazamiento angular θ(t) vendría dada por: x(t) = rθ(t). (5.52) Estas mismas relaciones son equivalentes para el caso de la cremallera y el piñón de la Figura 5.7b, cuando se desprecia la fricción entre los dientes. En la Figura 5.7c se presenta un tornillo sin fin. Este sistema es capaz de mover una masa M mediante el giro de un tornillo. En este caso, el sistema también se Escuela de Ingeniería Eléctrica Universidad de Costa Rica 172 (a) Banda y polea (b) Cremallera y piñón (c) Tornillo sin fin Figura 5.7: Sistemas para convertir un movimiento rotacional en uno traslacional. puede ver como una inercia rotacional equivalente, desde el punto de vista del motor. Si se define L como la distancia que avanza el tornillo en una revolución, la inercia equivalente del sistema sería: L 2 . (5.53) J =M 2π Puesto que en cada revolución, el sistema avanza una distancia L, la relación entre el giro del motor conectado y el desplazamiento vendría dada por: x(t) = L 5.5. θ(t) . 2π (5.54) Modelado de Sistemas electromecánicos Los sistemas electromecánicos corresponden a aquellos en los que existe una interacción entre un campo electromagnético y un objeto en movimiento con respecto a este campo y que se ve afectado por él. Los micrófonos, relays, galvanómetros, motores y generadores son ejemplos de este tipo de sistemas. De acuerdo con Close et al. (2002), hay dos leyes fundamentales que rigen el comportamiento de los sistemas electromecánicos: Escuela de Ingeniería Eléctrica Universidad de Costa Rica 173 Un cable conductor de corriente que se encuentra en un campo electromagnético se va a ver afectado por una fuerza. Se va a inducir una tensión en un cable que se mueva con respecto a un campo magnético. En este tipo de sistemas, siempre se van a tener un conjunto de variables electromagnéticas que se van a ver afectadas por variables mecánicas y viceversa. Las variables principales con las que se trata son: fe el vector de fuerza sobre el conductor en newtons (N) v el vector de velocidad del conductor con respecto al campo magnético en metros por segundo (m/s) l, el vector de desplazamiento que representa la longitud del conductor en metros (m) φ, el flujo magnético en webers (Wb) B, la densidad de flujo de campo magnético en weber (Wb/m2 ) o tesla (T) i, corriente del conductor en amperes (A) em la tensión inducida en el conductor en volts (V) Para el caso de un conductor de corriente en un campo magnético, la fuerza que se produce sobre un conductor de longitud infinitesimal vendría dada por: dfe = i(dl × B), (5.55) que es una versión de la ecuación de la fuerza de Lorentz. Si se supone que B es perpendicular a la longitud diferencial dl e integrando, entonces (5.55) se convierte en: fe = Bli. (5.56) Es interesante notar que la fuerza (mecánica) depende de la corriente eléctrica y del campo magnético. La dirección de esta fuerza seguiría la regla de la mano derecha, de manera que sea perpendicular tanto a la dirección de la corriente como a la dirección del campo magnético, tal y como se muestra en la Figura 5.8. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 174 fe B il Figura 5.8: Dirección de la fuerza ejercida sobre un conductor con corriente i en un campo magnético B. Con respecto a la segunda ley, el modelo que representa este comportamiento se puede derivar de la ley de Faraday para obtener la tensión que se induce en un conductor que se mueve en un campo magnético: dem = (v × B) · dl. (5.57) Si (5.57) se integra a lo largo de l y se cumple que v, B y l son perpendiculares entre ellos, entonces la expresión se reduce a: em = Blv, (5.58) con las direcciones que se muestran en la Figura 5.9. Si se analiza la expresión para la potencia, empezando del lado eléctrico y tomando en cuenta (5.56) y (5.58): P = tensión · corriente, = em · i, fe = Blv , Bl = vfe , que es precisamente, la potencia mecánica. Es decir, que en condiciones ideales, toda la energía de la parte eléctrica se puede convertir en energía mecánica y viceversa. Esta es la misma relación que existe en un transformador generalizado, con la diferencia que ahora la energía entre el primario y el secundario no son de la misma naturaleza Escuela de Ingeniería Eléctrica Universidad de Costa Rica 175 v − B em + Figura 5.9: Fuerza contraelectromotriz inducida em , por el movimiento de un conductor en un campo magnético. i em v + − M i fe em Bl : 1 fe v Elemento generalizado Relación de variables Figura 5.10: Relación de variables electromecánicas y su forma generalizada. (como es el caso del transformador eléctrico, la palanca y los engranes). El caso en que la energía pasa de ser eléctrica a mecánica, se presenta en la Figura 5.10. Debe notarse que en la parte eléctrica, ambas variables van en sentido contrario una de la otra, mientras que en la parte secundaria, ambas van en el mismo sentido. Si por el contrario, la parte mecánica fuera la fuente de energía primaria que se convierte en energía eléctrica, entonces la fuerza y la velocidad deberían ir en direcciones contrarias, mientras que la tensión inducida y la corriente deberían ir en la misma dirección. Ejemplo 5.3 Ejemplo adaptado de Close et al. (2002): Un galvanómetro es un dispositivo que se utiliza para medir tensión o corriente eléctrica. Una fotografía de un galvanómetro se muestra en la Figura 5.11. En su interior tiene una aguja conectada a un cilindro que puede rotar. Alrededor de este cilindro hay una serie de espiras por donde pasa la corriente que se quiere medir. Este cilindro además está dispuesto en el interior de un campo magnético y tiene conectado Escuela de Ingeniería Eléctrica Universidad de Costa Rica 176 Figura 5.11: Galvanómetro θ R + vin − resorte Figura 5.12: Esquema del galvanómetro un resorte que, en la ausencia de corriente, lleva la aguja a una posición determinada. Un diagrama de la disposición de sus componentes se presenta en la Figura 5.12. En este caso, R es la resistencia de los cables. El imán produce un campo magnético constante de magnitud B (dirección norte a sur) y θ es el ángulo con que gira la flecha conectada al cilindro, y que marca la corriente por los cables. Las espiras, por el hecho de estar enrolladas, tienen asociada una inductancia L. El cilindro tiene una inercia rotacional J, la constante del resorte está dada por K y el cilindro está afectado por un amortiguamiento viscoso con constante B. Alrededor del cilindro hay N espiras. La interacción entre la corriente en los conductores y el campo magnético produce una fuerza sobre las espiras que hace girar el cilindro. Este movimiento, produce una fuerza contralectromotriz em que se opone al flujo de corriente. Cada espira se supone rectangular, con un ancho de 2a y un largo l (que está paralelo al Escuela de Ingeniería Eléctrica Universidad de Costa Rica 177 R vin L + − + − τB τe em θ τK J Parte mecánica Parte eléctrica Figura 5.13: Diagrama del cuerpo libre para el ejemplo 5.3. eje de rotación). Un diagrama de cuerpo libre del sistema es como el que se presenta en la Figura 5.13. Las espiras tienen dos lados por los que se ejerce una fuerza. Del lado derecho, la fuerza va hacia abajo, mientras que del lado izquierdo, la fuerza va hacia arriba. Puesto que la distancia desde el conductor hasta el centro de rotación es a y que se tienen N espiras, tomando en cuenta (5.56), el par producido por la interacción entre la corriente y el campo magnético sería: τe = (2N Bla)i. (5.59) Sumando los pares se obtiene que: X τi = Jα, τe − τB − τK = J θ̈, J θ̈ + B θ̇ + Kθ = (2N Bla)i. (5.60) En la parte eléctrica, a partir de (5.58) se debe obtener em . Cada uno de los lados de la espira, se puede ver como un conductor que, en su totalidad, contabilizan 2N conductores en serie. La velocidad lineal de cada uno de los conductores es igual v = aθ̇. Por lo tanto, la fuerza contraelectromotriz total vendría dada por: em = (2N Bla)θ̇. (5.61) Analizando el circuito equivalente de la Figura 5.13, se obtiene que: Li̇ + Ri + (2N Bla)θ̇ = vin , (5.62) a partir de (5.60) y (5.62) es posible encontrar una RES o un MVE para hacer el análisis del sistema. Si se hace la simplificación de suponer que la inductancia del devanado es muy pequeña (L ≈ 0), y definiendo γ = 2N Bla, el modelo se volvería de segundo orden: B γ2 K γ θ̈ + + θ̇ + θ = vin J JR J JR ! Escuela de Ingeniería Eléctrica (5.63) Universidad de Costa Rica 178 De acá se puede obtener que la frecuencia natural del sistema vendría dada por: s ωn = K , J y que el coeficiente de amortiguamiento sería: 1 ξ= √ 2 KJ γ2 B+ . R ! Es interesante notar que el sistema puede ser subamortiguado o sobreamortiguado, dependiendo de las características del sistema, pero que su frecuencia natural solamente depende de parámetros mecánicos. En estado estacionario, haciendo las derivadas iguales a cero en (5.63), se obtiene la relación de qué tanto gira la aguja en función de una tensión de entrada constante V : γ θss = V, KR y con esa información se puede entonces dibujar la escala para poder medir la tensión en la fuente, utilizando un sistema electromecánico. 5.5.1. Modelado de motores DC Un motor DC es un elemento electromecánico que convierte la potencia eléctrica en potencia mecánica rotacional. Estos motores “son usados en una variedad de aplicaciones industriales, como robots, máquinas herramienta, industrias petroquímicas, de pulpa y de papel, plataformas de perforación petrolera y minería. Además se utilizan extensivamente en sistemas automotores y ferroviarios” (Hubert, 2002). Estos motores son alimentados con corriente continua. A diferencia de los motores de inducción, dentro del motor no existe un campo magnético giratorio que “arrastre” al rotor, sino que el campo magnético es constante. Lo que se hace es devanar el rotor para que al fluir la corriente, se produzca una fuerza debido al campo magnético circundante y así se haga girar al rotor. Debido a que en este caso, el rotor es el componente que utiliza la energía eléctrica para producir el par, al rotor de los motores DC se le llama armadura. El estator es el encargado de producir el campo magnético dentro del motor, por lo que se le llama campo. Este campo magnético puede producirse mediante una corriente eléctrica que fluye en los devanados del estator, o mediante imanes permanentes. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 179 A N A S B B N S Conmutador Escobillas + ◦ (b) θ = 90◦ (a) θ = 0 B N B S A + - + - N A + ◦ S - (d) θ = 270◦ (c) θ = 180 Figura 5.14: Conmutación en un motor DC durante un giro completo (adaptado de (Hubert, 2002)). Un sistema especial (normalmente unas escobillas de grafito y un conmutador) permite que la corriente en los devanados cambie de dirección para que el par que se ejerce sobre el rotor siempre vaya en la misma dirección, mientras se mantiene la polaridad de la tensión sin cambios. En la Figura 5.14, se muestra el proceso de conmutación en un giro completo del motor DC simplificado para un solo devanado de armadura y con un campo producido con imanes permanentes. Cuando la armadura está en la posición de 0◦ (Figura 5.14a), el devanado es cortocircuitado momentáneamente por el conmutador y las escobillas, produciendo que no fluya corriente por la armadura. En la posición de 90◦ y 270◦ , fluye corriente por los devanados, produciendo una fuerza que hace girar la armadura. Hay que notar que la corriente cambia de dirección entre la Figura 5.14b y la Figura 5.14d, sin necesidad de cambiar la polaridad de la fuente. Puesto que la densidad de flujo campo magnético varía conforme la armadura gira, se produce en los devanados una tensión contraelectromotriz (vcem ) que sigue la ley de Faraday. Esta tensión vendría dada por: vcem (t) = −NA dφ(t) , dt (5.64) donde φ(t) es la densidad de flujo y NA es el número de vueltas del devanado. La velocidad angular de la armadura vendría dada por ω(t) = dθ . Despejando dt e dt Escuela de Ingeniería Eléctrica Universidad de Costa Rica 180 introduciéndolo en (5.64), se obtiene: vcem (t) = −NA ω(t) dφ(t) . dθ(t) (5.65) Conforme el rotor gira, la densidad de flujo efectiva a través del devanado varía casi como una señal triangular en función del ángulo del rotor. La pendiente de esta señal es aproximadamente: 2ΦP dφ(t) =− , (5.66) dθ π ΦP es el valor máximo que toma la densidad de flujo de campo magnético Φ(t). Al sustituir (5.66) en (5.65) se obtiene: 2ω(t)NA ΦP . (5.67) π El valor de NA depende de factores constructivos del motor, por lo que, para una máquina dada, (5.67) se puede escribir como: vcem (t) = vcem (t) = KA ω(t)ΦP , (5.68) Φ(t) depende de la construcción del campo. Si se utilizan imanes permanentes, ΦP es constante. Si por el contrario, el campo está construido con electroimanes, el campo magnético que se produce es proporcional a la corriente de campo iF (t): ΦP = KF iF (t), (5.69) por supuesto, si iF (t) es constante Φ(t) también lo será y por lo tanto también ΦP . En el caso del par, este es proporcional al campo generado y a la corriente de armadura τ (t) = KA iA (t)ΦP . (5.70) Los devanados tanto de la armadura como del campo presentan cierta resistencia e inductancia. Esta característica se puede modelar como un resistor y un inductor en serie. La resistencia e inductancia del campo se representan como RF y LF respectivamente, mientras que en el caso de la armadura, estos corresponden a RA y LA . Tomando en cuenta estos parámetros y las ecuaciones para vcem , τ y ω, el modelo del motor DC se puede presentar como en la Figura 5.15. Si vinA es la tensión de entrada de la armadura y vinF es la tensión de entrada del campo, las ecuaciones eléctricas correspondiente serían entonces: diA (t) − RA iA (t) = vcem (t), dt diF (t) vinF (t) = LF + RF iF (t). dt vinA (t) − LA Escuela de Ingeniería Eléctrica (5.71) (5.72) Universidad de Costa Rica 181 Figura 5.15: Diagrama del modelo de un motor DC. Figura 5.16: Diagrama del cuerpo libre para el ejemplo 5.4. Por lo tanto el modelo completo vendría dado por: vinA (t) − LA diAdt(t) − RA iA (t) = vcem (t) vinF (t) = LF diFdt(t) + RF iF (t) ΦP (t) = KF iF (t) vcem (t) = KA ω(t)ΦP (t) τ (t) = KA iA (t)ΦP (t) Para poder encontrar tanto el par como la velocidad angular del motor, todavía es necesaria una ecuación que los relacione. Esta ecuación es la que surge de tomar en cuenta la carga conectada al motor. Esta situación se muestra en el ejemplo 5.4. Ejemplo 5.4 Encuentre el modelo del sistema formado por un motor DC de imán permanente conectado a una carga con inercia rotacional igual a J y que además se encuentra sometido a una amortiguación viscosa con coeficiente B. Solución: El diagrama del cuerpo libre para la carga se presenta en la Figura 5.16. τM representa el par aplicado por el motor sobre la carga. Puesto que el motor es de imán permanente, el flujo de campo magnético tiene magnitud constante, por lo que las ecuaciones del Escuela de Ingeniería Eléctrica Universidad de Costa Rica 182 par y la velocidad angular se reducen a: vcem (t) = Kω(t), τM (t) = KiA (t). La ecuación de la armadura del motor vendría dada por: vinA (t) − LA diA (t) − RA iA (t) = Kω(t). dt (5.73) A partir del diagrama del cuerpo libre de la carga se obtiene: J dω(t) + Bω(t) = τM , dt e introduciendo la ecuación del par del motor: J dω(t) + Bω(t) = KiA (t). dt (5.74) Si las salidas que se quieren para el modelo son la velocidad y el par generado por el motor, a partir de (5.73) y (5.74), se puede escribir un MVE tomando la corriente de armadura y la velocidad como estados. Definiendo x(t) = [iA (t), ω(t)]T , u = vinA (t) y y(t) = [ω, τm ]T , el MVE correspondiente es: ẋ = " −R A " y= −K LA −B J LA K J 0 K 1 0 # " x+ 1 LA 0 # u, # (5.75) x. En el caso de que el campo magnético estuviera en función de la corriente de campo, también se podría escribir un MVE del sistema, pero habría que agregar un estado más (la corriente de campo) y una entrada extra (la tensión de campo). Esto además provocaría que el modelo del sistema se vuelva no lineal, puesto que tanto el par como la tensión contraelectromotriz dependerían del producto de dos estados. 5.6. Modelado de sistemas térmicos El modelado de la conducción de calor es un tema complicado, principalmente por el hecho de que, en general, las ecuaciones que gobiernan estas dinámicas no solo Escuela de Ingeniería Eléctrica Universidad de Costa Rica 183 Figura 5.17: Un cuerpo sometido a un gradiente de temperatura. dependen del tiempo, sino que tienen una componente espacial. La ley de conducción del calor de Fourier, indica que el flujo de calor es directamente proporcional al gradiente de temperatura, esto es (Baehr y Stephan, 2011): qA (x, t) = −λ∇T (x, t), (5.76) donde qA (x, t) es la densidad de flujo de calor, T (x, t) es el campo escalar de temperaturas y λ es la conductividad térmica del material. El signo menos indica que el calor siempre fluye desde la región de mayor temperatura hasta la región de temperatura menor. Cuando se analiza la variación del campo de temperaturas utilizando la ley de conservación de energía y la ley de Fourier, se llega a una ecuación en derivadas parciales, esto es, una ecuación diferencial que no solo depende del tiempo, sino que también implica derivadas parciales de las componentes espaciales. Para el caso en que las propiedades del cuerpo se suponen constantes, esta ecuación diferencial toma la forma (Baehr y Stephan, 2011): Ẇ ∂T = a∇2 T + , ∂t cρ (5.77) donde a es la difusividad térmica (m2 /s), c es el calor específico y ρ es la densidad volumétrica. ∇2 es conocido como Laplaciano y se define en coordenadas cartesianas 2 2 2 como ∇2 Φ = ∂∂xΦ2 + ∂∂yΦ2 + ∂∂zΦ2 . En este curso, no se contemplará los casos en que la variación espacial de la temperatura sea necesaria, es decir se considerarán los parámetros de los cuerpos como concentrados. Considérese primero el caso de un cuerpo que se encuentra entre dos temperaturas distinta T1 y T2 (◦ C) tal y como se muestra en la Figura 5.17. Si se supone que las propiedades del cuerpo son constantes y no varían con la posición, se encuentra que, a partir de la ley de Fourier, el flujo de calor q (W) viene dado por: q(t) = Escuela de Ingeniería Eléctrica σc A (T2 − T1 ) , l (5.78) Universidad de Costa Rica 184 donde σc es la conductividad térmica (J/(s m ◦ C)), A es el área normal a la dirección del flujo de calor (m2 ) y l es el largo en la dirección del flujo (m). Al comparar esta ecuación con la de un resistor, se llega a la conclusión que si la temperatura es tomada como la tensión y el flujo de calor como la corriente, la resistencia térmica vendría dada por Rt = σclA (◦ C s/J). Los cuerpos almacenan energía en función de su temperatura y su masa. Para poder aumentar la temperatura de cierta masa, es necesario aplicar cierta cantidad de calor. Esta cantidad de calor es proporcional a la variación de la temperatura y esta constante de proporcionalidad es conocida como calor específico Cp (J/(kg◦ C)), de manera que: ∆Q = Cp M ∆T, (5.79) con ∆Q la cantidad de energía entregada al sistema, ∆T es el cambio en la temperatura y M es la masa. Si se considera solo incrementos diferenciales y se divide por dt, se obtiene: dQ dT = Cp M , dt dt y la parte izquierda de esta ecuación es igual al flujo de calor q: q = Cp M dT . dt (5.80) Se puede observar que (5.80), tiene la misma forma que la de un capacitor generalizado con una capacitancia térmica dada por Ct = Cp M . De esta manera, es posible escribir una ecuación que representa la evolución temporal de la temperatura de un cuerpo. Entre dos cuerpos, o un cuerpo y fluido, siempre existirá una resistencia térmica que creará el camino para el flujo de calor. Al contrario que en los demás sistemas vistos hasta ahora, no se ha encontrado ningún fenómeno físico que cumpla el papel de “inductancia térmica”. Esto se debe principalmente a que en los sistemas térmicos solo existe un tipo de energía (térmica), mientras que en los demás sistemas se podía determinar siempre dos tipos de energías: una del tipo cinética y otra del tipo potencial. Hasta ahora se ha mostrado el caso en que el calor fluye por conducción. No obstante, el calor puede propagarse también por convección (en fluidos) o por radiación (que no necesita un medio para propagarse). En el caso del flujo de calor entre un sólido y un fluido por convección se suele hacer una aproximación utilizando la ley de enfriamiento de Newton: q = h (Ts − Tf ) , (5.81) donde Ts es la temperatura del sólido, Tf es la temperatura del fluido y h es el coeficiente de transferencia de calor (W/(m2◦ C)). h es un parámetro difícil de obtener Escuela de Ingeniería Eléctrica Universidad de Costa Rica 185 Figura 5.18: Intercambiador de calor para el Ejemplo 5.5. puesto que depende de la velocidad del fluido, la estructura del sólido, la presión, entre otros. Por ello, es un valor que se suele determinar de manera empírica. La ecuación 5.81 tiene la misma forma que la de la resistencia térmica en el caso de la conducción, por lo que, para el caso de este curso, cuando el calor fluya de un sólido a un líquido, se considerará que existe una resistencia térmica en la interfaz entre ellos. Ejemplo 5.5 Obtener un modelo para el sistema de la Figura 5.18, con TH y TC como entradas y T1 y T2 como salidas. V1 y V2 son los volúmenes dentro del intercambiador de calor, qV 1 y qV 2 son los caudales (m3 /s) y ρ1 y ρ2 son las densidades de los fluidos (kg/m3 ). Solución: Un intercambiador de calor transfiere energía desde un fluido caliente a otro frío a través de una pared metálica debido a su diferencia de temperatura. Utilizando las ecuaciones presentadas en esta sección, es posible construir un modelo muy simple y aproximado del comportamiento dinámico del sistema. En primer lugar, se deben hacer algunas suposiciones importantes para simplificar el problema: se supondrá que los parámetros del sistema no varían con la posición ni con el tiempo, que los fluidos dentro de los volúmenes están perfectamente mezclados, que podemos despreciar la variación de temperatura a través del intercambiador de calor y que el intercambiador está perfectamente aislado, de manera que no se intercambia calor con el ambiente2 . Si la masa dentro de las cámaras del intercambiador de calor se supone como una 2 Como se puede apreciar, el modelo es muy simple y dependiendo de las necesidades, podría ser un modelo poco apropiado. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 186 masa concentrada, se le puede asociar una capacitancia térmica. Así, para el caso del fluido 1, esta capacitancia térmica sería Ct1 = M cp1 = V1 ρ1 cp1 con cp1 su calor específico. Para el fluido 2, aplica una ecuación similar. Para la primera masa de fluido se puede escribir la siguiente ecuación: Ct1 dT1 X = qi , dt donde los qi son los flujos de calor que afectan a la primera masa de fluido. Uno de los flujos es el intercambio de calor a través de las paredes internas. Este flujo de calor se puede representar como una resistencia térmica de manera que: q1 = Aσc 1 (T1 − T2 ) = (T1 − T2 ) . l RT Intuitivamente, se sabe que la temperatura de salida del intercambiador de calor variará con la temperatura de entrada de los fluidos. Como se supone que los fluidos en el interior están bien mezclados, debería existir una transferencia de calor para aumentar la temperatura desde la entrada hasta la salida del tanque. Como no se conoce exactamente la relación que existe, pero se sabe que cuanto mayor sea la diferencia de temperatura entre la salida y la entrada, mayor flujo de calor habrá, se puede suponer una constante de proporcionalidad k1 que debería encontrarse empíricamente, de manera que: q2 = k1 (TH − T1 ) . Lo más probable es que esta constante dependa del calor específico y del flujo 0 másico, de manera que k1 = k1 ρ1 qV 1 cp1 . Como se desprecia el flujo de calor entre el intercambiador y el ambiente, solo estos flujos se considerarían. La ecuación queda entonces de la siguiente manera: Ct1 dT1 1 = k1 (TH − T1 ) − (T1 − T2 ) . dt RT (5.82) Lo que dice esta ecuación es que, la temperatura T1 aumenta si la temperatura de entrada aumenta, y disminuye si la temperatura T2 disminuye. Esto último tiene sentido puesto que el flujo entre la masa 1 y la masa 2 sería mayor, provocando que la masa 1 se enfríe. Para el caso de la masa 2 se puede escribir la siguiente ecuación: Ct2 Escuela de Ingeniería Eléctrica dT2 1 = k2 (TC − T2 ) + (T1 − T2 ) , dt RT (5.83) Universidad de Costa Rica 187 + - + - Figura 5.19: Circuito equivalente del intercambiador de calor del Ejemplo 5.5. con Ct2 la capacitancia térmica de la masa 2, k2 su constante de proporcionalidad con respecto a la entrada. Nótese que la misma cantidad de calor que sale (enfría) de la masa 1 es la que tiene que ingresar (calentar) a la masa 2, por eso, el término 1 (T1 − T2 ) está restando en (5.82) mientras que en (5.83) está sumando. (5.82) y Rt (5.83) son el modelo que se estaba buscando. Se puede escribir una analogía eléctrica de estas ecuaciones de una manera muy sencilla. Si las temperaturas de entrada se representan como fuentes de tensión, el circuito equivalente sería como el que se presenta en la Figura 5.19. 5.7. Modelado de sistemas hidráulicos Los sistemas hidráulicos son aquellos en los que fluye un líquido (normalmente aceite o agua). Al igual que en el caso de los sistemas térmicos, la distribución espacial también juega un papel importante en el modelado. Sin embargo, también es posible encontrar modelos relativamente sencillos utilizando elementos concentrados. El líquido se considera incompresible, lo que quiere decir que su densidad no varía con la temperatura ni la presión. En un sistema hidráulico, se define caudal q como el producto: q = Av, (5.84) donde A es el área de la tubería por donde fluye el líquido y v es su velocidad. Puesto que se supone que la densidad es constante, en una tubería se debe cumplir que, en dos posiciones generales cualesquiera: A1 v1 = A2 v2 , Escuela de Ingeniería Eléctrica (5.85) Universidad de Costa Rica 188 Elemento Tanque Parámetro Símbolo Ecuación Capacitancia hidráulica (m3 /Pa) dV (t) dt = qe (t) − qs (t) dh(t) dt = CH dPdt(t) Tubería larga Inductancia hidráulica LH (kg/m4 ) Resistencia hidráulica Resistencia hidráulica RH 1 A (qe (t) − qs (t)) = qe (t) − qs (t) P21 (t) = ρl dq(t) A dt = LH dq(t) dt q(t) casoqsimple = R1H P2 (t) − P1 (t) Cuadro 5.6: Modelos de los elementos de los sistemas hidráulicos. que es una forma de expresar la ley de conservación de masa y que toma el nombre de ecuación de continuidad. En el Cuadro 5.6, se muestran algunos de los elementos más importantes de los sistemas hidráulicos. En este curso se considerarán el tanque abierto de área constante, la tubería larga y la resistencia hidráulica. Para modelar un tanque abierto se debe primero utilizar la ley de conservación de la masa. Pero puesto que se supone que la densidad se mantiene constante, esta ecuación se puede escribir en función de los caudales y el volumen del tanque: dV (t) = qe (t) − qs (t). dt (5.86) Es más, si se supone que el área del tanque es constante, su volumen se puede escribir como V (t) = Ah(t) donde h(t) es la altura con respecto a la base del mismo, Escuela de Ingeniería Eléctrica Universidad de Costa Rica 189 entonces la ecuación se puede escribir como: dh(t) 1 = (qe (t) − qs (t)) . dt A (5.87) La presión en el tanque suele ser determinante en el caudal de salida. La presión de salida del tanque está determinada por: P (t) = PA + ρgh(t), (5.88) donde PA es la presión atmosférica (Pa), ρ es la densidad (kg/m3 ). Derivando esta ecuación: dP (t) dh(t) = ρg . (5.89) dt dt Introduciendo (5.89) en (5.87), se obtiene: dP (t) ρg = (qe (t) − qs (t)) , dt A (5.90) esta ecuación es similar a la de una capacitor si se considera P (t) como la transvariable y el caudal resultante qe (t) − qs (t) como la pervariable. La capacitancia hidráulica A (m4 s2 /kg). entonces vendría dada por CH = ρg Otro elemento importante es una tubería larga. En este caso, si se desea acelerar el flujo de líquido a través de él, es necesario aplicar una fuerza que logre aumentar la velocidad del líquido. A partir de la segunda ley de Newton se tiene que: dv , dt dv(t) , A (P2 − P1 ) = ρAl dt F =M (5.91) pero la velocidad está relacionada con el caudal v(t) = q(t)/A. Al introducir esta relación en (5.91) se obtiene: P21 (t) = ρl dq(t) , A dt (5.92) esta ecuación es análoga a la de los inductores eléctricos, con una inductancia hidráulica igual a LH = ρl (kg/m4 ). A Algunos elementos presentan cierta resistencia al flujo de líquido debido a la fricción y a las variaciones en el área de las tuberías. Algunos elementos que presentan este tipo de resistencia son (Alfaro, 2005): Escuela de Ingeniería Eléctrica Universidad de Costa Rica 190 Sección 2 Sección 1 Figura 5.20: Tubo de corriente de flujo. Adaptado de Ogata (1987). medio o tapón poroso tubo capilar largo flujo turbulento en una tubería flujo a través de una restricción (orificio o válvula) Para modelar este tipo de elementos, se procede a utilizar la ecuación de Bernoulli. Considérese el volumen de control que se muestra en la Figura 5.20. En este caso, se tiene un volumen de control infinitesimal con una longitud ds y un área transversal dA. La presión en la sección 1 del tubo es p. En el lado de la sección 2, la presión varía una cantidad infinitesimal que se puede considerar como p + (∂p/∂s)ds. La velocidad en la sección se considera v y la masa dentro del volumen de control acelera a una tasa de dv/dt. Supóngase que el flujo de agua va hacia arriba (en contra de la fuerza de gravedad) y que el peso del volumen de control viene dado por ρgdA ds, donde ρ es la densidad y g es la aceleración de la gravedad. Al aplicar la segunda ley de Newton, se obtiene que: ! dv ∂p m = pdA − p + ds dA − ρgdAds cos(θ). dt ∂s (5.93) La masa, si se supone que la densidad es constante, se puede escribir como m = ρdAds. La velocidad se puede suponer que depende no sólo del tiempo si no de la posición, por lo que: dv ∂v ds ∂v ∂v ∂v = + =v + , dt ∂s dt ∂t ∂s ∂t Escuela de Ingeniería Eléctrica Universidad de Costa Rica 191 Figura 5.21: Caso general de una tubería en la que varía la velocidad, la presión y la altura de las terminales. y además, cos(θ) = ∂z/∂s, donde z es el desplazamiento vertical de la masa dentro del volumen de control. Introduciendo todas estas transformaciones en (5.93), se obtiene: v ∂v ∂v 1 ∂p ∂z + + +g = 0. ∂s ∂t ρ ∂s ∂s (5.94) Esta ecuación se le conoce como ecuación de movimiento de Euler (Ogata, 1987). Si se supone que el flujo es estacionario (∂v/∂t = 0), (5.94) se puede escribir como: v dz dv 1 dp + +g = 0, ds ρ ds ds o lo que es lo mismo: ρvdv + dp + ρgdz = 0. (5.95) Si ahora se aplica la integral a ambos lados de la igualdad se llega a que: ρ 2 v + p + ρgz = constante, 2 (5.96) que es justamente la ecuación de Bernoulli. Se debe notar que no se están tomando en cuenta otras fuerzas como la resistencia del líquido, su viscosidad y otros aspectos que son los que producen la resistencia hidráulica. En este caso, como la dependencia con respecto a la posición desaparece y sin importar el punto en el que se aplique 5.96, siempre se tendrá un valor constante, se puede utilizar la ecuación de Bernoulli para analizar flujos en posiciones arbitrarias dentro de una tubería. Tómese el caso general presentado en la Figura 5.21. Utilizando la ecuación de Bernoulli en los puntos 1 y 2 (los extremos del segmento del tubo considerado): ρv12 ρv 2 + ρgz1 + P1 = 2 + ρgz2 + P2 . (5.97) 2 2 Escuela de Ingeniería Eléctrica Universidad de Costa Rica 192 Como ya se dijo, esta ecuación es válida para el caso en que la fricción del líquido es igual a cero. En el caso general, se debe tomar en cuenta una pérdida de presión debido a estas fricciones. Esta pérdida de presión representa una resistencia al flujo de líquido. Cuando se incorpora la pérdida de presión Pp a (5.97), la ecuación queda como: ρv12 ρv 2 + ρgz1 + P1 + Pp = 2 + ρgz2 + P2 . (5.98) 2 2 El valor de Pp depende del régimen del flujo (si es turbulento o laminar). El número de Reynolds R es un valor adimensional que indica el régimen del líquido (Loría y Mazón, 1989): vd R= , (5.99) κ donde v es la velocidad promedio del fluido, d es el diámetro de la tubería y κ es el coeficiente de viscosidad cinemática (m2 /s) del fluido. Una vez que se calcula el número de Reynolds, se pueden encontrar tres casos: Si R < 2000 entonces el flujo es laminar. Si R > 3000 entonces el flujo es turbulento. Si 2000 < R < 3000, el flujo podría ser laminar o turbulento. Esto dependerá de las condiciones del sistema. Entonces, las pérdidas de presión se pueden aproximar mediante: Pp = λ v 2 lρ , 2d (5.100) con l la longitud del tubo en metros. λ se calcula como ( λ= 64 R 0,025 si es un régimen laminar si es un régimen turbulento (5.101) Introduciendo (5.100) en (5.98), despejando v y si se considera que el caudal a través del tubo se puede aproximar mediante q = Av con A la sección transversal promedio, entonces: s r 2d ρ 2 q=A (v − v12 ) + ρg (z2 − z1 ) + (P2 − P1 ). (5.102) λlρ 2 2 A partir de esta ecuación se puede definir la resistencia hidráulica RH como: 1 RH = A Escuela de Ingeniería Eléctrica s λlρ . 2d (5.103) Universidad de Costa Rica 193 Aún así, esta ecuación es complicada de utilizar, puesto que v2 y v1 dependen del q q caudal (v2 = A2 y v1 = A1 ). Sin embargo, se puede simplificar el análisis si solo se consideran tubos con área transversal constante A1 = A2 , de esta manera: q= 1 q ρg (z2 − z1 ) + (P2 − P1 ), RH (5.104) y si la diferencia de altura entre los extremos del tubo es igual a cero la ecuación se simplifica todavía más: 1 q q= P2 − P1 . (5.105) RH Como se puede observar, esta es una relación no lineal entre el caudal y la presión. Sin embargo, si la variación de la diferencia de presión es pequeña, esta relación se puede aproximar a una relación lineal3 : q= 1 (P2 − P1 ) . RHf (5.106) Debe hacerse una aclaración en este punto. La ecuación de Bernoulli que se utilizó para encontrar la ecuación de la resistencia hidráulica es válida para flujos estacionarios, es decir aquellos cuya velocidad en cada punto del tubo no varía con el tiempo. Sin embargo, en este curso los modelos que interesan más son los dinámicos, que justamente son aquellos que varían con el tiempo. Por ello, cuando se utilicen estas ecuaciones, se deberá tener siempre en cuenta que, si se utilizan para modelar un sistema dinámico, el modelo resultante será válido sólo para cambios pequeños alrededor de un punto de operación. En los ejemplos siguientes muchas veces no se tomará en cuenta esta restricción, pero siempre deberá recordarse en caso de que, en la práctica, los resultados de las simulaciones que se hagan, estén alejados de los resultados reales. Ejemplo 5.6 Encuentre un modelo que prediga la variación de las alturas (h1 y h2 ) de los tanques de la Figura 5.22. A1 y A2 son las áreas de los tanques, RH es la resistencia hidráulica a la salida del tanque uno, A3 es el área de la tubería de desagüe. Suponga que no existe resistencia a la salida del tanque dos. Solución: 3 Realizando una expansión de Taylor truncada hasta el elemento de primer orden. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 194 Figura 5.22: Sistema hidráulico del Ejemplo 5.6. La relación entre las alturas y los caudales se puede encontrar fácilmente a partir de las ecuaciones de conservación de masa: 1 dh1 (t) = (qe − q1 ) , dt A1 dh2 (t) 1 = (q1 − q2 ) , dt A2 (5.107) qe es la entrada del sistema, sin embargo es necesario encontrar una expresión para q1 y q2 en función de h1 y h2 . En el caso de q1 es sencillo obtener la expresión a partir de la resistencia hidráulica: 1 √ q1 = ∆P . (5.108) RH Puesto que la presión a la entrada del tanque y a la salida de la tubería es igual a la presión atmosférica, se tiene que ∆P = ρgh1 , por lo tanto q1 = 1 q ρgh1 . RH (5.109) Para el caso de q2 , se puede utilizar la ecuación de Bernoulli directamente para calcular el flujo de salida. Si se define como v2 a la velocidad del líquido en la parte superior del tanque dos y v3 a la velocidad de salida del tanque dos y tomando en cuenta que la presión, en ambos extremos del tanque es igual a la presión atmosférica, la ecuación de Bernoulli toma la forma: 1 2 1 v2 + gh2 = v32 . 2 2 Escuela de Ingeniería Eléctrica (5.110) Universidad de Costa Rica 195 A partir de la ecuación de continuidad, se tiene que: A3 v2 = v3 . A2 (5.111) Introduciendo (5.111) en (5.110) y despejando v3 se llega a: v3 = v u u u t 2g 1− A23 A22 (5.112) h2 . Y puesto que q2 = A3 v3 , se llega a: q2 = v u u A3 u t 2g 1− A23 A22 (5.113) h2 . Entonces introduciendo (5.109) y (5.113) en (5.107) se llega a: 1 1 q dh1 (t) = qe − ρgh1 , dt A1 RH 1 1 dh2 (t) = dt A2 RH v u u ρgh1 − A3 u t q 2g 1− (5.114) h , A2 2 3 A22 que representa la ecuación de estado de un modelo en variables de estado no lineal. 5.8. Modelos estáticos En las secciones anteriores se ha estudiado cómo modelar la dinámica de un sistema por medio de ecuaciones diferenciales. Sin embargo, también es útil saber los valores finales de las salidas cuando ha pasado suficiente tiempo después de una variación en la entrada, es decir, cuando los efectos transitorios del cambio ya han terminado y se ha llegado a un estado estacionario. A la relación entre la entradas y las salidas en estado estacionario se le conoce con el nombre de modelo estático o curva estática. Dos usos fundamentales de esta curva son el dimensionamiento de equipos y procesos y la determinación de puntos de operación4 (Loría y Mazón, 1989). 4 Se define punto de operación como el conjunto de valores de las variables de estado, entradas y salidas a partir de los cuales se desea operar la planta y que se toma como condición inicial para su estudio. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 196 5.8.1. A partir del modelo en variables de estado Obtener el modelo estático a partir del MVE es sencillo. Puesto que en cada punto de la curva estática, se ha llegado a un estado estacionario, esos puntos tienen la particularidad que las derivadas de las variables de estado con respecto al tiempo son iguales a cero. Luego, es posible encontrar una relación entre los estados y las entradas directamente del MVE. En el caso particular de un sistema lineal e invariante en el tiempo de la forma: ẋ = Ax + Bu y = Cx + Du, (5.115a) (5.115b) al hacer ẋ = 0, se obtiene una relación para los estados dado por: x = −A−1 Bu, (5.116) que al introducirlo en (5.115b) se obtiene: y = −CA−1 B + D u. (5.117) Como se puede observar, si el modelo es lineal, el modelo estático corresponde a una transformación lineal del espacio de entradas al espacio de salidas. Cuando el MVE es no lineal y corresponde a la forma: ẋi = fi (x, u) , yj = gj (x, u) , (5.118a) (5.118b) con i = 1, 2, . . . , n, j = 1, 2, . . . , q, el procedimiento que se debe realizar es similar al caso lineal. Lo que se debe hacer es resolver el sistema de ecuaciones: 0 = fi (x, u) , (5.119) despejando cada componente de x para luego introducir el resultado en (5.118b). Ejemplo 5.7 Se puede obtener el modelo estático del sistema de dos tanques del Ejemplo 5.6 a partir de (5.114). Haciendo las derivadas iguales a cero y despejando los niveles h1 y h2 se llega a las siguientes ecuaciones estáticas: 1 2 2 h1 = RH qe , (5.120) ρg 1 A22 − A23 2 h2 = q . (5.121) 2g A22 A23 e Escuela de Ingeniería Eléctrica Universidad de Costa Rica 197 10 Altura de los tanques (m) h1 h2 8 6 4 2 0 0 2 4 6 8 3 Caudal de entrada (m /s) 10 Figura 5.23: Curva estática correspondiente al sistema de dos tanques presentado en el Ejemplo 5.6. En la Figura 5.23 se puede observar la curva estática del sistema hidráulico presentado en el Ejemplo 5.6 obtenida con (5.120) y (5.121) para un cierto conjunto de valores de parámetros5 . Cada uno de los puntos de la curva representa el valor final de las alturas h1 y h2 en función del valor del caudal de entrada. Cuando la entrada varía, el sistema se desplazará de un punto a otro de la curva estática, de acuerdo con la dinámica que se representa con su modelo. 5.8.2. A partir de pruebas experimentales También es posible encontrar la curva estática a partir de pruebas experimentales. En este caso el procedimiento es como sigue: 1. Se elige un rango para los valores de la entrada del sistema y se escoge al menos 10 valores diferentes en ese rango. Se debe tener en consideración la capacidad del sistema y mantenerse siempre en una zona segura de operación. 2. Para cada uno de los valores de entrada seleccionados, se procede a mantener constante este valor de entrada hasta que el sistema llegue a un estado estacio5 Los valores de los parámetros se escogieron solamente con fines ilustrativos. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 198 nario (cuando la variación en la salida, o el estado que se esté midiendo varíe solo por los efectos del ruido de medición). 3. Se anota el valor alcanzado del estado o la salida y se procede a repetir el proceso para cada uno de los valores de entrada seleccionados. 4. Por último se procede a graficar el valor de las salidas o estados en función de los valores de entrada. Cuando se realiza la curva estática es importante tomar en cuenta la velocidad del proceso. Por ejemplo, para el caso de sistemas eléctricos, se puede llegar a un nuevo estado estacionario en cuestión de microsegundos, mientras que para procesos térmicos podría tardarse horas en alcanzar un nuevo estado. Incluso, para procesos biológicos (como los que se dan en plantas depuradoras de agua) se puede tardar días en llegar a un nuevo estado estacionario. 5.9. Linealización Todos los sistemas reales son no lineales en cierta medida. Como en el caso de los sistemas hidráulicos o en el caso del motor DC, a veces las relaciones matemáticas entre las variables son no lineales (la raíz cuadrada en el caso de los sistemas hidráulicos o la multiplicación de estados en el motor DC); otros tipos de no-linealidades son la saturación o la histéresis. Sin embargo, analizar estos tipos de sistemas es muy complejo y no existen métodos estándar para su estudio. Por otro lado, para los sistemas lineales existe una base teórica robusta para su análisis con la ayuda de una serie de herramientas matemáticas y de simulación. La linealización es un proceso que se puede utilizar para aproximar una relación no lineal por medio de ecuaciones lineales que serán válidas en un rango limitado alrededor de un punto de operación. La ecuación de estado de un sistema no lineal viene dada por: dx(t) = f (x(t), u(t)) . dt (5.122) La linealización consiste en obtener la expansión en series de Taylor de f (x(t), u(t)) alrededor del punto de operación deseado, pero descartando todos los elementos de orden 2 y superior. Si el punto de operación está dado por el estado x(t) = x0 (t) con Escuela de Ingeniería Eléctrica Universidad de Costa Rica 199 entrada u(t) = u0 (t), la expansión en series para cada una de las ecuaciones de los estados por separado viene dado por: (xj − xj0 ) x0 ,u0 ∂fi (x, u) + ∂uj j=1 p X ∂fi (x, u) ẋi (t) = fi (x0 , u0 ) + ∂xj j=1 m X (5.123) (uj − uj0 ), x0 ,u0 con i = 1, 2, . . . , n. Si se define los incrementos con respecto al punto de operación como δxi = xi − xi0 y δui = ui − ui0 , se desprende que δ ẋi = ẋi − ẋi0 , con ẋi0 = fi (x0 , u0 ). Normalmente, se escoge un punto en estado estacionario como el punto de operación, por lo que fi (x0 , u0 ) = 0. Al introducir estas definiciones en (5.123), se obtiene: ∂fi (x, u) δ ẋi (t) = ∂xj j=1 m X ∂fi (x, u) δxj + ∂uj j=1 x0 ,u0 p X δuj . (5.124) x0 ,u0 Esta ecuación se puede escribir en forma matricial como: δ ẋ = A0 δx + B0 δu, donde: A = 0 B = 0 ∂f 1 1 ∂x ∂f 2 ∂x1 . .. ∂f1 ∂x2 ∂f2 ∂x2 .. . ∂fn ∂x1 ∂fn ∂x2 ∂f 1 1 ∂u ∂f 2 ∂u1 . .. ∂f1 ∂u2 ∂f2 ∂u2 ∂fn ∂u1 .. . ∂fn ∂u2 ··· ··· ∂f1 ∂xn ∂f2 ∂xn ··· ··· ∂fn ∂xn ··· ··· ∂f1 ∂un ∂f2 ∂un ··· ··· ∂fn ∂un .. . .. . (5.125) , (5.126) . (5.127) x0 ,u0 x0 ,u0 La ecuación 5.125, representa el modelo linealizado del modelo no lineal original. El rango en el que este modelo es válido, depende mucho de las características del sistema y del punto de operación, por lo que podría ser que para incrementos relativamente grandes de δx0 y δu0 , sea necesario contar con una batería de modelos linealizados y pasar de uno a otro dependiendo del punto de operación. Ejemplo 5.8 Escuela de Ingeniería Eléctrica Universidad de Costa Rica 200 El modelo del sistema hidráulico en (5.114) es no lineal. Linealizar el modelo a partir del estado estacionario dado por h1 = h10 , h2 = h20 ,qe = qe0 . Solución: Si se escribe el sistema como: dh1 = f1 (h1 , h2 , qe ), dt dh2 = f2 (h1 , h2 , qe ), dt (5.128a) (5.128b) con f1 (h1 , h2 , qe ) = 1 1 q qe − ρgh1 , A1 RH f2 (h1 , h2 , qe ) = 1 1 A2 RH v u u ρgh1 − A3 u t (5.129a) 2g q 1− A23 A22 h2 , (5.129b) La aproximación lineal del sistema en incrementos se puede encontrar mediante: ∂f1 dδh1 = dt ∂h1 {h10 ,h20 ,qe0 } dδh2 ∂f2 = dt ∂h1 ∂f2 δh1 + ∂h2 {h10 ,h20 ,qe0 } δh1 + ∂f1 ∂h2 ∂f1 ∂qe {h10 ,h20 ,qe0 } ∂f2 δh2 + ∂qe {h10 ,h20 ,qe0 } {h10 ,h20 ,qe0 } δh2 + {h10 ,h20 ,qe0 } δqe , δqe , definiendo δh1 = h1 − h10 , δh2 = h2 − h20 y δqe = qe − qe0 . Realizando las derivadas parciales y sustituyendo en (5.129), se obtiene el siguiente modelo: dδh1 1 1 ρg √ δh1 , = δqe − dt A1 A1 RH 2 ρgh10 ! (5.130a) dδh2 = dt A3 1 ρg g s √ δh1 − 2 A2 RH 2 ρgh10 A2 1 − A32 ! A2 1 δh2 . 2g h 20 A2 1− (5.130b) 3 A2 2 Si se toma como punto de operación qe0 = 8 m3 /s, h10 = 5,874 m y h20 = 3,229 m, la respuesta ante un cambio en la entrada tal que δqe0 = 1, es como se presenta en la Figura 5.24. Como se puede observar, para esa variación de la entrada, el modelo Escuela de Ingeniería Eléctrica Universidad de Costa Rica 201 8 7 Nivel (m) h1 h2 6 h1 linealizado h2 linealizado 5 4 3 0 20 40 60 80 Tiempo (s) 100 120 Figura 5.24: Comparación de la respuesta de un modelo linealizado. linealizado se aproxima muy bien al modelo no lineal, tanto en su dinámica (la forma de la curva) como en su valor final. Cuando se recalcula el modelo para otro punto de operación (qe0 = 5 m3 /s, h10 = 2,296 m y h20 = 1,263 m), el resultado es como en la Figura 5.25. Aunque el modelo tiene la misma forma de (5.130), este es un modelo lineal diferente al del primer caso, puesto que sus parámetros (las matrices del MVE) dependen del punto de operación. Al compararlo con el caso anterior, se puede notar que la diferencia entre las curvas es mayor, a pesar que δqe0 es igual, la razón por la que esto ocurre se puede explicar observando el modelo estático de la Figura 5.23. Para el caso de un caudal igual a 8 m3 /s, la curva estática es casi una línea recta (es decir, muy cercano a un sistema lineal), mientras que para el caso de un caudal igual a 5 m3 /s el modelo estático está en un punto donde la curva es más pronunciada, por lo que la aproximación lineal será más cruda. También es importante notar que la forma de las curvas de respuesta al cambio en la entrada (la dinámica) es diferente en ambos casos, por lo que, dependiendo de la aplicación, podría ser necesario utilizar los dos modelos al mismo tiempo, si se desea estudiar el sistema con una aproximación lineal en un rango más amplio de entrada. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 202 3.5 Nivel (m) 3 h1 h2 2.5 h1 linealizado h2 linealizado 2 1.5 1 0 20 40 60 80 Tiempo (s) 100 120 Figura 5.25: Comparación de la respuesta del modelo linealizado para un punto de operación diferente. Figura 5.26: Figura para el ejercicio 5.1. 5.10. Ejercicios resueltos Sistemas Mecánicos Traslacionales Ejercicio 5.1 En la Figura 5.26 se muestra un sensor de posición. Su funcionamiento es el siguiente: la fuerza f (t), la cual es la entrada del sistema, empuja el rodillo de masa m por un tubo con aceite y fricción viscosa b. Este rodillo posee un resorte con constante de elasticidad k en su extremo que hace que se pueda devolver a la posición inicial cuando la fuerza se retira. Atado al rodillo está la terminal de un potenciómetro al que se conecta una fuente de tensión de 5 V respecto a tierra, por lo que se produce una salida de tensión dependiendo de la posición del rodillo. Si la salida del sistema es la tensión v(t) y la relación entre v(t) y x(t) (la distancia recorrida por el rodillo) es v(t) = Rx(t), determine el modelo en variables de estado del sistema. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 203 Figura 5.27: Diagrama del cuerpo libre para el sistema de la Figura 5.26. Solución: El diagrama del cuerpo libre del sistema se encuentra en la Figura 5.27. Definiendo los desplazamientos como positivos hacia la izquierda, se obtiene: f (t) − fk (t) − fb (t) = m d2 x(t) , dt2 (5.131) pero la fuerza ejercida por la amortiguación viscosa es: dx(t) , dt (5.132) fk (t) = kx(t). (5.133) fb (t) = b y la fuerza ejercida por el resorte es: Sustituyendo (5.132) y (5.133) en (5.131) se obtiene: f (t) − kx(t) − b d2 x(t) dx(t) =m . dt dt2 (5.134) Como se tiene que v(t) = Rx(t), al introducir esta relación en (5.134): f (t) − k b dv(t) m d2 v(t) v(t) − = . R R dt R dt2 (5.135) Por lo general, el número de estados de un sistema es igual al doble de los cuerpos que posean masa puesto que los estados se pueden escoger como el desplazamiento y la velocidad de estos cuerpos. Como v(t) = Rx(t), Los estados se pueden escoger como: # " # " x1 (t) v x(t) = = . (5.136) x2 (t) v̇ Escuela de Ingeniería Eléctrica Universidad de Costa Rica 204 Sustituyendo (5.136) en (5.135) y utilizando la notación de punto para las derivadas, se obtiene que: k b R ẋ2 (t) = − x1 (t) − x2 (t) + f (t), (5.137) m m m y se sabe que ẋ1 (t) = v̇(t) = x2 (t). La salida es v(t) que es el estado x1 (t). Entonces el modelo en variables de estado del sistema quedaría: " v̇(t) ẋ2 (t) # " = y= h 0 k −m 1 − mb 1 i 0 " #" v(t) x2 (t) v(t) x2 (t) # " + # 0 R m # f (t), (5.138) . Ejercicio 5.2 Un cohete propulsado por una fuerza F (t) se muestra en el diagrama del cuerpo libre de la Figura 5.28. Suponiendo que la fricción del aire es proporcional a la velocidad del mismo con una constante de proporcionalidad b (y por tanto se comporta como un amortiguador viscoso). La constante gravitacional g no se considera constante sino que se calcula como: GM g= , (5.139) (R + d(t))2 donde G es la constante gravitacional, M es la masa de la Tierra (suponemos que es un cohete terrestre), R es el radio de la Tierra y d es la altura del cohete. La fuerza que impulsa el cohete proviene de la combustión de algún material. La ecuación para esta fuerza viene dada por6 : F (t) = ṁc Ve + (pe − p0 )Ae , (5.140) donde ṁc es el flujo de masa del combustible, Ve es la velocidad de salida del combustible pe es la presión de salida de los gases, p0 es la presión alrededor del cohete y Ae es el área a la salida del cohete. Encuentre un modelo para este sistema. Solución: Este es un sistema que tiene varias peculiaridades: la primera es que el sistema se traslada verticalmente, por lo que hay que tomar en cuenta el efecto de la gravedad sobre los cuerpos con masa, la segunda es que debido a las alturas que se están tomando en cuenta son bastante grandes, la aceleración de la gravedad no se toma 6 http://www.grc.nasa.gov/WWW/k-12/airplane/rockth.html Escuela de Ingeniería Eléctrica Universidad de Costa Rica 205 Figura 5.28: Diagrama del cuerpo libre para el Ejercicio 5.2. como constante y por último, se trata de un sistema en el que la masa está variando con el tiempo. Debido a que la masa varía, se debe utilizar la ecuación (5.14) en lugar de la ecuación (5.15) para analizar la suma de fuerzas: X Fx = d (Mt (t)v(t)) , dt (5.141) Mt (t) es la masa total del sistema en el instante t y v(t) es la velocidad del cohete. Esta masa la vamos a modelar como la masa inicial M0 menos la cantidad de masa de combustible que se ha perdido desde el instante inicial que, por simplicidad, se va a considerar igual a cero. Es decir Mt = M0 − ṁc t. La sumatoria de fuerzas se puede escribir como: X F x = F − Fb (t) − Mt g = ṁc Ve + (pe − p0 )Ae − bv(t) − (M0 − ṁc t) GM (R + d(t))2 (5.142) Por supuesto, la masa Mt nunca puede llegar a ser cero, puesto que, si se diera el caso que todo el combustible se consumiera, la masa total debería ser simplemente la masa del cohete. Esta es una consideración que debería hacerse a la hora de intentar simular estas ecuaciones. Introduciendo (5.142) en (5.141), se llega a que ṁc Ve + (pe − p0 )Ae − bv(t) − (M0 − ṁc t) Escuela de Ingeniería Eléctrica GM d ((M0 − ṁc t) v(t)) (5.143) 2 = dt (R + d(t)) Universidad de Costa Rica 206 Por supuesto que siempre se puede escribir que: dd(t) = v(t). dt (5.144) Y como si estas ecuaciones no fueran complicadas, todavía hace falta una relación entre el flujo de masa y la velocidad de los gases y una ecuación para definir qué controla el flujo de masa. Claro, acá no se están tomando en cuenta tampoco que el cohete no viaja completamente vertical y de hecho, tampoco se está tomando en cuenta factores como la redondez y la rotación de la tierra, la velocidad del viento, etc. Esta puede ser una buena explicación de por qué, en el idioma inglés, cuando algo es difícil, se dice que es tan difícil como el “rocket science”. Sistemas rotacionales y motores DC Ejercicio 5.3 Determine el modelo en variables de estado del sistema de la Figura 5.29 si la salida es la distancia recorrida d1 y la entrada es la fuerza f (t). Solución: Figura 5.29: Sistema mecánico traslacional. Del diagrama de cuerpo libre de la masa M1 (Véase la Figura 5.30) se obtiene7 : 7 En la mayoría de los casos es preferible no trabajar con variables que identifiquen aceleraciones o velocidades, es mejor utilizar de una vez la notación: a = d¨ y v = d˙ donde a es la aceleración y v es la velocidad. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 207 Figura 5.30: Diagrama de cuerpo libre de la masa M1 . Figura 5.31: Diagrama de cuerpo libre de la masa M2 X F = M1 · d¨1 ⇒ M1 · d¨1 = f1 − fB1 − fK1 ⇒ →+ M1 · d¨1 = f1 − B1 · d˙1 − K1 · (d1 − a · θ) ⇒ B1 ˙ K1 K1 1 d¨1 = · f1 − · d1 − · d1 + ·a·θ (5.145) M1 M1 M1 M1 y del diagrama de cuerpo libre de la masa M2 (Véase la Figura 5.31) se obtiene: X F = M2 · d¨2 ⇒ ←+ M2 · d¨2 = fK2 − fB2 ⇒ M2 · d¨2 = K2 · (b · θ − d2 ) − B2 · d˙2 ⇒ K2 K2 B2 ˙ · d2 − · d2 + ·b·θ d¨2 = − M2 M2 M2 (5.146) Del diagrama de cuerpo libre de la palanca mostrado en la Figura 5.32 se tiene8 : X τ = J · θ̈ ⇒ ←-+ a · fK1 − b · fK2 = 0 a · K1 · (d1 − a · θ) − b · K2 · (b · θ − d2 ) = 0 (5.147) 8 El momento de inercia J de la palanca es directamente proporcional a la masa de ésta, si se supone que la masa de la palanca es despreciable, su momento de inercia es nulo. Se supone además que el ángulo θ es pequeño, menor a 15◦ , por lo que sin(θ) = θ. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 208 Figura 5.32: Diagrama de cuerpo libre de la palanca. y despejando de la ecuación (5.147): a · K1 · (d1 − a · θ) − b · K2 · (b · θ − d2 ) = 0 a · K 1 · d 1 − a2 · K 1 · θ − b 2 · K 2 · θ + b · K 2 · d 2 = 0 ⇒ a · K1 b · K2 θ= 2 · d1 + 2 · d2 2 a · K1 + b · K2 a · K 1 + b2 · K 2 (5.148) Introduciendo (5.148) en (5.145) y (5.146) se obtiene: 1 B1 ˙ K1 d¨1 = · f1 − · d1 − · d1 M1 M1 M1 ! K1 a · K1 b · K2 + ·a· 2 · d1 + 2 · d2 M1 a · K 1 + b2 · K 2 a · K 1 + b2 · K 2 −b2 K1 K2 B1 ˙ a · b · K1 · K2 f1 = d1 − d1 + d2 + 2 2 2 2 M1 · (a · K1 + b · K2 ) M1 M1 (a · K1 + b · K2 ) M1 (5.149) ! K2 K2 a · K1 b · K2 B2 ˙ · d2 − · d2 + ·b· 2 · d1 + 2 · d2 d¨2 = − 2 M2 M2 M2 a · K1 + b · K2 a · K 1 + b2 · K 2 a · b · K1 · K2 a2 · K 1 K 2 B2 ˙ = d − d2 − d2 . (5.150) 1 2 2 2 2 M2 (a · K1 + b · K2 ) M2 · (a · K1 + b · K2 ) M2 Como solo (5.149) depende de f1 (t), las ecuaciones (5.149) y (5.150) son l.i, de esta forma los acumuladores de energía son independientes y se puede realizar la siguiente Escuela de Ingeniería Eléctrica Universidad de Costa Rica 209 asignación de estados: x(t) = x1 (t) x2 (t) x3 (t) x4 (t) = d1 (t) d˙1 (t) d2 (t) d˙2 (t) x˙1 = x2 x˙2 = 2 ! −b K1 K2 B1 a · b · K1 · K2 f1 x1 − x2 + x3 + 2 2 2 2 M1 · (a · K1 + b · K2 ) M1 M1 (a · K1 + b · K2 ) M1 x˙3 = x4 a · b · K1 · K 2 −a2 · K1 K2 B2 x˙4 = x4 x + x3 − 1 2 2 2 2 M2 (a · K1 + b · K2 ) M2 · (a · K1 + b · K2 ) M2 ! Si f1 = u y y = d1 , el modelo en variables de estado sería: o −b2 K K2 M ·(a2 ·K 1+b 2 ·K ) 1 1 2 0 ẋ = a·b·K1 ·K2 M2 (a2 ·K1 +b2 ·K2 ) 1 B1 −M 1 0 0 y= 0 a·b·K1 ·K2 M1 (a2 ·K1 +b2 ·K2 ) 0 −a2 ·K1 K2 M2 ·(a2 ·K1 +b2 ·K2 ) h 1 0 0 0 i 0 0 1 B2 −M 2 0 1 ·x+ M1 0 0 ·u ·x Siendo la asignación de estados: x(t) = Escuela de Ingeniería Eléctrica x1 (t) x2 (t) x3 (t) x4 (t) = d1 (t) d˙1 (t) d2 (t) d˙2 (t) Universidad de Costa Rica 210 Sistemas mecánicos rotacionales Ejercicio 5.4 Determine el MVE del sistema mostrado en la Figura 5.33, el cual consta de un motor DC moviendo una carga de inercia rotacional J. El eje del motor se somete a un amortiguador viscoso de constante B y también se puede modelar como un resorte torsional de constante K. La entrada del sistema es la tensión Vin y la salida es el ángulo de giro de la masa. Figura 5.33: Motor DC moviendo una carga. Solución: Primeramente se determinarán las ecuaciones físicas del sistema: Para el motor DC: Vin = Ra · ia + La · i˙a + Vm , (5.151) donde Vm es la tensión contraelectromotriz generado por el motor. A la salida del motor: Vm = kf · θ̇m (5.152) τm = kf · ia , (5.153) donde kf es una constante, θ˙m es el ángulo de giro del eje y τm es el par de salida generado por el motor. Sumatoria de pares en la salida del motor: τm − τB − τK = 0 ⇒ τm − B · θ̇m − K(θm − θS ) = 0, (5.154) donde la sumatoria de pares se realizó de la siguiente manera; el par que genera el movimiento es el par del motor, por ello se suma positivo, los pares producidos por el amortiguador viscoso y el resorte torsional se oponen al movimiento, por lo que se Escuela de Ingeniería Eléctrica Universidad de Costa Rica 211 sumaron negativos. El par del amortiguador viscoso es τB = B · θ˙m , porque se toma como referencia angular un punto estacionario, por lo que la velocidad del eje es θ˙m . El par del resorte torsional es τK = K(θm − θS ) debido a que el desplazamiento angular del resorte es θm − θS donde θS es el ángulo de giro de la masa. Esta sumatoria de pares se realizó hasta la entrada del resorte porque hasta este punto se termina un eje fijo, en general, es aconsejable realizar la sumatoria de pares solo en ejes fijos, es decir, antes de un resorte y después del resorte. Sumatoria de pares en la salida del resorte: τK = τL ⇒ K(θm − θS ) = J · θ̈S (5.155) Esta sumatoria se debe a que es el par del resorte quien mueve directamente a la masa, y el ángulo de giro de la masa es θS . Por simplicidad las ecuaciones (5.151) a (5.155) se vuelven a copiar: Vin = Ra · ia + La · i˙a + Vm Vm = kf · θ̇m τm = kf · ia τm − B · θ̇m − K(θm − θS ) = 0 K(θm − θS ) = J · θ̈S De (5.151) se observa que la corriente del inductor podría ser un estado, no obstante, de (5.153) se concluye que el par del motor también puede serlo, ya que es linealmente dependiente con la corriente del inductor. Cualquiera de los dos puede ser estado, pero los dos no pueden serlo al mismo tiempo, de lo contrario se agregaría más información de la necesaria al MVE. Por otro lado, en (5.154) se observa que θm puede ser estado, ya que se encuentra derivado. De (5.155) se concluye que θ̇S puede ser estado, ya que se encuentra derivado. Por último, tanto en (5.154) como (5.155) aparece θS , por lo que se debe definir como estado, ya que de lo contrario no se podrían escribir las derivadas de los estados en función de los estados y las entradas. De este análisis se concluye que dos posibles asignaciones del vector de estados son: x1 (t) = Escuela de Ingeniería Eléctrica ia θm θS θ̇S x2 (t) = τm θm θS θ̇S Universidad de Costa Rica 212 Por comodidad, se trabajará con la primera asignación de estados, se deja como ejercicio hacerlo con la segunda. De esta forma, se debe encontrar: ẋ(t) = ẋ1 ẋ2 ẋ3 ẋ4 = i̇a θ̇m θ̇S θ̈S = F (x, u) . Sustituyendo (5.152) en (5.151) se tiene que: Vin = Ra · ia + La · i̇a + kf θ̇m ⇒ i̇a = − Ra kf 1 · ia − · θ̇m + · Vin La La La (5.156) La cual es una expresión de i̇a (un estado derivado) en función de un estado, la entrada del sistema y el estado derivado θ̇m , por lo que no es una ecuación válida para el MVE buscado, se debe eliminar θ̇m de (5.156). A partir de sustituir (5.153) en (5.154) se tiene que: kf · ia − B · θ̇m − K(θm − θS ) = 0 ⇒ kf K · ia − · (θm − θS ) (5.157) B B la cual es una expresión de un estado derivado en función de estados sin derivar, por lo que es una ecuación válida para el modelo en variables de estado buscado. Sustituyendo (5.157) en (5.156) se obtiene que: θ̇m = kf kf K 1 Ra · ia − · · ia − · (θm − θS ) + · Vin ⇒ i̇a = − La La B B La " kf2 Ra i̇a = − + La La · B ! · ia + # kf · K kf · K 1 · θm − θS + · Vin La · B La · B La (5.158) (5.158) es una expresión de un estado derivado en función de estados sin derivar y la entrada del sistema, por lo que es una ecuación válida para el MVE. Finalmente, de (5.155) se obtiene que: K K θ̈S = · θm − · θS (5.159) J J Esta es una expresión de un estado derivado en función de estados sin derivar, por lo que también es una ecuación válida para el modelo en variables de estado. A partir de Escuela de Ingeniería Eléctrica Universidad de Costa Rica 213 (5.156), (5.157) y (5.159), de la asignación de estados realizada y definiendo Vin = u se obtiene que: kf2 Ra + ẋ1 = − La La · B ! ẋ2 = · x1 + kf · K kf · K 1 · x2 − x3 + ·u La · B La · B La (5.160) kf K K · x1 − · x2 + · x3 B B B x3 = θS ⇒ (5.161) ẋ3 = θ̇S = x4 ẋ4 = y la salida es: (5.162) K K · x2 − · x3 J J (5.163) y = θS = x3 (5.164) Las ecuaciones (5.160) a (5.164) en forma matricial resultan: ẋ(t) = ẋ1 ẋ2 ẋ3 ẋ4 − = Ra La + kf2 La ·B kf B 0 0 kf ·K La ·B −K B 0 K J J y(t) = Con: h x(t)T = 0 0 1 0 h k ·K − Lfa ·B 0 x1 x K 2 0 · B x3 0 1 x4 −K 0 i · x1 x2 x3 x4 ia θm θS θ̇S 1 La 0 + 0 0 · u(t) iT u(t) = Vin y(t) = θS Ejercicio 5.5 Para medir la máxima deformidad de un cuerpo, con constante de elasticidad k, se puede utilizar el sistema de la Figura 5.34. El sistema consta de un motor DC alimentado por la tensión Va , en la salida del motor se tiene un momento de inercia Escuela de Ingeniería Eléctrica Universidad de Costa Rica 214 + - Figura 5.34: Medidor de esfuerzo. J2 , debido a la geometría de su eje. Por la presencia de los roles, se tiene una fricción viscosa B. El eje del motor se conecta a un engrane de radio R2 , éste se conecta a otro engrane de radio R1 (con R2 <R1 ) para reducir la velocidad del motor y aumentar el par aplicado al cuerpo. Al engrane R1 se conecta el cuerpo de estudio, cuya inercia rotacional es J1 . Para determinar su resistencia, uno de sus extremos se conecta a un soporte fijo. La idea del sistema es determinar el máximo ángulo de giro θ1 antes de que el cuerpo se destruya, por lo general esta prueba es destructiva. Determine el modelo en variables de estado de este sistema si la entrada es la tensión Va y la salida es el ángulo θ1 . Además, grafique el comportamiento del ángulo de salida si se tienen los siguientes parámetros: kf = 0, 1N · m · A−1 Ra = 0, 1Ω R1 = 0, 05m k = 12N · m · rad−1 J1 = 0, 02215kg · m2 B = 1N · m · s · rad−1 J2 = 2kg · m2 R2 = 0, 3m La = 0, 28H Va = 240V Solución: Las ecuaciones físicas del sistema son: Para el circuito eléctrico: Para el motor DC: Va = Ra · ia + La · i̇a + Vm (5.165) τm = kf · ia (5.166) Vm = kf θ̇m (5.167) Sumatoria de pares en la salida del motor: τm − τ2 − B · θ̇m = J2 θ̈m En el sistema de engranajes: θm = Escuela de Ingeniería Eléctrica R1 · θ1 R2 (5.168) (5.169) Universidad de Costa Rica 215 R2 · τ1 R1 Sumatoria de pares en la salida del engranaje R1 : τ2 = (5.170) τ1 − k · θ1 = J1 · θ̈1 (5.171) De la ecuación (5.169) se observa que θm y θ1 son linealmente dependientes, por lo que ambos no pueden ser variables de estado al mismo tiempo, de lo contrario, se agregaría más información al modelo de la necesaria. Como la salida del sistema es el ángulo θ1 , se elegirá θ1 como variable de estado y se eliminará θm del resto de ecuaciones. Sustituyendo (5.169) en (5.167) y reemplazando el resultado en (5.165) se obtiene: kf · R1 Va = Ra · ia + La · i̇a + · θ̇1 ⇒ R2 Ra kf · R1 1 i̇a = − · ia − · θ̇1 + · Va (5.172) La La · R2 La Sustituyendo la ecuación (5.169) en la ecuación (5.168) se tiene: τm − τ2 − B · R1 J2 · R1 · θ̇1 = · θ̈1 R2 R2 (5.173) Luego, al despejar τ1 de la ecuación (5.171) y sustituirlo en (5.170) se tiene: τ2 = R2 · J1 · θ̈ + kθ1 R1 (5.174) Reemplazando (5.166) y (5.174) en (5.173) se tiene: kf · ia − θ̈1 = − R2 b · R1 J2 · R1 · J1 · θ̈1 + k · θ1 − · θ̇1 = · θ̈1 ⇒ R1 R2 R2 k · R22 B · R12 kf · R1 · R2 · θ − · θ̇1 + · ia (5.175) 1 2 2 2 2 J2 · R1 + J1 · R2 J2 · R1 + J1 · R2 J2 · R12 + J1 · R22 Si el vector de estados se define de forma que: θ1 x1 x(t) = x2 = θ̇1 x3 ia El MVE del sistema sería: Escuela de Ingeniería Eléctrica Universidad de Costa Rica 216 Figura 5.35: Librería Continuous y bloque State-Space 0 ẋ(t) = − k·R22 J2 ·R12 +J1 ·R22 0 − 1 0 − La ·R2 kf ·R1 ·R2 J2 ·R12 +J1 ·R22 a −R La B·R12 J2 ·R12 +J1 ·R22 kf ·R1 y(t) = h 1 0 0 i · x(t) + 0 0 · Va 1 La · x(t) Para graficar la respuesta del sistema se utilizará el bloque State-Space de la librería Continuous de Simulink. Este bloque permite modelar un sistema utilizando el modelo en variables de estado (en la misma librería se encuentran bloques para modelar sistemas a partir de la función de transferencia). La librería y el bloque se muestran en la Figura 5.35. Al seleccionar el bloque con el clic derecho, colocarlo en un nuevo modelo y presionar doble clic izquierdo sobre él, aparece la ventana de parámetros del bloque, tal y como se muestra en la Figura 5.36. En donde se pueden ingresar las matrices que conforman el MVE de la siguiente forma: A = [010; −k ∗ R22 ∗ R1/(R1 ∗ (J2 ∗ R12 + J1 ∗ R22 )) − B ∗ R22 ∗ R1/(R1 ∗ (J2 ∗ R12 + J1 ∗ R22 ))kf ∗ R2 ∗ R1/(J2 ∗ R12 + J1 ∗ R22 ); 0 − kf ∗ R1/(La ∗ R2) − Ra/La] B = [0; 0; 1/La] C = [100] D = [0] Escuela de Ingeniería Eléctrica Universidad de Costa Rica 217 Figura 5.36: Parámetros del bloque State-Space Ejercicio 5.6 Determine el MVE del sistema mecánico que se muestra en la Figura 5.37. La salida del sistema es la distancia relativa entre el bloque de masa M1 y el bloque de masa M2 , la entrada del sistema es la fuerza u. Figura 5.37: Bloques con interacción Solución: En la Figura 5.38 se muestra el diagrama de cuerpo libre del bloque de masa M1 , de él: X F = M1 · d¨1 ⇒ +→ = −fk1 − fk2 − fB + u ⇒ = −k1 · d1 − K2 · (d1 − d2 ) − B · (d˙1 − d˙2 ) + u K2 B ˙ B ˙ 1 K1 + K2 d¨1 = − · d1 + · d2 − · d2 + · d1 + ·u M1 M1 M1 M1 M1 Escuela de Ingeniería Eléctrica (5.176) Universidad de Costa Rica 218 Figura 5.38: Diagrama de cuerpo libre de M1 Figura 5.39: Diagrama de cuerpo libre de M2 Del diagrama de cuerpo libre de la masa M2 , mostrado en la Figura 5.39, se tiene9 : X +→ F = M2 · d¨2 = fk2 − fk3 + fB ⇒ = k2 · (d1 − d2 ) − K3 · d2 − B · (d˙1 − d˙2 ) ⇒ K2 K2 + K3 B ˙ B ˙ d¨2 = · d1 − · d2 + · d1 − · d2 M2 M2 M2 M2 Si la asignación de estados se hace como sigue: x(t) = x1 (t) x2 (t) x3 (t) x3 (t) = d1 (t) d2 (t) d˙1 (t) d˙2 (t) (5.177) 9 Si la fricción viscosa es proporcionada por un cilindro, el carro de masa M1 empujará dicho cilindro, posteriormente éste último empujará el carro de masa M2 , por esta razón la dirección de la fuerza en la Figura 5.38 es hacia la derecha. Si la fricción viscosa fuese proporcionada por alguna sustancia en el suelo, ambos carros experimentarían una fuerza de fricción viscosa pero hacia la izquierda. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 219 Las ecuaciones de estado en forma diferencial serían: x˙1 x˙2 x˙3 x˙4 = x3 = x4 K2 2 = − K1M+K · x1 + M · x2 − MB1 · x3 + MB1 · x4 + 1 1 K2 3 =M · x1 − K2M+K · x2 + MB2 · x3 − MB2 · x4 2 2 1 M1 ·u Al ser la salida del sistema la distancia relativa entre el bloque M1 y el bloque M2 se tiene: y = d1 − d2 y = x1 − x 2 Por lo que el MVE del sistema sería: ẋ(t) = 0 0 2 − K1M+K 1 K2 M2 0 0 K2 M1 3 − K2M+K 2 y(t) = 1 0 − MB1 B M2 0 1 B M1 − MB2 0 0 ·x+ 1 M 1 h 1 −1 0 0 i x1 (t) x2 (t) x3 (t) x3 (t) d1 (t) d2 (t) d˙1 (t) d˙2 (t) 0 ·u · x(t) Siendo la asignación de estados: x(t) = = Ejercicio 5.7 Determine el modelo en variables de estado del sistema mostrado en la Figura 5.40 si la entrada es el par aplicado τin y la salida es el ángulo de giro de la inercia rotacional J2 .10 Solución: Como es costumbre, se determinarán primero las ecuaciones físicas del sistema: Sumatoria de pares en la entrada del resorte k1 : τin − τK1 = 0 ⇒ 10 Problema modificado de “Modelado y análisis de los sistemas utilizando la red generalizada”, Víctor Alfaro, 2005. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 220 Figura 5.40: Sistema rotacional τin − K1 (θin − θ1 ) = 0 (5.178) Sumatoria de pares en la salida del resorte K1 hasta el amortiguador viscoso B1 11 : τK1 − τB1 − τB2 = J1 · θ̈1 ⇒ K1 (θin − θ1 ) − B1 (θ̇1 − θ̇2 ) − B2 · θ̇1 = J1 · θ̈1 (5.179) Sumatoria de pares en la salida del amortiguador viscoso B1 y hasta la entrada del resorte K2 : τB1 − τB2 − τK2 = J2 · θ̈2 ⇒ B1 (θ̇1 − θ̇2 ) − B2 · θ̇1 − K2 · θ2 = J2 · θ̈2 (5.180) No es necesario analizar la salida del resorte K2 debido a que éste se encuentra anclado en la referencia. De (5.179)y (5.180) se observa la presencia de θ̈1 y θ̈2 , por lo que θ̇1 y θ̇2 pueden ser variables de estado. Además, en (5.180) se observa la presencia de θ2 , por lo que si se quiere escribir el modelo en variables de estado de la forma: ẋ = A · x + B · u y =C ·x+D·u (5.181) solo hay dos posibilidades, eliminar θ2 o definirlo como estado. Como no se tienen ecuaciones suficientes para eliminarlo se debe definir como estado. Por otro lado, en (5.179) y (5.178) está el término K1 (θ1 − θin ), en (5.178) este término se iguala al par de entrada, por lo que se puede sustituir (5.178) en (5.179) para eliminar por completo a θ1 y a θin y no tomarlos como estados. De este análisis se concluye que 11 Esta sumatoria se debe a que ambas inercias no en encuentran en un mismo eje fijo, por lo tanto se hacen sumatorias de pares distintas para cada sección. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 221 una posible asignación para el vector de estados es: θ2 x1 x(t) = x2 = θ̇2 x3 θ̇1 (5.182) τin = u y = θ2 (5.183) Donde se considerará además: De la asignación de estados hecha en (5.182) se tiene que: x1 = θ2 ⇒ ẋ1 = θ̇2 = x2 (5.184) despejando θ̈2 de (5.180) se obtiene: θ̈2 = − K2 B1 B1 + B2 · θ2 − · θ̇2 + · θ̇1 ⇒ J2 J2 J2 ẋ2 = − K2 B1 + B2 B1 · x1 − · x2 + · x3 J2 J2 J2 (5.185) finalmente, sustituyendo (5.178) en (5.179) y despejando θ̈1 del resultado tiene que: θ̈1 = − 1 B1 + B2 B1 · θ̇2 − · θ̇1 + · τin ⇒ J1 J1 J1 B1 B1 + B2 1 ẋ3 = − · x2 − ·u · x3 + J1 J1 J1 (5.186) y a partir de (5.183), (5.184), (5.185) y (5.186) en forma matricial se obtiene: 0 1 0 0 ẋ1 x1 B1 2 − KJ22 − B1J+B 0 x(t) = ẋ2 = 2 J2 · x2 + 1 · u 2 ẋ3 x3 0 − BJ11 − B1J+B J1 1 y(t) = h 1 0 0 i x1 · x2 x3 Siendo este el modelo en variables de estado del sistema. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 222 Figura 5.41: Sistema hidráulico Sistemas hidráulicos Ejercicio 5.8 Determine el MVE no lineal del sistema hidráulico mostrado en la Figura 5.41 si las entradas del sistema son los caudales qa y qb y la presión atmosférica Patm , las salidas son los niveles de ambos tanques y el caudal de salida qo . Suponga que todos los tanques están al mismo nivel respecto al suelo. Solución: Las ecuaciones físicas del sistema son: Para el tanque 1: qa − q1 = C1 · Ṗ1 (5.187) Donde q1 y P1 son respectivamente, el caudal de salida del tanque y la presión en el fondo del mismo, C1 es la capacitancia hidráulica asociada. Para la bomba: qout P1 = =n (5.188) q1 Pout Donde P1 es la presión de entrada a la bomba, Pout es la presión de salida y qout es el caudal de salida de la bomba. Para la restricción k1 : q qout = k1 · Pout − P2 (5.189) Donde P2 es la presión de entrada al tanque 2. Para el tanque 2: qb + qout − qo = C2 · Ṗ2 Y para la restricción k2 : qo = k2 · q (5.190) (5.191) P2 − Patm Sustituyendo (5.189) y (5.191) en (5.190) se tiene: q b + k1 · Escuela de Ingeniería Eléctrica q Pout − P2 − k2 · q P2 − Patm = C2 · Ṗ2 ⇒ Universidad de Costa Rica 223 k2 q k1 q 1 · P2 − Patm + · Pout − P2 + · qb C2 C2 C2 Por otro lado, de (5.189) y (5.188) se tiene que: Ṗ2 = − k1 q1 = · n s Pout = (5.192) P1 − P2 n (5.193) P1 n (5.194) y sustituyendo (5.193) en (5.187) se tiene: k1 qa − · n s P1 − P2 = C1 · Ṗ1 ⇒ n s k1 P1 1 Ṗ1 = − · − P2 + · qa C1 · n n C1 sustituyendo (5.194) en (5.192) se obtiene: k2 q k1 · P2 − Patm + · Ṗ2 = − C2 C2 s (5.195) 1 P1 · qb − P2 + n C2 (5.196) de (5.195) y (5.196) se observa que si los estados y las entradas se definen de forma que: " # " # u1 qa x1 P1 x(t) = = u(t) = u2 = qb x2 P2 u3 Patm Se tendría: x1 k1 1 ẋ1 = − · − x2 + · u1 C1 · n n C1 r k2 √ k1 x1 1 ẋ2 = − · x2 − u3 + · − x2 + · u2 C2 C2 n C2 r por otro lado, como12 : ρ · g · h1 + Patm = P1 ⇒ h1 = y1 = 1 1 · (P1 − Patm ) = · (x1 − u3 ) ρ·g ρ·g 12 Como P1 y P2 son presiones absolutas, son iguales a la presión que ejerce el líquido en el fondo del tanque (p · g · h) más la presión atmosférica Patm . Escuela de Ingeniería Eléctrica Universidad de Costa Rica 224 1 1 · (P2 − Patm ) = · (x2 − u3 ) ρ·g ρ·g ρ · g · h2 + Patm = P2 ⇒ h2 = y2 = por último, de (5.191) se tiene que: qo = k2 · q P2 − Patm ⇒ √ x2 − u3 y3 = k2 · por lo que el MVE no lineal del sistema sería: ẋ1 = − k1 · C1 · n r x1 1 − x2 + · u1 n C1 r x1 k2 √ k1 1 ẋ2 = − · x2 − u3 + · − x2 + · u2 C2 C2 n C2 1 y1 = · (x1 − u3 ) p·g 1 · (x2 − u3 ) y2 = p·g √ y3 = k2 · x2 − u3 Ejercicio 5.9 Obtenga el MVE no lineal del sistema hidráulico mostrado en la Figura 5.42 si las entradas del sistema son el caudal q1 y la presión atmosférica Patm y la salida es el caudal qo . Solución: Las ecuaciones físicas del sistema son: Para el tanque 1: q1 − q2 = A1 · ḣ1 (5.197) Para la restricción k1 : q2 = k1 · q (ρ · g · h1 + Patm ) − Patm ⇒ q2 = k1 · Para el segundo tanque: Escuela de Ingeniería Eléctrica q ρ · g · h1 q2 − qo = A2 · ḣ2 (5.198) (5.199) Universidad de Costa Rica 225 Figura 5.42: Sistema de tanques Para la tubería de longitud La : (ρ · g · h2 + Patm ) − P3 = La · q̇o (5.200) Donde P3 es la presión en la entrada de la restricción k2 . Para la restricción k2 : q qo = k2 · P3 − Patm (5.201) Sustituyendo (5.198) en (5.197) se tiene: q1 − k1 · ḣ1 = − q ρ · g · h1 = A1 · ḣ1 ⇒ k1 q 1 ρ · g · h1 + · q1 A1 A1 (5.202) De (5.198) en (5.199) se obtiene: q k1 ρ · g · h1 − qo = A2 · ḣ2 ⇒ 1 k1 q ḣ2 = · ρ · g · h1 − · qo A2 A2 De (5.201) se tiene que: P3 = (5.203) 1 · q 2 + Patm k22 o (5.204) Resultado que puede introducirse en (5.200) para obtener: 1 (ρ · g · h2 + Patm ) − · q 2 + Patm = La · q̇o k22 o ! Escuela de Ingeniería Eléctrica Universidad de Costa Rica 226 q̇o = ρ·g 1 · h2 − · q2 La La · k22 o (5.205) Si se define que: x1 h1 x x(t) = 2 = h2 x3 qo y(t) = qo = x3 u(t) = q1 Se tiene, a partir de (5.202), (5.203) y (5.205) el siguiente modelo en variables de estado para el sistema bajo estudio: ẋ1 = − k1 √ 1 ρ · g · x1 + ·u A1 A1 k1 √ 1 · ρ · g · x1 − · x3 A2 A2 ρ·g 1 ẋ3 = · x2 − · x23 2 La La · k2 y = x3 ẋ2 = Ejercicio 5.10 Determine el modelo en variables de estado del sistema mostrado en la Figura 5.43 si las entradas son el caudal qe y la presión atmosférica Patm , mientras las salidas son el caudal qs y el caudal qo . El radio del tanque cónico es R y su altura es h. Al lado del tanque de paredes paralelas se coloca un pequeño orificio de área A a una altura h3 del nivel del suelo, suponga que siempre existe un caudal qo y por tanto h2 > h3 . Solución: Primeramente se determinarán las ecuaciones físicas del sistema: Para el tanque cónico se tiene, por la ecuación de balance de masas: qe − q1 = V̇ (5.206) donde V̇ es la derivada del volumen respecto al tiempo, es importante notar que para el caso de tanques de paredes paralelas y abiertos se tenía: qin − qout = CH · Ṗ = A · ḣ (5.207) pero (5.207) solo es aplicable si los tanques son abiertos y de paredes paralelas, la ecuación (5.206) es el caso general para un tanque de cualquier geometría. De esta Escuela de Ingeniería Eléctrica Universidad de Costa Rica 227 Figura 5.43: Sistema hidráulico con tanque cónico Figura 5.44: : Mitad de la sección transversal del tanque cónico forma, se podría obtener una expresión analítica del volumen del tanque en función del nivel de éste para utilizar el nivel como variable de estado, como es costumbre en estos casos. En la Figura 5.44 se muestra la mitad de la sección transversal del tanque cónico, en la figura R1 representa el radio del cono del agua y h1 su altura. Por semejanza de triángulos se puede determinar que: h1 R1 R = ⇒ R1 = · h1 h R h (5.208) además, se tiene que el volumen del cono de agua es: V = Escuela de Ingeniería Eléctrica π · h1 · R12 3 (5.209) Universidad de Costa Rica 228 y sustituyendo (5.208) en (5.209) se tiene que: R π V = · h1 · · h1 3 h 2 = π · R2 3 · h1 = k · h31 2 3h (5.210) Así, sustituyendo (5.210) en (5.206) se obtiene: qe − q1 = V̇ = i d h k · h31 dt (5.211) Utilizando la regla de la cadena se puede obtener la derivada de la parte derecha de (5.211) como: i d h d 3 dh1 k · h31 = k h · = 3k · h21 · ḣ1 (5.212) dt dh1 1 dt y sustituyendo (5.212) en (5.211) se tiene: qe − q1 = 3k · h21 ḣ1 = k 0 h21 ḣ1 (5.213) Con lo que se tiene la ecuación que describe la variación del nivel del tanque en función de los caudales de entrada y salida. Por otro lado, para la válvula k1 se tiene: q q q1 = k1 ρ · g · h1 + Patm − Patm = k1 ρ · g · h1 (5.214) Para el segundo tanque tiene que: q1 − qo − qs = A2 · ḣ2 (5.215) pero al ser el caudal qo debido a un orificio en el tanque se tiene por el teorema de Torrecelli: q qo = A 2g · hx donde hx es la altura del orificio respecto al nivel de agua que se puede escribir como: hx = h2 − h3 y por tanto: q qo = A 2g · (h2 − h3 ) (5.216) y además, de la válvula k2 se obtiene que: q q qs = k2 ρ · g · h2 + Patm − Patm = k2 ρ · g · h2 Escuela de Ingeniería Eléctrica (5.217) Universidad de Costa Rica 229 Siendo esta la última ecuación física del sistema. El conjunto completo de ecuaciones se copia de nuevo por comodidad: qe − q1 = 3k · h21 ḣ1 = k 0 h21 ḣ1 q q q1 = k1 ρ · g · h1 + Patm − Patm = k1 ρ · g · h1 q1 − qo − qs = A2 · ḣ2 q qo = A 2g · (h2 − h3 ) q q qs = k2 ρ · g · h2 + Patm − Patm = k2 ρ · g · h2 Como dos de las variables del sistema se encuentran derivadas pueden ser utilizadas como estados. Debe notarse que la altura h3 es constante, de hecho es un parámetro, por lo que no debe ser tomada como variable de estado. De esta forma, una posible asignación para el vector de estados es: " x(t) = h1 h2 h por lo que se debe encontrar ẋ(t)T = ḣ1 ḣ2 siendo u(t) definido en este caso como: # i como una función de x(t) y u(t), u(t) = qe debido a que en (5.213) hasta (5.217) no aparece la presión atmosférica, y por lo tanto, no es necesario tomarla en cuenta para el modelo en variables de estado. Puesto que q1 ,qo y qs no fueron seleccionadas como variables de estado, deben ser eliminadas del conjunto de ecuaciones. Sustituyendo (5.214) en (5.213) resulta: q qe − k1 ρ · g · h1 = k 0 · h21 · ḣ1 ḣ1 = − q k1 1 · · qe ρ · g · h + 1 2 k 0 · h1 k 0 · h21 (5.218) e introduciendo (5.214), (5.216) y (5.217)en (5.215) se tiene: q q q k1 ρ · g · h1 − A 2g · (h2 − h3 ) − k2 ρ · g · h2 = A2 · ḣ2 ⇒ ḣ2 = k1 q A q k2 q · ρ · g · h1 − · 2g · (h2 − h3 ) − · ρ · g · h2 A2 A2 A2 Escuela de Ingeniería Eléctrica (5.219) Universidad de Costa Rica 230 Crema térmica Figura 5.45: Sistema de enfriamiento de un procesador Finalmente, al haber definido el vector de salidas como yT = (5.216) y (5.217): q qo = A 2g · (h2 − h3 ) h qo qs i se tiene de (5.220) q qs = k2 ρ · g · h2 (5.221) Por lo que el modelo en variables de estado no lineal del sistema se determina a partir de (5.218) hasta (5.221) como: ḣ1 = − q k1 1 ρ · g · h1 + 0 2 · qe · 2 0 k · h1 k · h1 A q k2 q k1 q ḣ2 = · ρ · g · h1 − · 2g · (h2 − h3 ) − · ρ · g · h2 A2 A2 A2 q qo = A 2g · (h2 − h3 ) q qs = k2 ρ · g · h2 Siendo este el modelo en variables de estado no lineal del sistema. Ejercicio 5.11 En la Figura 5.45 se muestra un sistema de enfriamiento para un procesador de computadora. El procesador se coloca sobre la tarjeta madre, existiendo entre ambos una resistencia térmica dada por Rpm . Para facilitar el enfriamiento del procesador, se coloca una crema térmica, siendo la resistencia térmica entre el procesador y la crema Rpc . Finalmente, se coloca un disipador de calor, siendo la resistencia térmica entre él y la crema térmica Rcd . Debido al procesamiento de datos, se genera un flujo de calor ω en el procesador. Si la resistencia térmica entre el procesador y el ambiente (cuya temperatura es T0 ) es Rp0 , calcule el modelo en variables de estado del sistema si T0 , ω y Tm (la temperatura de la tarjeta madre) son las entradas y la salida es la temperatura del procesador Tp . Solución: En la Figura 5.46 se muestran los flujos de calor que entran y salen del procesador (exagerando el tamaño de los componentes). Escuela de Ingeniería Eléctrica Universidad de Costa Rica 231 Figura 5.46: : Flujos de calor en el procesador Para el procesador: Cp · Ṫp = ω − ωpm − ωpc − ωp0 Cp · Ṫp = ω − Tp − Tm Tp − Tc Tp − T0 − − Rpm Rpc Rp0 (5.222) Donde Cp es la capacitancia térmica del procesador, Tc es la temperatura de la crema térmica y T0 es la temperatura ambiente13 . Para la crema térmica: Cc · Ṫc = ωpc − ωcd Cc · Ṫc = Tp − Tc Tc − Td − Rpc Rcd Sin embargo, como la masa de la crema es despreciable, y la capacitancia térmica está dada por: C t = cp · M Se tiene que Cc tiende a cero, por lo tanto: 0= Tp − Tc Tc − Td − Rpc Rcd (5.223) Para el disipador de calor: Cd · Ṫd = ωcd − ωd0 Tc − Td Td − T0 − (5.224) Cd · Ṫd = Rcd Rd0 Por comodidad, se copian de nuevo las ecuaciones (5.222), (5.223) y (5.224): Cp · Ṫp = ω − Tp − Tm Tp − Tc Tp − T0 − − Rpm Rpc Rp0 13 En realidad, el flujo de calor del procesador al ambiente es casi nulo, ya que el área de contacto entre ambos es despreciable (el procesador es muy delgado, y por lo general, se encierra en una cámara aislada del ambiente). Aquí se incluye este flujo meramente para efectos didácticos. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 232 0= Tp − Tc Tc − Td − Rpc Rcd Cd · Ṫd = Tc − Td Td − T0 − Rcd Rd0 Como Tp (temperatura del procesador) y Td (temperatura del disipador de calor) son variables que se encuentran derivadas, se pueden utilizar como estados. Tomando en cuenta que T0 , ω y Tm son las entradas, la única variable que se debe eliminar es la temperatura de la crema térmica Tc . De la ecuación (5.223) se tiene: Tc = Tc = Tp Td + Rpc Rcd ! 1 1 · + Rcd Rpc !−1 Rpc Rcd · Td + · Tp Rpc + Rcd Rpc + Rcd (5.225) Sustituyendo (5.225) en (5.222) se obtiene: Cp · Ṫp = ω − Tp − Tm Tp − Tc Tp − T0 − − Rpm Rpc Rp0 1 1 1 =ω− + + Rpm Rpc Rp0 ! · Tp + 1 1 1 · Tm + · Tc + · T0 Rpm Rpc Rp0 1 1 1 1 1 = ω− + + Tp + Tm + Rpm Rpc Rp0 Rpm Rpc ! Rpc Rcd 1 Td + Tp + T0 Rpc + Rcd Rpc + Rcd Rp0 ! 2 1 1 1 1 1 1 + + − · Tp + · Tm + · Td + · T0 ⇒ = ω− Rpm Rpc Rp0 Rpc + Rcd Rpm Rpc + Rcd Rp0 ! Ṫp = − A 1 1 1 1 · Td + · Tp + ·ω+ · Tm + · T0 (5.226) Cp Cp · (Rpc + Rcd ) Cp Cp · Rpm Cp · Rp0 Con: A= 1 1 1 + + Rpm Rpc Rp0 ! y sustituyendo (5.225) en (5.224) se obtiene, después de simplificar: 1 1 2 1 Ṫd = · Tp − + − Cd · (Rpc + Rcd ) Rd0 Rcd Rpc + Rcd Escuela de Ingeniería Eléctrica ! · Td 1 + · T0 (5.227) Cd Cd · Rd0 Universidad de Costa Rica 233 con: x(t) = u(t) = h h x 1 x2 u1 u2 u3 iT iT = h Tp Td iT = h ω Tm T0 iT y(t) = Tp y de (5.226) y (5.227) se obtiene el modelo en variables de estado del sistema como: ẋ(t) = − C1p · 1 Rpm + 1 Rpc + 1 Cd ·(Rpc +Rcd ) + " 1 Cp 0 1 Rp0 − C1d 1 Cp ·Rpm 0 y(t) = 1 h Cp ·(Rpc +Rcd ) 1 2 1 + − Rd0 Rcd Rpc +Rcd 1 Cp ·Rp0 1 Cd ·Rd0 1 0 i " · # " · x1 x2 # u1 · u2 u3 x1 x2 # Un aspecto interesante de este ejercicio es que de (5.222): Cp · Ṫp = ω − Tp − Tm Tp − Tc Tp − T0 − − Rpm Rpc Rp0 se deduce que si el flujo de calor entre el procesador y los otros cuerpos de contacto es despreciable (y por consiguiente todas las resistencias térmicas tienden a infinito), se tiene: Cp · Ṫp = ω (5.228) Si el flujo de calor producido por el procesamiento es constante, se puede integrar a ambos lados de (5.228) para obtener: Cp |Tp (t) − Tp0 | = ω · t ⇒ Tp (t) = 1 1 ·ω·t+ · Tp0 Cp Cp Por lo que la temperatura del procesador crecería linealmente con el tiempo. En la práctica, la resistencia térmica entre el procesador y la tarjeta madre es bastante grande, al igual que la resistencia térmica entre el procesador y el ambiente, es por esta razón que se utilizan cremas térmicas y disipadores de calor (también se incluyen ventiladores, pero por simplicidad no se incluyeron en el ejercicio). Escuela de Ingeniería Eléctrica Universidad de Costa Rica 234 Ejercicio 5.12 En la Figura 5.47 se muestra un horno automático. Cuando un cuerpo se coloca en él, la distancia d se ve modificada, posteriormente, esa distancia se convierte en una variable eléctrica mediante el transductor de ganancia a. Con esa variable eléctrica, se alimenta la resistencia que genera el flujo de calor de acuerdo a la posición d. El flujo de calor es tal que: ω(t) = a · d(t) Se tiene además que la conductividad térmica de las cinco paredes del horno es σ1 y la de la puerta del horno (la cual no se muestra) es σ2 , el grosor de las paredes del horno es el mismo que el de la puerta y se representa por l, cada cara del horno tiene un área A (o sea, el horno es un cubo). Si la temperatura T1 en el interior del horno es homogénea y la temperatura del ambiente se define como T0 , encuentre el modelo en variables de estado de este sistema si la salida es la temperatura en el interior del horno. Suponga despreciable la masa de todos los cuerpos excepto el de la masa M . Figura 5.47: Horno automático Solución: Este sistema se ve formado por dos tipos de sub-sistemas fundamentalmente, el sistema mecánico y el sistema térmico, el sistema eléctrico no juega un papel importante debido a que éste está formado por una resistencia y su comportamiento es instantáneo. Primeramente se determinarán las ecuaciones del sistema mecánico: X Fy = M · d¨ = M · g − K · d − B · d˙ (5.229) +↓ Siendo solo esta ecuación la que interviene en el sistema mecánico. Para el sistema Escuela de Ingeniería Eléctrica Universidad de Costa Rica 235 térmico se tiene que: ω − ω1 − ω2 = M · Ṫ (5.230) donde ω1 es el flujo de calor que pasa por las paredes del horno, el cual se puede escribir como: T1 − T0 (5.231) ω1 = R1 siendo R1 la resistencia térmica entre el ambiente y las paredes del horno, la cual es: l R1 = (5.232) 5σ1 · A debido a que hay cinco paredes en el horno. Sustituyendo (5.232) en (5.231) se tiene: ω1 = 5A · σ1 5A · σ1 · T1 − · T0 l l (5.233) Por otro lado, ω2 es el flujo de calor que pasa por la puerta del horno, o sea: T1 − T0 R2 (5.234) l σ2 · A (5.235) A · σ2 A · σ2 · T1 − · T0 l l (5.236) ω2 = pero con: R2 = se tiene, sustituyendo (5.235) en (5.234): ω2 = Así, sustituyendo (5.233) y (5.236) en (5.230) se obtiene: ω− 5A · σ1 5A · σ1 A · σ2 A · σ2 · T1 + · T0 − · T1 + · T0 = M · Ṫ1 ⇒ l l l l 5A · σ1 A · σ2 5A · σ1 A · σ2 ω− + · T1 + + · T0 = M · Ṫ l l l l Por comodidad, se vuelve a copiar la relación entre d(t) y ω(t) : ω =a·d (5.237) (5.238) Sustituyendo (5.238) en (5.237) se tiene: 5A · σ1 A · σ2 5A · σ1 A · σ2 · T1 + · T0 = M · Ṫ a·d− + + l l l l Escuela de Ingeniería Eléctrica (5.239) Universidad de Costa Rica 236 Las dos ecuaciones que definen el comportamiento del dinámico del sistema son: M · d¨ = M · g − K · d − B · d˙ (5.240) 5A · σ1 A · σ2 5A · σ1 A · σ2 + + · T1 + · T0 = M · Ṫ (5.241) l l l l ¨ por lo que d˙ puede ser estado, además, en (5.239) la En (5.229) se observa a d, temperatura está derivada, por lo puede ser tomada también como variable de estado. Ambas ecuaciones contiene el término d, pero éste no se puede eliminar por que se mezclarían los estados derivados que se definieron hasta el momento, por lo que d debe definirse como un estado también. Por otro lado, si se define la temperatura ambiente y la constante gravitacional como entradas, y del enunciado se dice que la salida es la temperatura T1 se tiene: a·d− x(t)T = h x1 x2 x3 u(t)T = h iT = h d d˙ T1 iT iT T0 g y(t) = T1 = x3 Por lo tanto, el modelo en variables de estado sería: 0 K ẋ(t) = − M a M 1 B −M 0 0 0 · x(t) + − MA·l (5σ1 + σ2 ) y(t) = h 0 0 1 i 0 0 0 1 · u(t) A (5σ + σ ) 0 1 2 M ·l · x(t) Vale la pena simular este sistema, para ello se utilizará de nuevo el bloque StateSpace. Este bloque se debe configurar como se muestra en la Figura 5.48. Un punto importante es que se le está dando un valor inicial a la temperatura interna del horno de 23◦ C, esto debido a que se supone que el horno no se había usado y por tanto su temperatura es igual a la temperatura ambiente. Además, se debe crear el diagrama en Simulink mostrado en la Figura 5.49 y se debe llamar “horno”. Si se desea configurar el Scope para que guarde los datos directamente en el workspace de MATLAB® , se debe dar doble clic en él, de esta forma se abrirá la ventana de gráfico y se podrá configurar como se muestra en la Figura 5.50. En esta configuración se realizó lo siguiente: 1. Se abrió la paleta de configuración. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 237 Figura 5.48: Configuración del bloque State-Space Figura 5.49: Diagrama del MVE del horno 2. Se modificó el límite de puntos a graficar a más de 5000 (selección por defecto). 3. Se guardaron los datos al área de trabajo con el nombre «Datos». 4. Los datos se guardaron como una estructura de datos con valores de tiempo. La siguiente lista de comandos en MatLab® pueden ser utilizados en un archivo .m para correr el programa de Simulink siempre y cuando se hayan seguido los pasos anteriormente descritos: clear all M=3; %Masa del cuerpo en kg K=0.5; %Constante de elasticidad B=2.5; %Coeficiente de amortiguación viscosa a=10; %Constante de proporcionalidad A=0.09; %Área de las caras del horno l=0.01; %Espesor de las paredes s1=0.1; %Conductividad térmica de las paredes del horno s2=0.5; %Conductividad térmica de la puerta del horno Escuela de Ingeniería Eléctrica Universidad de Costa Rica 238 Figura 5.50: Configuración de Scope de Simulink Figura 5.51: Respuesta dinámica del modelo en variables de estado A1=[0 1 0;-K/M -B/M 0;a/M 0 -A/(M*l)*(5*s1+s2)]; B=[0 0;1 0;0 (A/(M*l)*(5*s1+s2))]; C=[0 0 1]; D=[0 0]; %Matriz %Matriz %Matriz %Matriz A B C D del del del del MVE MVE MVE MVE sim(’horno’); %Simula el archivo de Simulink llamado horno plot(dato.time,dato.signals.values); grid xlabel(’Tiempo [s]’); ylabel(’Temperatura [ºC]’); title(’Temperatura interna del horno’) Al correr este programa, se genera un gráfico como el mostrado en la Figura 5.51, el cual muestra que la temperatura del horno se estabiliza casi a los 150ºC para una masa de 3kg. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 6. Identificación de sistemas en el dominio del tiempo En el capítulo 4 se estudió el comportamiento dinámico de los sistemas de primer orden más tiempo muerto (POMTM) y segundo orden más tiempo muerto (SOMTM), ante entradas tipo escalón. Además, en la sección 4.6 se demostró que un sistema de orden superior a dos podía ser aproximado por un modelo de primer o segundo orden más tiempo muerto. En el análisis y control de sistemas, es muy común encontrarse con procesos que se comporten en forma semejante a este tipo de modelos. Por todo esto, surge la pregunta: ¿Es posible encontrar modelos de POMTM y SOMTM que se aproximen al comportamiento real de sistemas más complejos? En este capítulo se mostrará que sí, para ello, se tomará como punto de partida la respuesta del sistema ante un cambio escalón en la entrada o entradas del sistema que se está analizando. 6.1. Descripción del problema Si bien es cierto en el capítulo 5 se estudió el modelado analítico de sistemas, en algunas ocasiones no es posible, o es poco práctico, determinar un modelo analítico del sistema bajo estudio. Por ejemplo, considérense los sistemas mostrados en la Figura 6.1. Todos estos sistemas se encuentran en el Laboratorio de Automática de la Escuela y se utilizan en cursos posteriores a este. El sistema de la Figura 6.1a está conformado principalmente por motores DC, los cuales ya se estudiaron en la sección 5.5.1, pero, ¿Sería buena idea desarmar el robot para buscar los datos de placa de cada motor? La respuesta es no (por lo menos si el brazo se quiere volver a usar). Por otro lado, en la Figura 6.1b se muestra un proceso de control de caudal de aire. Se sabe qué hace el sistema, pero, a menos que se desarme, no se conocerá nada de su interior, haciendo casi imposible determinar un modelo analítico de este. Por último, el sistema de la Figura 6.1c es un sistema hidráulico, el cual está conformado por todos los elementos vistos en clase. Pero sus conexiones son tan complejas que un modelo analítico sería muy difícil (pero no imposible) de determinar. 239 240 Las características de estos sistemas hacen que sea mejor pensar en realizar pruebas sobre las entradas y salidas para determinar sus modelos, justificando así las técnicas que se presentarán más adelante en este capítulo. Es muy importante que el lector no considere que el modelado analítico es poco útil. En este curso simplemente se da un conjunto de herramientas para analizar y modelar los sistemas. Depende del ingeniero o ingeniera determinar cuál es adecuada para resolver un problema en específico. Por ejemplo, en el proceso de diseño de los sistemas de la Figura 6.1, probablemente se utilizó el modelado analítico para diseñar los componentes que conforman cada sistema. 6.2. Algunas definiciones preliminares Antes de comenzar con las técnicas para identificar sistemas en el dominio del tiempo, es necesario recalcar algunas definiciones ya vistas o presentar nuevas: Modelo de un sistema: como se mencionó en la sección 1.3, un modelo es: Una representación de los aspectos esenciales de un sistema (Loría y Mazón, 1989). Particularmente estos aspectos serán el comportamiento en el tiempo de la respuesta de los sistemas ante una entrada. Curva de reacción: Se definirá la curva de reacción como la respuesta de un sistema ante una entrada determinada (Loría y Mazón, 1989). Por lo general, la entrada que se utiliza es del tipo escalón. Esto se debe a que es la entrada realizable que provoca un mayor impacto sobre el sistema, permitiendo así observar mejor sus características. Para ilustrar esta idea, obsérvese la Figura 6.2, la cual muestra la respuesta en el tiempo de dos sistemas (uno de POMTM y otro de SOMTM) ante distintos tipos de entradas (rampa, senoidal y escalón). Nótese que en las figuras 6.2a y 6.2b no se puede apreciar fácilmente cuál respuesta es la del sistema de POMTM y cuál es del sistema de SOMTM, no obstante, en la Figura 6.2c, donde se aplicó una entrada del tipo escalón, se aprecia fácilmente que la salida del sistema de primer orden corresponde a la señal de color verde con tan solo ver la forma en que esta evoluciona (véase la Figura 6.2d). Sistemas autorregulados: Un sistema autorregulado es un sistema cuya salida se mantiene acotada cuando se aplica una entrada del tipo escalón. En Escuela de Ingeniería Eléctrica Universidad de Costa Rica 241 (b) Sistema de caudal (a) Brazo robótico (c) Sistema hidráulico Figura 6.1: Algunos ejemplos de sistemas. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 20 Salida de los sistemas Salida de los sistemas 242 15 10 5 0 0 5 10 Tiempo (s) 15 20 1 0.5 0 −0.5 0 1 0.5 0 0 5 10 Tiempo (s) (c) Entrada escalón 10 Tiempo (s) 15 20 (b) Entrada senoidal 15 Salida de los sistemas Salida de los sistemas (a) Entrada rampa 5 1 0.5 0 0 5 10 Tiempo (s) 15 (d) Entrada escalón Figura 6.2: Respuesta de dos sistemas a diferentes entradas. cierta forma, esta definición es análoga a la de los sistemas estables según el criterio BIBO explicado con anterioridad. Sistemas no autorregulados: Los sistemas no autorregulados son sistemas en los que su salida no se mantiene acotada si se aplica una entrada escalón. Por lo general, estos sistemas son inestables y su salida se satura (llega a un valor máximo o mínimo) por los aspectos constructivos del sistema. 6.3. Modelos utilizados en la identificación En su mayoría, los sistemas que se pueden encontrar en la vida diaria se pueden modelar aceptablemente por unos cuantos modelos (Aström y Hägglund, 2009). A continuación, se presentan dichos modelos, clasificándolos en el tipo de sistemas que modelan: autorregulados o no autorregulados. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 243 6.3.1. Modelos para sistemas no autorregulados Como se mencionó anteriormente, los sistemas no autorregulados tienen la característica de que su salida se vuelve inestable ante una entrada escalón. Por tanto, para modelar dicho comportamiento, se utilizan modelos con polos en el origen, comúnmente llamados polos integradores. Modelos integradores de primer orden El modelo integrador de primer orden tiene una función de transferencia dada por: P (s) = Ke−Ls , s (6.1) donde: K es la ganancia del modelo (no se debe confundir con la ganancia estática del modelo, pues este modelo no llega a estado estable). L es el tiempo muerto del modelo. En la Figura 6.3 se muestra la curva de reacción1 de un modelo integrante de primer orden dado por: 0,25e−1,25s . (6.2) P (s) = s Obsérvese que después de que pasa el tiempo muerto del modelo, la respuesta de este crece linealmente con una pendiente que depende del factor K y la amplitud del escalón de entrada. Modelos integradores de segundo orden Si se necesita un aumento más “suave” de la respuesta del modelo, pero que al mismo tiempo se mantenga la característica no autorregulada del sistema, se puede agregar un polo en el denominador del modelo integrador de primer orden. Con esto, se define el modelo integrador de segundo orden como: P (s) = Ke−Ls , s(T s + 1) (6.3) donde: 1 A partir de aquí, se supondrá que se utiliza una entrada tipo escalón cuando se obtiene la curva de reacción de un sistema o modelo. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 244 2.5 Entrada Salida Señales 2 1.5 1 0.5 0 0 2 4 6 8 10 Tiempo (s) Figura 6.3: Curva de reacción de un modelo integrador de primer orden. K es la ganancia del modelo. L es el tiempo muerto del modelo. T es la constante de tiempo del modelo. De esta forma, la respuesta de un modelo integrante de segundo orden ante una entrada escalón unitario es como la mostrada en la Figura 6.4, la cual corresponde al modelo dado por: P (s) = 0,2e−0,5s , s(s + 1) (6.4) y se observa que el incremento en la salida del modelo no es tan abrupta como la del modelo integrador de primer orden. 6.3.2. Modelos para sistemas autorregulados Debido a que la salida de los sistemas autorregulados llega a un valor constante al aplicarse un escalón, estos sistemas se deben modelar por modelos con funciones de transferencia estables, siendo los modelos más comunes los de POMTM y SOMTM. Modelos de primer orden más tiempo muerto (POMTM) El modelo de POMTM posee una función de transferencia dada por: Ke−Ls P (s) = , Ts + 1 Escuela de Ingeniería Eléctrica (6.5) Universidad de Costa Rica 245 1.8 Entrada Salida 1.6 1.4 Señales 1.2 1 0.8 0.6 0.4 0.2 0 0 2 4 6 8 10 Tiempo (s) Figura 6.4: Curva de reacción de un modelo integrador de segundo orden. Efecto de la constante de tiempo Efecto de la ganancia K=0.50 K=0.75 K=1.00 K=1.25 K=1.50 1 0.5 1 T=0.50 T=0.75 T=1.00 T=1.25 T=1.50 0.8 Señales Señales 1.5 0.6 0.4 0.2 0 0 2 4 6 Tiempo (s) 8 10 0 0 2 4 6 Tiempo (s) 8 10 Figura 6.5: Curvas de reacción de un modelo de POMTM. donde T es la constante de tiempo del sistema2 y define la velocidad de respuesta del modelo. La curva de reacción del modelo de POMTM, para varios valores de K y T , se muestra en la Figura 6.5. Para todos los casos se supuso que las condiciones iniciales del modelo son cero y que el escalón (señal amarilla) es unitario. 2 Esta sección está íntimamente ligada al capítulo 4, por lo que se recomienda al lector repasar los temas ahí tratados. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 246 Efecto de la razón de constantes de tiempo a 1 a=0.2 a=0.4 a=0.6 a=0.8 a=1.0 Señales 0.8 0.6 0.4 0.2 0 0 1 2 3 4 5 Tiempo (s) 6 7 8 9 10 Figura 6.6: Efecto de la razón de constantes de tiempo. Modelos de segundo orden más tiempo muerto sobreamortiguados (SOMTM) Como puede observarse en la Figura 6.5, la respuesta de un modelo de POMTM es inmediata después de pasar el tiempo muerto, lo cual hace que ciertos sistemas de orden alto no se representen bien por este modelo. Por esto, es común utilizar modelos de SOMTM para aumentar la precisión en la aproximación del sistema, aunque por supuesto, esto aumenta la complejidad del modelo (como máximo, se acostumbran usar modelos de segundo orden). Si el sistema no posee oscilaciones, un modelo sobreamortiguado del tipo: P (s) = Ke−Ls , (T1 s + 1)(T2 s + 1) (6.6) es en general suficiente para representar adecuadamente a varios sistemas. No obstante, una representación muy utilizada de este modelo es: P (s) = Ke−Ls , (T s + 1)(aT s + 1) (6.7) donde: T = T1 es la constante de tiempo mayor del modelo. a = T2 /T1 es la relación de constantes de tiempo con 0 < a ≤ 1. El efecto del parámetro a sobre la respuesta del modelo, ante un cambio escalón, se muestra en la Figura 6.6. De la figura se concluye que mientras más se aproxime a a 1, el tiempo de asentamiento de la respuesta aumenta. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 247 ξ=0.10 ξ=0.20 ξ=0.40 ξ=0.60 ξ=0.80 Señales 1.5 1 0.5 0 0 10 20 Tiempo (s) 30 40 1.5 Señales 2 Efecto de la frecuencia natural ωn Efecto del coeficiente de amortiguamiento ξ ωn=1.00 ωn=1.41 1 ωn=1.73 ωn=2.00 0.5 0 0 ωn=2.24 5 10 15 20 Tiempo (s) Figura 6.7: Efecto de los parámetros ξ y ωn sobre la respuesta del modelo subamortiguado. Modelos de segundo orden más tiempo muerto subamortiguados (SOMTM) Aunque son pocos los sistemas que tienen características subamortiguadas, el modelo más simple que los representa es el modelo subamortiguado de segundo orden dado por: Kωn2 e−Ls , (6.8) P (s) = 2 s + 2ξωn s + ωn2 donde ξ es el coeficiente de amortiguamiento y ωn es la frecuencia natural de oscilación del modelo. El efecto de estos parámetros, sobre la respuesta del modelo ante un escalón unitario, se muestra en la Figura 6.7. Es importante notar que el sobrepaso del sistema solo depende de ξ. 6.3.3. Comparación de los modelos en su respuesta temporal A modo de resumen, en el cuadro 6.1 se muestran los modelos aquí mencionados, su función de transferencia, el tipo de respuesta y su comportamiento ante un escalón de entrada. En el cuadro ym (t) es la salida del modelo. Es importante aclarar que aquí solo se mencionaron algunos modelos de uso común en la industria, debido a que la cantidad de sistemas existentes es prácticamente infinita, lo que hace imposible tener un modelo para cada uno. 6.4. Métodos de identificación en el tiempo Ahora que se presentaron varios modelos para representar el comportamiento de los sistemas, es posible estudiar los métodos de identificación para determinar los parámetros de dichos modelos. Para ello, lo que se suele realizar, es utilizar la Escuela de Ingeniería Eléctrica Universidad de Costa Rica 248 P (s) Respuesta Integrador primer orden Ke−Ls s No autorregulada Comportamiento temporal ym(t) Modelo Integrador segundo orden Ke−Ls s(T s+1) No autorregulada ym(t) Tiempo Ke−Ls T s+1 POMTM Autorregulada ym(t) Tiempo SOMTM Sobreamortiguado Ke−Ls (T s+1)(aT s+1) Autorregulada ym(t) Tiempo SOMTM Subamortiguado 2 e−Ls Kωn 2 s2 +2ξωn s+ωn Autorregulada ym(t) Tiempo Tiempo Cuadro 6.1: Resumen de los modelos utilizados para representar sistemas. información de la salida de los sistemas ante un cambio escalón en la entrada (dicho cambio no necesariamente es unitario). 6.4.1. Método para obtener un modelo integrante De la función de transferencia de un modelo integrador de primer orden se puede obtener que: Ym (s) = Ke−Ls U (s), s (6.9) con Ym (s) la salida del modelo y U (s) la entrada aplicada, ambas en el dominio de la frecuencia compleja. Si la entrada es un escalón de magnitud ∆U aplicado en un Escuela de Ingeniería Eléctrica Universidad de Costa Rica 249 100 Entrada u(t) Salida y(t) Señales (%) 95 90 85 80 75 70 0 5 10 15 Tiempo (s) 20 25 30 Figura 6.8: Curva de reacción de un sistemas no autorregulado. tiempo t0 , se tiene: Ym (s) = lo cual implica que: Ke−Ls ∆U e−t0 s , s s ym (t) = K∆U (t − L − t0 )u(t − L − t0 ), (6.10) (6.11) donde u(t − L − t0 ) es la función escalón unitario y se utiliza para hacer que el modelo sea causal. Ahora bien, supóngase que se quiere adaptar dicha respuesta del modelo a una respuesta de un sistema como la que se muestra en la Figura 6.8. De la expresión (6.11) se puede obtener que, después de pasar el tiempo muerto, la salida del modelo crece con una pendiente dada por: mm = K∆U, (6.12) mientras que gráficamente se puede obtener que la pendiente de la respuesta del sistema cuando su crecimiento es constante es: ∆y(t) ms = , (6.13) ∆t por lo tanto, igualando las pendientes dadas en 6.12 y 6.13, el parámetro K del modelo se puede obtener como: ms = mm ⇒ ∆y(t) = K∆U ⇒ ∆t ∆y(t) K= . ∆t∆U Escuela de Ingeniería Eléctrica (6.14) (6.15) (6.16) Universidad de Costa Rica 250 Obsérvese que dicho parámetro se puede obtener completamente, ya que toda la información necesaria se encuentra en la curva de reacción del sistema. Hasta el momento, solo se ha encontrado el parámetro K del modelo, por lo que falta el parámetro L para que se tenga el modelo completo. En el ejemplo 6.1 se muestra como determinar dicho parámetro. Ejemplo 6.1 Encuentre un modelo integrante a partir de la curva de reacción del proceso mostrada en la Figura 6.8. Solución: Sobre la Figura 6.8 se han marcado las mediciones necesarias para determinar la ganancia K del modelo, tal y como se muestra en la Figura 6.9. De la figura, y de (6.16) se obtiene que: ∆y(t) ∆t∆U 7,5 ≈ 7,5 · 7,5 ≈ 7,5. K= Sabiendo que el modelo y el sistema poseen la misma pendiente cuando el crecimiento de la respuesta del sistema es constante, se puede trazar la respuesta del modelo paralela a la respuesta del sistema, tal y como se muestra en la Figura 6.10. De esta misma figura se puede estimar el tiempo muerto del modelo, en este caso, casi 6 segundos (debe recordarse que al tratarse de una medición temporal, se inicia la medición de tiempo desde la aplicación del escalón). Así, la función de transferencia del modelo del proceso en cuestión es: Ke−Ls , s 7,5e−6s = . s P (s) = A modo de comparación, en la Figura 6.11 se muestra la respuesta ante un escalón de entrada del sistema y su modelo. Como se observa, existe un error inherente al tipo de modelo que se utilizó para la representación del sistema. No obstante, el modelo sí cumple con representar los aspectos esenciales del sistema. De aquí puede surgir la pregunta de por qué la respuesta del modelo no comienza en cero si se obtuvo una función de transferencia, la cual tiene condiciones iniciales nulas. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 251 100 Señales (%) 95 90 85 80 75 70 0 Entrada u(t) Salida y(t) 5 10 15 Tiempo (s) 20 25 30 Figura 6.9: Cálculo de la ganancia K. Esto se debe a que, al ser todas las mediciones relativas (tanto en la magnitud de las señales como en la mediciones de tiempo), para lograr “calzar” la respuesta del modelo con la respuesta del sistema es necesario agregar las condiciones iniciales del sistema a la respuesta del modelo (la cual sí inicia en cero). Es decir, para graficar la respuesta del modelo fue necesario agregar una entrada inicial de 85 % y una salida inicial de 80 % (véase la Figura 6.11). 6.4.2. Métodos para obtener modelos de primer orden Puesto que el modelo de POMTM es de la forma: P (s) = Ke−Ls , Ts + 1 se necesitan encontrar tres parámetros para definirlo completamente (K, L y T ). La ganancia en estado estacionario se encuentra utilizando el teorema del valor final3 , del cual se deduce que: ∆Y K= , (6.17) ∆U donde ∆Y es el cambio relativo en la salida del sistema (el cual es finito, si se quiere modelar por un modelo POMTM) y ∆U es el cambio total en la entrada del proceso. 3 Se deja como ejercicio para el lector hacer esta demostración. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 252 100 Señales (%) 95 90 85 80 75 70 0 Entrada u(t) Salida y(t) 5 10 15 Tiempo (s) 20 25 30 Figura 6.10: Determinación del tiempo muerto del modelo. Para encontrar los restantes parámetros se verán dos métodos distintos, aunque se insta al lector a buscar más por su cuenta, pues para identificar un modelo de POMTM existen varias técnicas. Método de Ziegler y Nichols El primer método para identificar un modelo de POMTM fue presentado por Ziegler y Nichols (1942), los cuales se pueden considerar los padres del control automático. En su método, se traza una recta tangente en el punto de mayor pendiente de la respuesta del sistema, tal y como se muestra en la Figura 6.12, y dos rectas más cuando la respuesta del sistema está en estado estable. A partir de dichas rectas, es posible definir los parámetros restantes del modelo POMTM. No obstante, el valor de la constante de tiempo del modelo con este método suele causar que la respuesta del modelo y del sistema sean muy diferentes, como se observa en el ejemplo 6.2. Ejemplo 6.2 Determine un modelo de POMTM utilizando el método de Ziegler y Nichols y la curva de reacción mostrada en la Figura 6.12. Solución: Escuela de Ingeniería Eléctrica Universidad de Costa Rica 253 100 Señales (%) 95 90 85 80 Entrada Salida del sistema Salida del modelo 75 70 0 5 10 15 Tiempo (s) 20 25 30 Figura 6.11: Curva de reacción del sistema y su modelo. Como en la Figura 6.12 se puede aproximar que: T ≈ 17,4s, L ≈ 6,54s, lo único que queda por determinar es la ganancia en estado estable K, la cual en este caso es negativa debido a que el cambio en la entrada y la salida tienen distinto signo, a saber: ∆y K= , ∆u yf − yi = , uf − ui 52,5 − 40 , ≈ 42 − 50 ≈ −1,56, donde yf es el valor final de la respuesta del sistema y yi es el valor inicial, análogamente, uf es el valor final de la entrada del sistema y ui es el valor inicial de la entrada. De esta forma, el modelo de POMTM según el método de Ziegler y Nichols es: −1,56e−6,54s P (s) = . (6.18) 17,4s + 1 La curva de reacción del sistema y del modelo obtenido se muestran en la Figura 6.13. Puede observarse a simple vista que el método de Ziegler y Nichols da una mala aproximación del sistema, ¿a qué se debe esto? Escuela de Ingeniería Eléctrica Universidad de Costa Rica 254 55 Señales (%) 50 45 40 Entrada u(t) Salida y(t) 35 0 10 20 30 40 50 60 70 Tiempo (s) Figura 6.12: Determinación de los parámetros del modelo POMTM según Ziegler y Nichols (1942). Se puede notar de la Figura 6.12 que la constante de tiempo es medida de acuerdo a la intersección de dos rectas que no necesariamente se proyectan sobre el 63,2 % de la respuesta final del sistema, al menos en este caso, se proyectan sobre un valor mucho mayor (casi 83 %). Debido a esto, el modelo de POMTM tendrá una respuesta mucho más lenta que la del sistema, pues mientras el sistema va por el 83 % de su respuesta final, el modelo va por el 63,2 % ya que han pasado T + L unidades de tiempo. Para terminar, otro problema inherente del método de Ziegler y Nichols, y de cualquier otro donde haya que calcular la recta tangente de un sistema en algún punto, es que hay que obtener dicha recta. Esto en la práctica es muy difícil de realizar con exactitud, ya que la respuesta de un sistema real está sometida al ruido de medición. Por lo general, cualquier método que se base en obtener una recta tangente en algún punto de la respuesta del sistema generará un modelo poco preciso del sistema. Métodos de dos puntos Para mejorar la precisión de un modelo de POMTM, varios autores han recomendado encontrar los parámetros T y L de forma que la respuesta del modelo y del sistema concuerden en por lo menos dos puntos. Este procedimiento se basa en la respuesta temporal del modelo de POMTM ante un escalón de magnitud ∆u (que por simplicidad Escuela de Ingeniería Eléctrica Universidad de Costa Rica 255 54 52 Señales (%) 50 48 46 44 Entrada u(t) Sistema y(t) Modelo ym(t) 42 40 0 20 40 60 80 100 120 Tiempo (s) Figura 6.13: Curva de reacción de un sistema y su modelo de POMTM según el método de Ziegler y Nichols (1942). se supondrá que se aplicó en t0 = 0). Así, la respuesta del modelo estaría dada por: ( ym (t) = L −1 Ke−Ls ∆u , Ts + 1 s ) = K∆u 1 + e− t−L T (6.19) µ(t − L). (6.20) Ahora bien, en la expresión (6.20) se tienen solo dos incógnitas, T y L, pues todas las demás variables se obtienen gráficamente de la curva de reacción del sistema. Por esto surge la pregunta: si se tuviera otra ecuación, ¿se podrían calcular los parámetros con un sistema de ecuaciones? La respuesta es sí, de hecho, la expresión (6.20) da la cantidad de ecuaciones que se requieran, debido a que se tienen tantas ecuaciones como puntos se hayan medido. Supóngase que se tienen dos instantes t1 y t2 , medidos a partir del instante en que se aplicó el escalón de entrada a los que les corresponde un determinado valor de la señal de salida. Normalmente, este valor se da como un porcentaje con respecto al valor final de la respuesta del sistema. Entonces, en el instante t1 , el valor correspondiente de la salida es yp1 = yi + p1 ∆y, siendo p1 el porcentaje con respecto al valor del cambio final ∆y = yf − yi . Por otro lado, en el instante t2 , el valor que corresponde a la salida del sistema es yp2 = yi + p2 ∆y (p1 y p2 siempre se encuentran entre 0 y 1). En la Figura 6.14, se muestra gráficamente la relación de estos valores. A partir de (6.20), sabiendo que: ∆y = K∆u, la expresión para la señal de salida vendría dada por: ym (t) = ∆y 1 + e− Escuela de Ingeniería Eléctrica t−L T , (6.21) Universidad de Costa Rica salida 256 tiempo (s) Figura 6.14: Curva de reacción para identificar un modelo con dos puntos. esta expresión representa el cambio de la señal de salida del sistema a partir del valor inicial yi . Puesto que ym (t1 ) = p1 ∆y y ym (t2 ) = p2 ∆y, se puede escribir el siguiente sistema de ecuaciones: p1 = 1 − e −(t1 −L) T , p2 = 1 − e −(t2 −L) T . (6.22) La ganancia del sistema se puede encontrar mediante la relación: K= ∆y , ∆u (6.23) mientras que los parámetros T y L se pueden encontrar resolviendo el sistema de ecuaciones (6.22). Entonces los parámetros vendrían dados por: T = a(t2 − t1 ), L = bt1 + (1 − b)t2 , con: a= 1 ln b=1− Escuela de Ingeniería Eléctrica 1−p1 1−p2 ln (6.26) , ln (1 − p1 ) 1−p1 1−p2 (6.24) (6.25) . (6.27) Universidad de Costa Rica 257 Método Alfaro (123c) Ho Smith p1 p2 a b 0,25 0,75 0,910 1,262 0,35 0,85 0,670 1,290 0,28 0,63 1,5 1,5 Cuadro 6.2: Distintos valores para un método de dos puntos. En particular, Ho et al. (1995) recomiendan utilizar los puntos cuando la respuesta del sistema ha alcanzado el 35 % y el 85 % de su cambio total. Los autores, determinaron que los parámetros de un modelo de POMTM se pueden obtener como: T = 0, 670 (t85 % − t35 % ) , L = 1, 290t35 % + (1 − 1, 290)t85 % , (6.28) (6.29) donde: t85 % es el tiempo necesario, medido desde la aplicación del escalón (t0 ), para que la respuesta del sistema llegue al 85 % de su valor final (definido a su vez como y85 % ). t35 % es el tiempo necesario, medido desde la aplicación del escalón (t0 ), para que la respuesta del sistema llegue al 35 % de su valor final (definido a su vez como y35 % ). Otros posibles valores para un método de dos puntos se presentan en el Cuadro 6.2. Como se puede observar, los distintos métodos de dos puntos para obtener un modelo POMTM solo cambian en el valor que se le da a p1 y p2 . Teóricamente, la respuesta al escalón del modelo debería coincidir en los dos puntos elegidos con respecto a la respuesta al escalón del sistema real. Ejemplo 6.3 A partir de la curva de reacción de la Figura 6.15 (la misma que se usó en el ejemplo 6.2), determine un modelo de POMTM utilizando el método de Ho et al. (1995) y compare el modelo obtenido con el modelo de Ziegler y Nichols (1942). Solución: Si se debe utilizar un método de dos puntos como el de Ho et al. (1995), lo primero es encontrar la ganancia del sistema y los puntos y35 % y y85 % . En particular, para Escuela de Ingeniería Eléctrica Universidad de Costa Rica 258 55 Entrada u(t) Sistema y(t) Señales (%) 50 45 40 35 0 10 20 30 40 50 60 Tiempo (s) Figura 6.15: Curva de reacción de un sistema sobreamortiguado. encontrar los puntos y35 % y y85 % sobre una gráfica que no comience en cero, se recomienda definirlos como: y35 % = 0,35 · (yf − yi ) + yi = 0,35 · (52,5 − 40) + 40 ≈ 44,4, y85 % = 0,85 · (yf − yi ) + yi = 0,85 · (52,5 − 40) + 40 ≈ 50,6. De esta forma, los puntos se podrán encontrar en la gráfica y se tomará en cuenta además las medidas relativas que se deben realizar. En la Figura 6.16 se muestran todas las mediciones necesarias para determinar los parámetros del modelo de POMTM como: K= ∆y 52,5 − 40 ≈ ≈ −1,56, ∆u 42 − 50 T = 0,670 · (25 − 12,9) ≈ 8,11, L = 1,290 · 12,9 + (1 − 1,290) · 25 ≈ 9,39. Por lo que la función de transferencia del modelo para el sistema en cuestión es: −1,56e−9,39s P (s) = . 8,11s + 1 (6.30) En la Figura 6.17 se muestra la curva de reacción del modelo determinado con el método de Ho et al. (1995). Debido a la forma en la que se obtiene el modelo, la respuesta del modelo y del sistema deben concordar en los puntos donde la respuesta del sistema es el 35 % y 85 % del valor final. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 259 55 Entrada u(t) Sistema y(t) Señales (%) 50 45 40 35 0 10 20 30 40 50 60 Tiempo (s) Figura 6.16: Curva de reacción de un sistema autorregulado. 55 Señales (%) 50 45 40 35 0 Entrada u(t) Sistema y(t) Modelo ym(t) 10 20 30 40 50 60 70 80 Tiempo (s) Figura 6.17: Curva de reacción del modelo y el sistema. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 260 54 52 SeñalesH(%) 50 48 46 EntradaHu(t) SistemaHy(t) ym1(t)H(Ho) 44 42 40 0 ym2(t)H(Ziegler) 10 20 30 40 TiempoH(s) 50 60 70 80 Figura 6.18: Comparación de los modelos de Ho et al. (1995) y Ziegler y Nichols (1942). A modo de comparación, en la Figura 6.18 se muestra también la respuesta del modelo determinado con el método de Ziegler y Nichols (1942). Puede observarse claramente, que el método de Ho et al. (1995) brinda un mejor modelo que el método de Ziegler y Nichols (1942). 6.4.3. Métodos para obtener modelos de segundo orden Cuando el orden del sistema es alto o se presentan oscilaciones en la curva de reacción del mismo, es posible que un modelo del tipo POMTM no sea suficiente para representar adecuadamente las características dinámicas del sistema. En esas ocasiones, se utilizan modelos de SOMTM dados por: Ke−Ls , (T1 s + 1)(T2 s + 1) Ke−Ls P (s) = , (T s + 1)(aT s + 1) P (s) = (6.31) (6.32) en el caso de que la respuesta del sistema no tenga oscilaciones. No obstante, si el sistema posee oscilaciones, un modelo del tipo: P (s) = Escuela de Ingeniería Eléctrica Kωn2 e−Ls , s2 + 2ξωn s + ωn2 (6.33) Universidad de Costa Rica 261 es más recomendable para representar al sistema. A continuación, se tratan algunos métodos de identificación utilizando modelos de SOMTM, ya sean modelos sobreamortiguados o subamortiguados. Para sistemas sobreamortiguados El modelo dado en (6.31) ó en (6.32) posee tres parámetros que dependen del tiempo; L, T1 y T2 (o en su defecto L, T y a), por lo que si se utilizan métodos basados en los puntos de la curva de reacción del proceso, se necesitarían tres puntos para identificar todos los parámetros del modelo. Sin embargo, Alfaro (2006a) recomienda el uso del modelo de polo doble más tiempo muerto (PDMTM), en el cual T1 = T2 (o a = 1). De esta forma, solo se necesitan dos puntos de la curva de reacción para obtener un modelo de la forma: P (s) = Ke−Ls , (T s + 1)2 (6.34) Particularmente el autor recomienda utilizar los puntos donde la respuesta del proceso ha llegado al 25 % y al 75 % de la respuesta final del sistema ante un escalón de entrada. Así, los parámetros del modelo PDMTM estarían dados por: ∆y , ∆u T = 0,5776(t75 % − t25 % ), L = 1,5552t25 % − 0,5552t75 % , K= (6.35) (6.36) (6.37) donde t25 % es el tiempo necesario para que la respuesta del sistema llegue al 25 % de su valor final, y t75 % es el tiempo necesario para que la respuesta llegue al 75 % de su valor final. Alfaro (2006a) también determinó las ecuaciones para un modelo en general de SOMTM en el que a es distinto de 1. En este caso: ∆y , ∆u −0,6240t25 % + 0,9866t50 % − 0,3626t75 % a= , 0,3533t25 % − 0,7036t50 % + 0,3503t75 % t75 % − t25 % T = , 0,9866 + 0,7036a L = t75 % − (1,3421 + 1,3455a)T, K= (6.38) (6.39) (6.40) (6.41) pero como se puede notar, dichas ecuaciones son mucho más complicadas que las del modelo de PDMTM. Escuela de Ingeniería Eléctrica Universidad de Costa Rica Amplitud 262 0 Tiempo (s) Figura 6.19: Mediciones necesarias para obtener el modelo de un sistema subamortiguado. Métodos para obtener un modelo subamortiguado Para la identificación de sistemas subamortiguados, es necesario tomar en cuenta el sobrepaso y las oscilaciones que presenta la curva de reacción. Para ello se utiliza una función de transferencia de la forma (6.33). Es necesario entonces encontrar tres parámetros: la ganancia K, la frecuencia natural ωn y el factor de amortiguamiento ξ. Para ello, se utilizan las ecuaciones que describen la respuesta de un sistema sobreamortiguado que se presentan en la sección 4.4.1, con algunas consideraciones extras para poder encontrar una aproximación del tiempo muerto del sistema, tal y como lo expone Alfaro (2006b). En la Figura 6.19 se presentan las mediciones que hay que realizar para poder calcular un modelo de segundo orden subamortiguado. La ganancia se calcula como en los demás modelos: K= ∆y . ∆u (6.42) Para obtener el valor del factor de amortiguamiento, se necesita conocer el valor del primer pico yp1 y el valor final de la respuesta yf . Si se define la diferencia entre Escuela de Ingeniería Eléctrica Universidad de Costa Rica 263 estos dos valores como ∆yos , el valor del factor de amortiguamiento vendría dado por: ξ= v u u t (ln(δ))2 , π 2 + (ln(δ))2 (6.43) con: ∆yos . ∆y Si se define el periodo como el tiempo entre dos picos, entonces el tiempo entre el primer pico y el primer valle sería igual a la mitad del periodo, por lo tanto: δ= T = 2 (tm1 − tp1 ) . (6.44) Puesto que el periodo es igual al inverso de la frecuencia natural amortiguada, la frecuencia natural vendría dada por: ωn = 2π √ . T 1 − ξ2 (6.45) Un sistema de segundo orden subamortiguado, llegaría al primer pico en un tiempo igual a la mitad del periodo. Si el sistema que se está identificando tarda más en llegar a este punto, entonces se puede modelar este tiempo extra como un retardo puro, es decir, el retardo vendría dado por: T , (6.46) 2 de esta manera, se pueden obtener todos los parámetros del modelo de segundo orden subamortiguado. L = tp1 − Método de Stark El método de Stark se caracteriza por ser capaz de identificar tanto modelos sobreamortiguados como subamortiguados con la misma prueba. Sólo es necesario medir tres tiempos: se debe medir el tiempo que tarda la curva de reacción en alcanzar el 15 %, 45 % y 75 % del valor final la respuesta, tal y como se indica en la Figura 6.20. Los posibles modelos que se podrían encontrar con este método serían entonces: Kωn2 e−Ls s2 + 2ξωn s + ωn2 Ke−Ls G2 (s) = (T1 s + 1)(T2 s + 1) G1 (s) = Escuela de Ingeniería Eléctrica Universidad de Costa Rica 264 y(t), u(t) ∆y 75 %∆y 45 %∆y 15 %∆y ∆u t Figura 6.20: Datos que se deben tomar con el método de Stark. Igual que en el resto de los casos, la ganancia del sistema se puede encontrar como: K= ∆y ∆u Y de acuerdo con Loría (2008), se deben realizar los siguientes cálculos: Primero se encuentra la variable auxiliar x t45 − t15 , t75 − t15 (6.47) 0,0805 − 5,547(0,475 − x)2 . x − 0,356 (6.48) x= y con este valor, es posible calcular ξ: ξ= Con el valor de ξ, se debe calcular el valor de la función f (ξ): ( f (ξ) = 0,708(2,811)ξ para ξ ≤ 1 . 2,6ξ − 0,6 para ξ > 1 (6.49) Si ξ ≤ 1, entonces implica que el sistema es subamortiguado. En este caso, la frecuencia natural del sistema vendría dada por: ωn = f (ξ) . t75 − t15 (6.50) En caso contrario, se deben calcular las contantes de tiempo T1 y T2 como: Escuela de Ingeniería Eléctrica Universidad de Costa Rica 265 √ ξ2 − 1 ω √ n2 ξ− ξ −1 T2 = ωn T1 = ξ+ (6.51) (6.52) Para ambos casos, el tiempo muerto estaría dado por: L = t45 − con: 6.5. fL (ξ) , ωn fL (ξ) = 0,922(1,66)ξ (6.53) (6.54) Ejercicios resueltos Ejercicio 6.1 En la Figura 6.21, se muestra la respuesta dinámica de la posición angular de un brazo robótico respecto a la tensión de entrada, ambas señales se muestran en porcentajes. Como el control a diseñar se necesita optimizar para cuando el ángulo del brazo está cerca del 70 %, primeramente se llevó al brazo cerca de ese punto, para ello se aplicó una señal de entrada del 20 % por cinco segundos, luego, se esperó a que el movimiento del brazo llegara a un nuevo estado estacionario y se aplicó un nuevo escalón de 10 % de magnitud a los trece segundos. Determine un modelo para este sistema, coloque en una misma gráfica la respuesta del modelo y del sistema ante una misma entrada. Solución: Puesto que la posición angular del brazo se incrementa ante una entrada constante, se concluye que este sistema es integrante, por lo que un modelo adecuado sería: Gm (s) = kp −Ls e . s Por otro lado, como dice el enunciado, solo se desea modelar cerca del 70 % de la salida del sistema, por lo que se puede utilizar un acercamiento de la respuesta dinámica del sistema. Se han tomado las mediciones necesarias, tal y como se muestra en la Figura 6.22 para determinar las constantes del modelo (kp y L). De estas Escuela de Ingeniería Eléctrica Universidad de Costa Rica 266 Figura 6.21: Respuesta dinámica del ángulo de giro de un brazo robótico ante la tensión de entrada. mediciones se obtiene que: ∆y/∆t 10/2 = = 0,5, ∆u 10 L = 1 s, kp = por lo que el modelo sería: 0,5 −s e . s La respuesta temporal del modelo y del sistema ante una misma entrada se muestra en la Figura 6.23. Gm (s) = Ejercicio 6.2 Se sabe que el modelo de una planta integrante es: 5 Gm (s) = , s por lo que si se le aplica un escalón como entrada, la salida del sistema sería una rampa. Se desea llevar a este sistema de una forma suave a su punto de operación (50 %). Determine una entrada para que ante esa entrada esta planta se comporte como una planta de segundo orden del tipo: G0m (s) = Escuela de Ingeniería Eléctrica 50 , (s + 1)2 Universidad de Costa Rica 267 Figura 6.22: Determinación del modelo integrante para el sistema Figura 6.23: Respuesta del sistema y del modelo ante una misma entrada. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 268 cuando se le aplica un escalón unitario. Solución: Se desea determinar una entrada que haga que la salida de la planta integrante Gm sea igual a la salida que se obtendría de aplicar una entrada escalón a la planta G0m (s). Si a la salida de Gm (s) se le llama yint (t) y a la salida de la planta de polo doble con una entrada escalón se le llama yseg (t), entonces lo que se pide es que: yint (t) = yseg (t), ⇒ Yint (s) = Yseg (s). Si se define la entrada buscada como U (s), entonces se tiene que: Yint (s) = Gm (s)U (s), 1 Yseg (s) = G0m (s) , s entonces: 1 Gm (s)U (s) = G0m (s) , s 1 G0m (s) ⇒ U (s) = , s Gm (s) 1 50s = , s 5(s + 1)2 10 . = (s + 1)2 En el dominio del tiempo, la entrada vendría dada por: ( u(t) = L −1 {U (s)} = L −1 10 (s + 1)2 ) = 10te−t . La salida del sistema integrante con esta entrada será como la de un sistema sobreamortiguado con una entrada escalón. En la Figura 6.24 se muestra la respuesta del sistema ante la entrada encontrada. Como se observa, la respuesta corresponde a la de un sistema sobreamortiguado cuando se le aplica un escalón unitario. Algo importante de este ejercicio es que no se puede concluir el tipo de sistema que se tiene observando solo su respuesta, se necesita conocer también la entrada aplicada. Sería un error afirmar que se tiene un sistema de segundo orden observando solo la respuesta del sistema de la Figura 6.24. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 269 50 45 40 Amplitud (%) 35 30 25 20 15 10 Entrada Salida 5 0 0 5 10 15 tiempo (s) Figura 6.24: Respuesta del sistema integrador cuando se la aplica la entrada determinada. Escuela de Ingeniería Eléctrica Universidad de Costa Rica Parte III. Análisis 270 7. Análisis en el dominio de la frecuencia Hasta ahora se han analizado los sistemas desde el punto de vista del espacio de estados y desde el punto de vista del tiempo. En este capítulo se introducirán conceptos y herramientas importantes para el análisis, pero desde el punto de vista de la frecuencia. Muchas de las técnicas de control clásico y de análisis de estabilidad de sistemas a lazo cerrado se basan precisamente en la información que se puede obtener de la respuesta en frecuencia que se introduce en la Sección 7.1. En la Sección 7.2 se presenta el diagrama de Bode y su construcción asintótica. Por último, en la sección 7.3 se estudia la curva polar como una forma complementaria de representar el comportamiento en frecuencia de los sistemas. 7.1. La respuesta en frecuencia En esta sección se introduce el concepto de respuesta en frecuencia y la manera en que se obtiene esta respuesta a partir de la función de transferencia. 7.1.1. Magnitud y fase La respuesta en frecuencia se define como la respuesta de un sistema en estado estacionario, ante una entrada sinusoidal. La frecuencia de la señal de entrada se varía dentro de cierto rango para estudiar el efecto sobre la salida del sistema (Ogata, 2003). Para encontrar esta respuesta, se utiliza la información que proveé la función de transferencia del sistema. Si la entrada del sistema es una señal sinusoidal dada por: u(t) = u0 sen(ωt), (7.1) el sistema se puede modelar mediante la función de transferencia: G(s) = p(s) p(s) = , q(s) (s + s1 )(s + s2 ) · · · (s + sn ) 271 (7.2) 272 por lo que la salida vendría dada por: Y (s) = G(s)U (s) = p(s) U (s). q(s) (7.3) Como en la respuesta en frecuencia solo se considera el estado estacionario, las condiciones iniciales no son importantes, porque se supone que el efecto de ellas ya ha desaparecido del sistema. Puesto que la entrada es una señal sinusoidal, (7.3) se puede escribir en la forma1 : ωu0 , s2 + ω 2 a ā b1 b2 bn = + + + + ··· + , s + jω s − jω s + s1 s + s2 s + sn Y (s) = G(s) (7.4) (7.5) a, b1 , . . . bn son los coeficientes (algunos incluso complejos) que aparecen cuando se calculan las fracciones parciales, ā es el complejo conjugado de a. Si se obtiene la respuesta en el dominio de tiempo de (7.5), se obtiene el siguiente resultado: y(t) = ae−jωt + āejωt + b1 e−s1 t + b2 e−s2 t + . . . + bn e−sn t . (7.6) Si se restringe a que el sistema sea estable, todos los polos −s1 , −s2 , . . . −sn tienen parte real negativa, por lo que la función exponencial asociada tiende a cero conforme el tiempo tiende a infinito (estado estacionario). La respuesta en estado estacionario vendría dada entonces por: yss (t) = ae−jωt + āejωt . (7.7) La constante a se puede calcular mediante el método de residuos como: ωu0 (s + jω) a = G(s) 2 s + ω2 s=−jω u0 G(−jω) =− , 2j ωu0 ā = G(s) 2 (s − jω) s + ω2 s=jω u0 G(jω) = . 2j 1 Se utiliza j como la variable compleja: j = Escuela de Ingeniería Eléctrica √ −1. Universidad de Costa Rica 273 G(jω) se puede escribir en forma polar como: G(jω) = |G(jω)| ejφ , con: ! φ(ω) = ∠G(jω) = tan −1 =(G(jω)) . <(G(jω)) Entonces se obtiene que: u0 |G(jω)| e−jφ , 2j u0 |G(jω)| ejφ ā = , 2j a=− y por lo tanto (7.7) se puede escribir como: ej(ω+φ) − e−j(ω+φ) , 2j yss (t) = u0 |G(jω)| sen (ωt + φ). yss (t) = u0 |G(jω)| (7.8) De (7.8), se concluye que, en estado estacionario, para un sistema estable lineal e invariante en el tiempo, la respuesta de un sistema ante una entrada sinusoidal es una senoide de la misma frecuencia, pero cuya amplitud se ve amplificada por el factor |G(jω)| y con un desfase de φ. Un valor positivo de φ implica que la señal de salida se adelanta en fase, mientras que un valor negativo indica un retardo de fase. Es decir, la cantidad de amplificación y desfase solo depende del sistema, pero esta varía con la frecuencia. Por ello, “la característica de la respuesta en estado estacionario de un sistema para una entrada sinusoidal se obtiene directamente de G(jω)” (Ogata, 2003). Es decir, con la función de transferencia es posible obtener tanto la amplificación como el desfase de una señal senoidal en estado estacionario: Y (jω) , U (jω) ! Y (jω) ∠G(jω) = ∠ . U (jω) |G(jω)| = (7.9) (7.10) En la Figura 7.1 se muestra la respuesta de un sistema de primer orden ante una entrada sinusoidal. La salida del sistema está retardada en comparación con la entrada. La ganancia en estado estacionario del sistema de primer orden es igual a 100, sin Escuela de Ingeniería Eléctrica Universidad de Costa Rica 274 1 0.8 Salida 0.6 amplitud 0.4 0.2 0 −0.2 −0.4 −0.6 −0.8 Entrada −1 tiempo (s) Figura 7.1: Respuesta de un sistema de primer orden ante una entrada sinusoidal. embargo ante una señal de frecuencia 0,5 Hz, su ganancia se ha reducido a cerca de 0,4. Ejemplo 7.1 Obtenga la amplificación y el desfase de la respuesta en estado estacionario ante una entrada u(t) = sen(ωt) para un sistema dado por: G(s) = τ1 s + 1 , τ2 s + 1 Solución: Para obtener la amplificación y el desfase en estado estacionario, primero se debe cambiar la variable s por jω: q 1 + τ12 ω 2 ej tan −1 (τ q 1 + τ12 ω 2 j (tan−1 (τ1 ω)−tan−1 (τ2 ω)) τ1 jω + 1 q q G(jω) = = = e . τ2 jω + 1 1 + τ22 ω 2 ej tan−1 (τ2 ω) 1 + τ22 ω 2 1 ω) Por lo tanto, la amplificación del sistema vendría dada por: |G(jω)| = y el desfase por: q 1 + τ12 ω 2 q 1 + τ22 ω 2 , ∠G(jω) = tan−1 (τ1 ω) − tan−1 (τ2 ω) . Escuela de Ingeniería Eléctrica Universidad de Costa Rica 275 1 0 0.95 −0.05 0.9 −0.1 fase magnitud 0.85 0.8 −0.15 0.75 0.7 −0.2 0.65 0 0.5 1 1.5 2 2.5 frecuencia (rad/s) 3 3.5 4 (a) Magnitud de la respuesta en frecuencia. −0.25 0 0.5 1 1.5 2 2.5 frecuencia (rad/s) 3 3.5 4 (b) Fase de la respuesta en frecuencia. Figura 7.2: Respuesta en frecuencia del sistema del ejemplo 7.2. Cuando se habla de la Respuesta en Frecuencia, normalmente lo que se hace es dibujar la variación de la ganancia y el desfase en función de la frecuencia. Esto es así porque, a partir de (7.8), se puede concluir que la respuesta del sistema ante una entrada sinusoidal está totalmente caracterizada por el módulo y la fase de la función de transferencia, cuando se cambia s por jω. Ejemplo 7.2 Obtenga un diagrama de la magnitud y el desfase del sistema de la Figura 7.1 si τ1 = 5 y τ2 = 8. Solución: En este caso, la función de la magnitud en función de la frecuencia vendría dada por: √ 1 + 25ω 2 , Magnitud = √ 1 + 64ω 2 mientras que la fase se calcularía como: Fase = tan−1 (5ω) − tan−1 (8ω) . En la Figura 7.2a se muestra la magnitud de la función de transferencia mientras que en la Figura 7.2b se presenta la fase. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 276 7.1.2. Efecto del retardo puro Los retardos puros, restan fase a la respuesta sin afectar la ganancia del mismo. Para mostrar esto, supóngase que se tiene un sistema estable dado por la función de transferencia G(s) la cual contiene un retardo L. Esta función de transferencia se puede escribir de la forma: G(s) = G∗ (s)e−Ls , (7.11) donde G∗ corresponde a la función de transferencia sin retardo. Si se desea obtener la respuesta en frecuencia de esta función, se procede a cambiar s por jω y se calcula tanto la magnitud como la fase: G(jω) = G∗ (jω)e−jLω . (7.12) Esta función se puede escribir como: ∗ (ω) G(jω) = |G∗ (jω)| ejφ = |G∗ (jω)| ej(φ e−jLω , ∗ (ω)−Lω) (7.13) . Por lo tanto, la magnitud de un sistema con retardo puro no se ve afectada, mientras que, el efecto en la frecuencia del retardo es disminuir la fase del sistema (aumentar el desfase) por un término Lω. 7.1.3. Ceros de fase no mínima En esta sección se analizará el efecto que un cero de fase no mínima produce sobre la respuesta en frecuencia. La respuesta de un cero de fase mínima se puede escribir de la siguiente manera: Gf m (s) = (τc s + 1), Gf m (jω) = (τc jω + 1), entonces: Gf m (jω) = q 1 + τc2 ω 2 ej tan −1 (τ c ω) . (7.14) Se puede observar que un cero aumenta tanto la ganancia del sistema como su fase (es decir, disminuye el desfase entre la entrada y la salida). Si se examina el efecto de un cero de fase no mínima: Gf nm (s) = (−τc s + 1), Gf nm (jω) = (−τc jω + 1), Escuela de Ingeniería Eléctrica Universidad de Costa Rica 277 que se puede escribir como: Gf nm (jω) = q −1 (−τ = q −1 (τ 1 + τc2 ω 2 ej tan 1 + τc2 ω 2 e−j tan c ω) , c ω) . (7.15) Como se puede observar, desde el punto de vista de la frecuencia, un cero con parte real positiva, produce la misma amplificación, pero aumenta el desfase en lugar de reducirlo. Por eso, a estos ceros se les llama ceros de fase no-mínima, porque en lugar de disminuir el desfase, más bien lo aumenta. Esto produce que el sistema en su totalidad no tenga el menor desfase posible si los ceros solo tuvieran parte real negativa. 7.2. El diagrama de Bode Se le llama Diagrama de Bode a la representación de la respuesta en frecuencia mediante dos gráficos: Un gráfico de magnitud en función de la frecuencia. La magnitud se expresa en decibeles (dB) y la frecuencia en radianes por segundo (rad/s). La gráfica se dibuja con una escala logarítmica en el eje de las frecuencias y una escala lineal en la magnitud. Para obtener la magnitud en decibeles se aplica el siguiente cálculo: |G(jω)|dB = 20 log (|G(jω)|), (7.16) donde log representa el logaritmo de base diez. Un gráfico de la fase en función de la frecuencia. La fase está en grados (◦ ) y la frecuencia en radianes por segundo (rad/s) o en hertz (Hz). En este caso para el eje de la frecuencia también se utiliza una escala logarítmica. La razón por la que se utiliza la magnitud en decibeles es porque los logaritmos convierten los productos en sumas. Esto hace posible que, para calcular el efecto total de todos los polos y ceros del sistema sobre la respuesta en frecuencia, sea posible simplemente sumar todos los efectos de ellos por separado. Para ello, se procede a analizar cada uno de los componentes de una función de transferencia general, a saber: Ganancia (K) Factores integrales y derivativos (jω)±1 Escuela de Ingeniería Eléctrica Universidad de Costa Rica 278 Factores de primer orden (1 + jωτ )±1 Factores de segundo orden 1 + 2ξ j ωωn + ±1 jω 2 ωn Si se tiene una función de la forma: G(jω) = K (1 + jωτ1 ) . (jω) (1 + jωτ2 ) Esta respuesta en frecuencia se podría escribir como: q G(jω) = K 1 + ω 2 τ12 q |ω| 1 + ω 2 τ22 −1 (ωτ )+tan−1 (ωτ ) 2 1 e−π/2−tan , por lo que, para obtener el diagrama de Bode, se deben graficar estas dos curvas: |G(jω)|dB = 20 log (K) + 20 log − 20 log φ(jω) = − q 1+ ω 2 τ22 q 1 + ω 2 τ12 − 20 log (|ω|) , π − tan−1 (ωτ2 ) + tan−1 (ωτ1 ). 2 Como se puede observar, la magnitud y la fase del sistema total viene dado por la suma del aporte de la magnitud y la fase de cada uno de los componentes. Para poder dibujar el diagrama de Bode exacto se debería dibujar |G(jω)|dB y φ(jω) en un papel semilogarítmico, pero como se puede observar, esta relación es algo complicada. Sin embargo, es posible realizar un dibujo aproximado de la respuesta en frecuencia mediante asíntotas. El método para dibujar esta gráfica aproximada se detalla a continuación. 7.2.1. Aproximación asintótica del diagrama de Bode Una función de transferencia se puede factorizar con distintos elementos, a saber: Ganancias (K) Factores de primer orden (1 + jω)±1 Factores de segundo orden 1 + 2ξ Escuela de Ingeniería Eléctrica j ωωn + j ωωn 2 ±1 Universidad de Costa Rica Magnitud (dB) 279 1 Fase (rad) 0.5 0 −0.5 −1 0 10 1 2 10 10 3 10 Frecuencia (rad/s) Figura 7.3: Diagrama de Bode de una ganancia pura. Ganancia La ganancia, tal y como se define para los sistemas autorregulados, se refiere a la amplificación que tiene el sistema en todas las frecuencias. En las funciones de transferencia que están en la forma de constantes de tiempo (es decir, los factores tienen la forma τ s + 1 para los de primer orden y la forma (1 + 2ξ(1/ωn )s + (1/ωn )2 s2 ) para los cuadráticos), la ganancia K es la constante que multiplica toda la función de transferencia. La respuesta en frecuencia de la ganancia es sencilla. El aporte a la magnitud es 20 log(K), mientras que no aporta nada a la fase. El diagrama de Bode de una ganancia pura se muestra en la Figura 7.3. En este caso no se necesita ninguna aproximación por asíntotas. En el caso que la ganancia fuera negativa (es decir, −K, con K positiva), la magnitud sigue siendo 20 log(K), pero la fase ahora es de −180◦ para todas las frecuencias. Elementos integradores y derivativos Los elementos integradores y derivativos corresponden a los factores que tiene un polo o un cero en el origen respectivamente. Es decir a los factores que tiene la forma s±1 . La respuesta en frecuencia de un polo en el origen viene dada por: π 1 1 1 = j π = e−j 2 , jω ω ωe 2 Escuela de Ingeniería Eléctrica (7.17) Universidad de Costa Rica 40 10 30 Magnitud (dB) 20 0 −10 -20 dB/década −20 10 0 −30 −10 −40 −89 −20 91 −89.5 90.5 −90 90 89.5 −90.5 −91 20 dB/década 20 Fase (°) Fase (°) Magnitud (dB) 280 89 −1 10 0 1 10 10 2 −1 10 10 0 1 10 10 Frecuencia (rad/s) Frecuencia (rad/s) Polo en el origen Cero en el origen 2 10 Figura 7.4: Diagrama de Bode de un polo y un cero en el origen. es decir: Magnitud: Fase: 1 20 log ω −π . 2 = −20 log(ω), Cuando se dibuja el Diagrama de Bode de un polo en el origen, la gráfica de magnitud corresponde a una línea recta con una pendiente de −20 dB/década2 . Es importante notar que la magnitud del factor integral siempre tendrá un valor de 0 dB a una frecuencia de ω = 1 rad/s. Es claro que la magnitud de un factor integral tiende a infinito conforme la frecuencia se acerca a cero. Por otro lado, su aporte a la fase es de −90◦ en todas las frecuencias, por lo que corresponde a una línea horizontal. Cuando se analiza el cero en el origen, los resultados simplemente cambian de signo: la magnitud es una línea recta con una pendiente de 20 dB/década con un aporte a la fase de 90◦ . El diagrama de ambos casos se presenta en la Figura 7.4. 2 Una década corresponde al rango de frecuencias que va desde ω hasta 10ω, es decir, un rango de frecuencias en la que la frecuencia final es diez veces mayor que la frecuencia original Escuela de Ingeniería Eléctrica Universidad de Costa Rica 281 Elementos de primer orden Los elementos de primer orden tienen la forma (τ s + 1)±1 . Si se analiza la respuesta en frecuencia del polo, se encuentra que: 1 1 1 −1 =√ =√ e−j tan (τ ω) , −1 (τ ω) 2 2 j tan 2 2 τ jω + 1 1+ω τ e 1+ω τ (7.18) por lo tanto: Magnitud: Fase: 1 20 log √ 1 + ω2τ 2 − tan−1 (τ ω) . ! = −20 log √ 1 + ω2τ 2 , En este caso, las gráficas de magnitud y fase no son líneas rectas, pero se pueden aproximar mediante sus asíntotas para simplificar el dibujo. A la frecuencia 1/τ se le conoce como frecuencia de esquina. En el caso de que ω << 1/τ la magnitud del factor de primer orden es cero, lo que representa una línea horizontal en los 0 dB. Si por el contrario, ω >> 1/τ , la magnitud se puede aproximar como: √ 1 + ω 2 τ 2 ≈ −20 log (ωτ ). (7.19) − 20 log En la frecuencia de esquina estas dos asíntotas se intersecan. En la Figura 7.5, se muestra el diagrama de magnitud exacto y la aproximación por asíntotas de un polo. La línea punteada representa la magnitud exacta y la línea continua la aproximación por asíntotas. A altas frecuencias, el aporte del polo es una línea recta que cae a −20 dB/década, mientras que a bajas frecuencias, la magnitud que aporta es prácticamente cero. En la frecuencia de esquina es donde el error de la aproximación es mayor. Este error es de aproximadamente 3 dB, por lo que la aproximación es bastante buena. En el caso de la fase, se debe aproximar la función tangente inversa mediante asíntotas también. En este caso, la aproximación no es tan buena, pero igual permite tener una idea del comportamiento aproximado de la fase conforme aumenta la frecuencia. Centrando el análisis en la frecuencia de esquina, uno puede aproximar la tangente inversa de la siguiente forma: En la frecuencia de esquina, la fase de un factor de primer orden en el denominador debe ser −45◦ . Hasta una década antes de la frecuencia de esquina, la fase se puede aproximar como una línea horizontal en 0◦ . Escuela de Ingeniería Eléctrica Universidad de Costa Rica Magnitud (dB) 282 -20 dB/década Frecuencia (rad/s) Figura 7.5: Magnitud de un factor de primer orden (polo simple). Desde una década después de la frecuencia de esquina, la fase alcanza su valor máximo de −90◦ . Entre una década antes y una década después de la frecuencia de esquina, la fase se puede aproximar como una línea recta que cae a −45◦ /década. En la Figura 7.6 se presenta la fase de un elemento de primer orden con una línea punteada y su aproximación por asíntotas con una línea continua. En el caso del cero, el análisis es el mismo, pero los resultados varían de signo. Tal y como se muestra en la Figura 7.7, la asíntota de la magnitud tiene una pendiente de 20 dB/década mientras que la fase máxima que se alcanza es de 90◦ , con 45◦ de fase en la frecuencia de esquina. En el caso de los ceros de fase no mínima, la magnitud es igual a la de un cero de fase mínima, pero la fase es igual a la de un polo. La aproximación por asíntotas se presenta en la Figura 7.8. Polos cuadráticos Los factores de segundo orden vienen dados por la forma: ω ω 1 + 2ξ j + j ωn ωn 2 !±1 , (7.20) Considerando nuevamente el caso de los polos, se puede mostrar que la magnitud y Escuela de Ingeniería Eléctrica Universidad de Costa Rica Fase (°) 283 -45°/década Frecuencia (rad/s) Figura 7.6: Fase de un factor de primer orden (polo simple). Magnitud (dB) 50 40 20 dB/década 30 20 10 Fase (°) 0 90 45 45°/década 0 Frecuencia (rad/s) Figura 7.7: Magnitud y fase de un cero simple. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 284 Magnitud (dB) 50 40 30 20 20 dB/década 10 Fase (°) 0 0 -45 °/década -45 -90 Frecuencia (rad/s) Figura 7.8: Magnitud y fase de un cero de fase no-mínima. la fase de un factor cuadrático vienen dados por: Magnitud: Fase: v u u t − 20 log − tan −1 ω ωn 1− − ω ωn 2 !2 + 2ξ √ ! 1 − ξ2 − tan−1 ξ ω ωn 2 ω ωn , + √ ! 1 − ξ2 . ξ Se puede intentar aproximar estas ecuaciones, mediante asíntotas. Si ω << ωn , entonces la magnitud es prácticamente igual a cero. Si ω >> ωn , entonces: v u u t −20 log ω 1− ωn 2 !2 ω + 2ξ ωn 2 ≈ −40 log ω . ωn La magnitud se puede aproximar a una recta con pendiente de −40 dB/década, con frecuencia de esquina igual a ωn . Sin embargo se debe notar que estas aproximaciones no toman en cuenta el efecto del factor de amortiguamiento (ξ). En la Figura 7.9 se muestra la aproximación por asíntotas de un factor cuadrático junto con la curva real para algunos valores de ξ. La línea continua representa la aproximación asintótica mientras que las punteadas representan la curva real. En el caso de la fase, se puede realizar una aproximación similar a la que se hizo para el caso de factores de primer orden. Con la diferencia de que en la frecuencia de Escuela de Ingeniería Eléctrica Universidad de Costa Rica 285 40 Magnitud (dB) 20 0 −20 −40 −60 -40dB/década −80 Frecuencia (rad/s) Figura 7.9: Magnitud de un factor de segundo orden junto con su aproximación asintótica. 0 Fase (°) −45 -90°/década −90 −135 −180 Frecuencia (rad/s) Figura 7.10: Variación de la fase para los factores de segundo orden. esquina, el valor de la fase es igual a −90◦ , y que una década después de la frecuencia de esquina, el valor de la fase es igual a −180◦ . Tampoco se toma en cuenta el efecto de ξ, no obstante, tal y como se observa en las Figuras 7.9 y 7.10, su efecto es importante para valores pequeños de ξ. Cuando el sistema es de segundo orden subamortiguado, puede aparecer un pico en la respuesta de frecuencia si el valor de ξ es pequeño. Este pico se conoce como pico de referencia y su valor se puede calcular a partir de la respuesta en frecuencia del polo cuadrático. El término cuadrático tiene la forma: G(jω) = Escuela de Ingeniería Eléctrica 1 1 + 2ξ j ωωn + j ωωn 2 , Universidad de Costa Rica 286 Diagrama de Bode Magnitud (dB) 0 Frecuencia (rad/s) Figura 7.11: Relación entre el pico de resonancia y la frecuencia de resonancia en un diagrama de Bode. este factor tendrá una magnitud máxima cuando la magnitud de su denominador sea mínimo. La magnitud al cuadrado del denominador viene dada por: ω2 mr (ω) = 1 − 2 ωn !2 ω + 2ξ ωn 2 (7.21) . Si se minimiza mr (ω) también se estará minimizando la magnitud del denominador y por lo tanto maximizando la magnitud del factor cuadrático. Al derivar (7.21) e igualar a cero, se obtiene que la frecuencia ωr a la que ocurre este máximo viene dada por: q ωr = ωn 1 − 2ξ 2 . (7.22) Esta ecuación es válida para 0 ≤ ξ ≤ 0,707. Para valores de ξ mayores a 0,707, no se presenta pico de resonancia. El valor del pico Mr en decibeles vendría dado por sustituir el valor de ωr en (7.21): Mr |dB = 20 log |G(jω)|max = 20 log q 1 mr (ωr ) = 20 log 1 . 2ξ 1 − ξ 2 √ (7.23) En la Figura 7.11 se muestra cómo se deben medir Mr |dB y ωr en un diagrama de Bode. Conforme ξ tiende a cero, el valor del pico tiende a infinito. Con un valor de ξ = 0,707 el valor de Mr es igual a 0 dB, tal y como se muestra en la Figura 7.12. Para el caso de los ceros cuadráticos, la respuesta en frecuencia se puede escribir como: ! ω 2 ω G(jω) = 1 − + j 2ξ . (7.24) ωn ωn Escuela de Ingeniería Eléctrica Universidad de Costa Rica 287 35 30 25 Mr|dB 20 15 10 5 0 0 0.1 0.2 0.3 0.4 ξ 0.5 0.6 0.7 0.8 Figura 7.12: Pico de resonancia en función de ξ. El procedimiento para aproximar asintóticamente esta respuesta en frecuencia es exactamente igual al caso del polo cuadrático. Por lo que, para bajas frecuencias, la aproximación corresponderá a una recta en 0 dB y para altas frecuencias, a una recta con pendiente de 40 dB/dec, tal y como se muestra en la Figura 7.13. El caso de la fase también es semejante con respecto a los polos, con la diferencia que en vez de llegar hasta −180◦ , se llega a 180◦ con una pendiente de 90◦ /dec. En el caso del pico (pero en el caso del cero, el pico se da “hacia abajo”), se realiza el mismo procedimiento: se deriva la expresión (7.24) con respecto a ω y se busca el valor valor que hace que sea igual a cero. El resultado al que se llega es: q ωr = ωn 1 − 2ξ 2 , (7.25) que coincidentemente, es exactamente igual al caso del polo cuadrático. Para el caso de la magnitud del pico, se llega a que: q Mr |dB = 20 log 2ξ 1 − ξ2 . (7.26) Ganancia negativa Si el sistema presenta una ganancia negativa −K, la magnitud es igual a la de una ganancia positiva, pero la fase es constante e igual a −180◦ . Escuela de Ingeniería Eléctrica Universidad de Costa Rica 288 80 Magnitud (dB) 60 40dB/dec 40 20 0 −20 −40 Frecuencia (rad/s) Figura 7.13: Respuesta en frecuencia y aproximación de unos ceros cuadráticos. 7.2.2. Obtención de la FT a partir del diagrama de Bode Es posible obtener la función de transferencia de un sistema a partir de su diagrama de Bode . Para ello, basta con encontrar las frecuencias en las que la magnitud cambia múltiplos de ±20 dB/década para tener una idea de la posición de los polos. Para ello se siguen las recomendaciones de (Ogata, 2003) y (Loría, 2008): Una vez que se tiene la magnitud de la respuesta en frecuencia, se trazan sus asíntotas. Estas asíntotas deben tener pendientes que sean múltiplos de ±20 dB/década. • Si a una frecuencia ω1 hay un cambio de −20 dB/década, entonces debe existir un factor de la forma: 1 . 1 + j ωω1 • Si la pendiente cambia +20 dB/década, quiere decir que se está en la presencia de un cero que tiene la forma: 1+j Escuela de Ingeniería Eléctrica ω . ω1 Universidad de Costa Rica 289 • Si la pendiente cambia −40 dB/década, se trata de un factor cuadrático de la forma: 1 2 . 1 + 2ξ j ωω1 + j ωω1 El valor de ξ, se debe ajustar para que la aproximación que se está haciendo se asemeje lo más posible a la curva real con que se cuenta. La aproximación de la ganancia depende de la presencia de polos en el origen. A frecuencias muy bajas (es decir, cuando ningún otro polo ni cero del sistema tiene efecto sobre la respuesta en frecuencia), los únicos factores que aportan a la respuesta en frecuencia vienen dados por: lı́m G(jω) = ω→0 K , (jω)λ donde λ representa la cantidad de polos en el origen. Lo más común es que los sistemas tengan, a lo sumo, dos polos en el origen • Si λ = 0, entonces el sistema no tiene polos en el origen. Debido a esto, a bajas frecuencias, el diagrama de magnitud de Bode es una línea horizontal en x = 20 log(K) dB, donde x es la medición que se realiza sobre la gráfica de magnitud. Por ello, es posible obtener el valor de K directamente x mediante k = 10 20 . • Si λ ≥ 1, el sistema tiene λ polos en el origen. Esto se nota en el gráfico en el hecho de que, para frecuencias bajas, la pendiente de la curva de magnitud es −20λ dB/década. En este caso, la magnitud a bajas frecuencias viene dada por: magnitud: 20 log(k) − 20 log(ω λ ), es decir, si la frecuencia a la que la extensión de la pendiente a bajas frecuencias corta los 0 dB es igual a ωc , entonces el valor de K viene dado por: K = ωcλ . Con esto, ya se puede tener una primera aproximación de la función de transferencia. Si se cuenta con la información experimental de la fase, entonces es posible comprobar la presencia de elementos de fase no mínima. Si a altas frecuencias, la fase del modelo encontrado es diferente a 90(m − n) donde m es el número de ceros y n es el número de polos, entonces se está ante la presencia de elementos de fase no mínima. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 290 • Si a altas frecuencias, la fase de las mediciones experimentales decrece indefinidamente, entonces se tiene un retardo puro en el sistema. Si la escala fuera lineal, la pendiente de la fase a altas frecuencias vendría dada por −57,3L, donde L es el retardo del sistema. El factor −57,3 se debe a la conversión entre radianes y grados que se debe hacer en el diagrama de fase de Bode. • Si para bajas frecuencias, el modelo difiere de las mediciones por −180◦ , entonces el sistema tiene ganancia negativa. • Si a altas frecuencias la fase de las mediciones difiere a la del modelo en −180z, entonces eso quiere decir que se tienen z ceros de fase no mínima en el sistema. En ese caso, habría que corregir z de los ceros encontrados hasta que el diagrama de fase coincida con el diagrama de fase experimental. 7.3. Diagrama Polar El diagrama polar es otra forma de representar la magnitud y la fase de la respuesta en frecuencia. En este caso se utiliza un sistema de coordenadas polares, en el que la magnitud de la respuesta en frecuencia se grafica en función de la fase. En un sistema de coordenadas polares, la magnitud de la respuesta en frecuencia representa la distancia de la curva al origen y la fase de la respuesta en frecuencia es el ángulo que se mide desde el eje horizontal. En este caso, la frecuencia es una variable implícita, lo que significa que cada punto de la curva polar tiene asociado una frecuencia particular, pero esta no se representa explícitamente en el gráfico. En la Figura 7.14, se muestra un ejemplo de un diagrama polar característico. En este caso se trata de la curva polar de un sistema de segundo orden subamortiguado. Para una frecuencia de cero (ω = 0), la fase del sistema tiene un valor de cero y una magnitud igual a la ganancia. Puesto que la fase es cero, la curva corta el eje horizontal. Hay que notar que el eje horizontal representa la parte real de G(jω) mientras que el eje vertical es la parte imaginaria. Cada uno de los puntos de la curva está asociado a una frecuencia ω, de manera que la magnitud del vector que inicia en el origen y termina en la curva tiene una longitud igual a |G(jω)| y un ángulo de ∠G(jω). Cuando la frecuencia tiende a infinito, la fase tiende a −180◦ con una magnitud de 0. La información que provee el diagrama polar es exactamente la misma que el diagrama de Bode, con la diferencia que en el caso polar, no se necesitan dos gráficos separados, sino que la información de la fase y la magnitud está contenida en un solo gráfico. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 291 1 0.5 0 −0.5 −1 −1.5 −2 −2.5 −1 −0.5 0 0.5 1 1.5 2 2.5 Figura 7.14: Curva polar característica. 7.3.1. Construcción de los diagramas polares Al contrario de los diagramas de Bode, no se cuenta con una técnica para encontrar una aproximación asintótica de los diagramas polares. Lo que se debe hacer entonces es dibujar algunos puntos de la curva y a partir de ellos, encontrar la forma general que tiene. No obstante, a continuación se presenta el diagrama polar de algunas funciones de transferencia comunes, tal y como se presenta en Ogata (2003). Factores integrales y derivativos La forma de un factor integral viene dada por: 1 , jω 1 −π = ej 2 . ω G(jω) = En un diagrama polar, esta respuesta en frecuencia es igual al eje negativo de la parte imaginaria, puesto que el ángulo es constante en −90◦ . Cuando ω → 0, la magnitud tiende a infinito, mientras que si ω → ∞, la magnitud tiende a 0. El diagrama polar de este factor se presenta en la Figura 7.15. Si fuera un cero en el origen, el único cambio en la gráfica es que el ángulo sería de 90◦ en lugar de −90◦ . Escuela de Ingeniería Eléctrica Universidad de Costa Rica 292 3 2 1 0 −1 −2 −3 −1 −0.5 0 0.5 1 Figura 7.15: Diagrama polar de un factor integrativo. 0 0 Figura 7.16: Diagrama polar de un factor de primer orden. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 293 Factores de primer orden En el caso de los polos de primer orden, la forma general es: 1 . 1 + jωτ G(jω) = El diagrama polar es como se muestra en la Figura 7.16. Se puede demostrar que esta curva es la mitad inferior de un círculo centrado en { 12 , 0}. Cuando ω → 0, la magnitud de la gráfica polar tiende a 1 con un ángulo de 0◦ . Si ω → ∞, la magnitud de la curva tiende a 0 con un ángulo de −90◦ . En el caso de esta curva, la parte real viene dada por: 1 , 1 + ω2τ 2 y la parte imaginaria viene dada por: −ωτ . 1 + ω2τ 2 Si se varía el valor de τ , la curva polar tiene exactamente la misma forma para todos los valores de τ . La diferencia está en que, dependiendo del valor de τ , el mismo punto en la gráfica polar va a estar asociado a diferentes valores n ode frecuencia ω. Por 1 −1 ejemplo, la gráfica polar siempre va a pasar por el punto 2 , 2 , pero la frecuencia asociada a este punto va a venir dada por ω = τ1 . El caso de un cero simple es totalmente diferente al caso de un polo simple. La respuesta en frecuencia de un cero simple viene dada por: G(jω) = 1 + jω. De esta expresión, se puede concluir que la parte real de este factor siempre va a ser igual a 1, mientras que la parte imaginaria va a ir desde cero hasta infinito conforme la frecuencia aumente. Esto se representa en el diagrama polar como se muestra en la Figura 7.17. Factores Cuadráticos El factor de segundo orden de la forma: G(jω) = Escuela de Ingeniería Eléctrica 1 1 + 2ξ j ωωn + j ωωn 2 , Universidad de Costa Rica 294 0 0 0.5 1 1.5 2 Figura 7.17: Diagrama polar de un cero de primer orden. a bajas frecuencias tiene una fase de 0◦ y magnitud 1, mientras que para frecuencias altas, la magnitud es prácticamente cero con una fase de −180◦ . Matemáticamente: lı́m G(jω) = 1∠0◦ , ω→0 lı́m G(jω) = 0∠ − 180◦ . ω→∞ Cuando ω = ωn , la fase es 90◦ independientemente del valor de ξ, y la magnitud viene dada por 2ξ1 . En la Figura 7.18, se muestra cómo varía el diagrama polar de un sistema de segundo orden con respecto a su factor de amortiguamiento. Al variar ωn , la forma del diagrama polar no cambia. Lo que sucede es que, para diferentes valores de ωn , el mismo punto en el diagrama polar va a estar asociado con diferentes frecuencias. Por ejemplo, el corte con el eje imaginario siempre se va a dar en el punto o n , pero la frecuencia asociada a este punto es ωn . 0, −1 2ξ Retardo Como ya se estudió en la sección 7.1.2, el efecto de un retardo puro en el sistema se observa solamente en la fase, puesto que la magnitud de este factor es 1 para todas las frecuencias. La fase en cambio decrece indefinidamente conforme la frecuencia aumenta. En diagrama polar, esto se puede representar como un círculo de radio unitario, tal y como se muestra en la Figura 7.19. Si en cambio, se tuviera un sistema que además del retardo puro tuviera un polo simple, su magnitud disminuiría conforme aumenta la frecuencia, pero su fase crecería indefinidamente también. Esto forma Escuela de Ingeniería Eléctrica Universidad de Costa Rica 295 0.4 0.2 0 −0.2 −0.4 −0.6 −0.8 −1 −1.2 −1.4 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 1.2 Figura 7.18: Diagrama polar de un sistema de segundo orden para diferentes valores de ξ. una espiral que empieza en el eje real positivo y tiende hacia el origen conforme la frecuencia tiende a infinito. Un ejemplo de este tipo de curvas se presenta en la Figura 7.20. Casos de los polos en el origen junto con otros polos y ceros En el caso que el sistema tenga polos en el origen además de otros polos y ceros, el sistema tiene magnitud infinita a frecuencias bajas. En el caso de que se tenga un solo polo en el origen, la fase a frecuencias bajas es de −90◦ con una magnitud infinita. Por lo que es asintótico a la línea paralela al eje imaginario negativo dada por: lı́m Re {G(jω)} , ω→0 tal y como se muestra en la Figura 7.21a. A altas frecuencias, normalmente la magnitud del sistema tiende a 0 dB (es decir el origen del sistema de coordenadas). Sin embargo el ángulo con el que llega al origen dependerá del resto de polos y ceros del sistema. Si se tienen dos polos en el origen, el sistema a bajas frecuencias tiene una magnitud infinita, pero su fase es de −180◦ , es decir, es asintótico a una línea recta paralela al eje real negativo dada por: lı́m Im {G(jω)} , ω→0 pero al igual que en el caso de los sistemas con un polo en el origen, el ángulo de llegada al origen depende del resto del sistema. Un ejemplo de este tipo de sistemas se muestra en la Figura 7.21b. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 296 1 0.8 0.6 0.4 0.2 0 −0.2 −0.4 −0.6 −0.8 −1 −1 −0.5 0 0.5 1 Figura 7.19: Diagrama Polar de un retardo puro. 7.3.2. Graficación de diagramas polares Al contrario del caso de los diagramas de Bode, los diagramas polares no se pueden obtener de la suma de los diagramas de cada componente. En este caso, no queda más que calcular una función con respecto a la frecuencia de la magnitud, la fase, la parte real y la parte imaginaria de G(jω). Una vez que se calcularon estas relaciones, se deben buscar algunos puntos para darse una idea de la forma que tiene la curva. Las frecuencias que se van a considerar en el diagrama dependen de la persona que esté dibujándola, pero lo que siempre debe incluir es la tendencia de la curva tanto cuando ω → 0 y cuando ω → ∞. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 297 0.6 0.4 0.2 0 −0.2 −0.4 −0.6 −0.8 −0.5 0 0.5 1 Figura 7.20: Curva polar de un sistema de primer orden más retardo puro. 7.4. Ejercicios resueltos Fundamentos de la respuesta en frecuencia Ejercicio 7.1 Demuestre que si un número complejo se puede escribir como: k Q z= i=1 m Q xi (7.27) yi i=1 donde xi y yi son números complejos, entonces: k Q |z| = i=1 m Q ∠z = i=1 k X |xi | |yi | ∠xi − i=1 m X ∠y1 i=1 Solución: Para todo número complejo zj se tiene que: zj = |zj | · e∠zj Escuela de Ingeniería Eléctrica (7.28) Universidad de Costa Rica 298 0 0 0 0 (a) Un solo polo en el origen. (b) Dos polos en el origen. Figura 7.21: Sistemas con polos en el origen, otros polos y ceros. donde (7.28) corresponde a la forma polar de un número complejo. Pasando xi y yi a su forma polar se obtiene que: k Q z= i=1 m Q xi = yi |x1 | · e∠x1 · |x2 | · e∠x2 · · · · |xk−1 | · e∠xk−1 · |xk | · e∠xk |y1 | · e∠y1 · |y2 | · e∠y2 · · · · |ym−1 | · e∠ym−1 · |ym | · e∠ym i=1 = |x1 | · |x2 | · · · · · |xk−1 | · |xk | · e∠x1 · e∠x2 · e∠xk−1 · e∠xk |y1 | · |y2 | · · · · · |ym−1 | · |ym | · e∠y1 · e∠y2 · e∠ym−1 · e∠ym k Q = i=1 m Q |xi | k P · ei=1 ∠xi − m P ∠yi i=1 |yi | i=1 = |z| · e∠z de donde se deduce que: k Q z = i=1 m Q ∠z = i=1 k X xi yi ∠xi − i=1 m X ∠y1 i=1 Por lo que el enunciado queda demostrado. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 299 Ejercicio 7.2 Dada una función de transferencia: H(s) = 10(s + 1) , (s + 4)(s + 3)(s2 + s + 1) determine la respuesta temporal en estado estacionario ante una entrada: u(t) = U sen(ωt) = 5 sen(πt) Solución: Se sabe que la respuesta temporal de un sistema en periodo estacionario ante una entrada senoidal es: y(t) = Y sen (ωt + ϕ) donde: Y = U |H(iω)| ϕ = ∠H(iω). (7.29) (7.30) Del enunciado se deduce que U = 5 y ω = π. Además: 10(jπ + 1) (jπ + 4)(jπ + 3) [(jπ)2 + jπ + 1] √ 10 π 2 + 1 q = √ √ π 2 + 42 π 2 + 32 π 2 + (π 2 − 1)2 |H(jπ)| = ≈0,156. 10(jπ + 1) (jπ + 4)(jπ + 3) [(jπ)2 + jπ + 1] 0 π π π π = tan−1 + tan−1 − tan−1 + tan−1 + tan−1 10 1 4 3 π2 − 1 ≈ − 173◦ . ∠H(jπ) =∠ Por lo tanto, la respuesta en régimen estacionario sería: y(t) =Y sin(ωt + ϕ), =5 · 0,156 sin(πt − 173◦ ), =0,78 sin(πt − 173◦ ). Escuela de Ingeniería Eléctrica Universidad de Costa Rica 300 Figura 7.22: Respuesta transitoria de la función de transferencia en estudio. Figura 7.23: Respuesta en estado estacionario de la función de transferencia analizada. En la Figura 7.22 se muestra la respuesta transitoria de la función de transferencia analizada, a la derecha se muestra el diagrama de bloques utilizado para su generación (el cual se creó en OrCAD). En la Figura 7.23, se muestra la respuesta en estado estacionario junto con la entrada y la gráfica de la expresión encontrada, como se observa, la salida del sistema en estado estacionario y la señal producida por la ecuación determinada son idénticas. Ejercicio 7.3 Determine la frecuencia de cruce de ganancia y la frecuencia de cruce de fase para la una función de transferencia dada por: G(s) = Escuela de Ingeniería Eléctrica (s2 50(s − 1) + 4s + 6)(s + 1) Universidad de Costa Rica 301 Solución: La frecuencia de cruce de ganancia se define como la frecuencia positiva a la cual |G(jω)| = 1 (en ese caso la magnitud de la salida es igual a la magnitud de la entrada). Para este caso: 50(jω − 1) + 4jω + 6] (jω + 1) |50||jω − 1| = 2 | − ω + 4jω + 6||jω + 1| √ 50 ω 2 + 1 =q √ (4ω)2 + (6 − ω 2 )2 ω 2 + 1 50 =√ . 36 + 4ω 2 + ω 4 |G(jω)| = [(jω)2 Luego, se necesita que: 50 =1⇒ |G(jω)| = √ 36 + 4ω 2 + ω 4 √ 50 = 36 + 4ω 2 + ω 4 ⇒ 2500 =36 + 4ω 2 + ω 4 . Como ω está elevada a potencias pares se puede realizar el cambio de variable ω 2 = x, resultando: 2500 = 36 + 4x + x2 ⇒ x ≈ ( 47,7 −51,7 Como se hizo el cambio de variable ω 2 = x y ω es real, solo la solución positiva de x funciona, resultando: x ≈ 47,7 ⇒ ω ≈ 6,9 rad/s. Finalmente, la frecuencia de cruce de ganancia sería: ωc ≈ 6,9 rad/s. La frecuencia de cruce de fase se define como la frecuencia positiva a la cual ∠G(jω) = −180◦ (en este caso la salida está desfasada −180◦ de la entrada). Para Escuela de Ingeniería Eléctrica Universidad de Costa Rica 302 este caso: 50(jω − 1) + 4jω + 6] (jω + 1) =∠50 + ∠(jω − 1) − ∠(−ω 2 + 4jω + 6) − ∠(jω + 1) 0 4ω −1 ◦ −1 ω −1 −1 ω = tan + 180 − tan − tan − tan 50 1 6 − ω2 1 4ω =180◦ − 2 tan−1 (ω) − tan−1 . 6 − ω2 ∠G(jω) =∠ [(jω)2 Luego se debe cumplir que: ∠G(jω) =180 − 2 tan (ω) − tan ◦ −1 360 =2 tan (ω) + tan ◦ −1 −1 −1 4ω 6 − ω2 = −180◦ ⇒ 4ω . 6 − ω2 Sin embargo, resolviendo numéricamente esta ecuación se comprueba que el valor necesario para que se de la igualdad es: ωπ = ω → ∞ , por lo que se puede decir que no hay frecuencia de cruce de ganancia. Ejercicio 7.4 Dada la función de transferencia: H(s) = 6 √ √ (s + 1)(s + 2)(s + 5) Determine la frecuencia de cruce de fase y la frecuencia de cruce de ganancia. Solución: La ganancia de la función de transferencia evaluada en s = jω es: 6 √ √ =1⇒ |H(jω)| = √ 2 2 ω + 1 ω + 2 ω2 + 5 √ √ √ 6 = ω2 + 1 ω2 + 2 ω2 + 5 ⇒ 36 = ω 2 + 1 ω2 + 2 ω2 + 5 0 =ω 6 + 8ω 4 + 17ω 2 − 26 Haciendo el cambio de variable ω 2 = x resulta: x3 + 8x2 + 17x − 26 = 0 Escuela de Ingeniería Eléctrica Universidad de Costa Rica 303 ω 0,1 ∠H(ω) −12, 3◦ 22,3 2 10 5 3 2,5 2,75 2,65 −258◦ −159◦ −243◦ −218◦ −189◦ −176◦ −183◦ −181◦ Cuadro 7.1: Valores de prueba para la fase del sistema. ecuación que puede ser resuelta por medio de una calculadora común resultando: −4,5 − 2,4j x = −4,5 + 2,4j 1 solo la solución real es válida, y como ω 2 = x se tiene ωc = 1 rad/s. La frecuencia de cruce de ganancia es tal que la fase de la función de transferencia es −180◦ , siendo la fase de la función de transferencia: ∠H(jω) = tan −1 0 ω ω − tan−1 (ω) − tan−1 √ − tan−1 √ 6 2 5 ! ! Esta ecuación es muy difícil de resolver a mano, sin embargo, evaluando la fase del sistema cuando ω → 0 y ω → ∞ se tiene que: ∠H(0) =0 ∠H(∞) = − 270◦ y como la fase es continua, necesariamente la fase pasa por −180◦ para algún valor de ω. En estos casos, lo recomendable es evaluar la fase del sistema para valores cercanos a los polos o ceros de la función de transferencia, y acortar el rango cada vez más hasta llegar al resultado deseado. En este caso, se puede comenzar por una década antes del primer polo (ubicado √ en 1 rad/s) y luego evaluar en una década después del último polo (ubicado en 5 ≈ 2,23 rad/s), posteriormente ir reduciendo cada vez más el intervalo de pruebas hasta obtener una precisión adecuada. En el Cuadro 7.1 se muestran varios valores de prueba utilizados, de donde se deduce que la frecuencia de corte de ganancia es aproximadamente 2,6 rad/s. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 304 Construcción de la gráfica de Bode Ejercicio 7.5 Determine el diagrama de Bode de la función de transferencia dada por: 2000(s + 3) . (s + 40)(s + 100) G(s) = Solución: La función de transferencia dada se puede reacomodar como: G(s) = 2000 · 3 40 · 100 s 40 s 3 +1 +1 s 100 +1 = s 40 1, 5 +1 s 3 +1 s 100 +1 . De donde se observa que tiene: Una ganancia en periodo estacionario de 1,5. Un cero simple en 3 rad/s. Un polo simple en 40 rad/s. Un polo simple en 100 rad/s. Se procederá a construir la tabla de aporte de pendientes para el diagrama de magnitud tomando en cuenta que el aporte de pendiente de cada polo es 0 dB/dec antes de la frecuencia de su polo y −20 dB/dec después de la frecuencia de su polo, además, el cero aporta 0 dB/dec antes de la frecuencia de su cero y 20 dB/dec después de éste. Para que el diagrama quede suficientemente completo se construye a partir de una década antes de su primer polo o cero y hasta una década después de su último polo o cero. Como el primer cero se encuentra en 3 rad/s se construirá la tabla a partir de 0,3 rad/s. Además, el último polo se encuentra en 100 rad/s, por lo que se construirá la tabla hasta 1000 rad/s. A partir de este criterio se puede construir el Cuadro 7.2 que indica el aporte de pendientes al diagrama de magnitud. Para determinar el punto de inicio del diagrama de magnitud se puede tomar el límite de la función de transferencia cuando s → 0 (o sea a frecuencias bajas), en este casi se tiene: 1, 5 3s + 1 = 1,5, lı́m G(s) = lı́m s s s→0 s→0 + 1 + 1 40 100 Escuela de Ingeniería Eléctrica Universidad de Costa Rica 305 Término 0,3 < ω < 3 3 < ω < 40 40 < ω < 100 100 < ω < 1000 0 0 0 20 0 20 0 20 −1 s + 1 40 −1 s + 1 100 0 0 −20 −20 0 0 0 −20 Total 0 20 0 −20 1, 5 +1 s 3 Cuadro 7.2: Aporte de pendientes para el diagrama de magnitud. -20 dB/dec 20 dB/dec 0 dB/dec 0 dB/dec Frecuencia (rad/s) Figura 7.24: Asíntotas del diagrama de magnitud por lo que el diagrama de magnitud comenzaría en 20 log(1,5) ≈ 3,52 dB. A partir de la tabla de pendientes y el punto inicial se puede trazar el diagrama de magnitud como se muestra en la Figura 7.24. Como solo había polos y ceros simples se tiene que el error entre las asíntotas y la gráfica real es de 3 dB en cada intersección de asíntotas. En la Figura 7.25 se muestra el diagrama de magnitud incorporando los errores. Para construir el diagrama de fase se realiza la tabla de aporte de pendientes tomando en cuenta que una década antes de cada polo o cero el aporte de pendiente de 0◦ /dec en ambos casos, después de una década del polo o el cero el aporte es también 0◦ /dec. Entre una década antes y una década después del polo o el cero el aporte es de −45◦ /dec y 45◦ /dec respectivamente. En el Cuadro 7.3 se muestran dichos aportes. Para conocer la fase inicial del diagrama a bajas frecuencias se puede utilizar la fórmula: ∠G(ω)|ω→0 = 90◦ (nc − np) + 180◦ (ncd − npd) + 90◦ (1 − signo(K)), Escuela de Ingeniería Eléctrica Universidad de Costa Rica 306 Frecuencia (rad/s) Figura 7.25: Diagrama de magnitud ejercicio 7.5. Término 10 < ω < 30 30 < ω < 400 400 < ω < 1000 0 45 0 45 0 45 0 0 0 0 −1 s +1 40 −1 s + 1 100 0 −45 −45 −45 0 0 0 −45 −45 −45 Total 45 0 −45 −90 −45 1, 5 +1 0,3 < ω < 4 4 < ω < 10 s 3 Cuadro 7.3: Aporte de pendientes para el diagrama de magnitud. donde: np: Número de polos en el origen. nc: Número de ceros en el origen. ncd: Número de ceros en el semiplano derecho. npd: Número de polos en el semiplano derecho. En este caso resultaría: ∠G(ω)|ω→0 =90◦ (nc − np) + 180◦ (ncd − npd) + 90◦ (1 − signoK), =90◦ (0 − 0) + 180◦ (0 − 0) + 90◦ (1 − 1), =0. Conociendo un punto inicial y las pendientes de la gráfica se pueden trazar las asíntotas como se muestra en la Figura 7.26. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 307 Frecuencia (rad/s) Figura 7.26: Asíntotas del diagrama de fase. Frecuencia (rad/s) Figura 7.27: Curva del diagrama de fase. Como solo hay polos y ceros simples, el error entre la curva real y la asintótica es de 6◦ en cada intersección, en la Figura 7.27 se muestra el diagrama de fase tomando en cuenta tal error. En la Figura 7.28 se muestra el diagrama de Bode de la función de transferencia determinado con el programa MatLab, el código utilizado fue: s=tf(’s’); G=2000*(s+3)/((s+40)*(s+100)); Bode(G,{0.3,1000}); grid Ejercicio 7.6 Determine el diagrama de Bode de la función de transferencia: H(s) = (0,025s + 1) + 1)(s + 2) s2 (0,1s Solución: Escuela de Ingeniería Eléctrica Universidad de Costa Rica 308 Figura 7.28: Diagrama de Bode para la función de transferencia. Reordenando la función de transferencia original como: 1 0,5 40 s+1 (0,025s + 1) 0,5(0,025s + 1) H(s) = 2 = 2 = 1 s (0,1s + 1)(s + 2) s (0,1s + 1)(0,5s + 1) s2 10 s + 1 12 s + 1 Se observa que ésta tiene: Una ganancia de 0,5. Dos polos en el origen. Un polo simple en 10 rad/s. Un polo simple en 2 rad/s. Un cero simple en 40 rad/s. A partir de esto se puede construir el Cuadro 7.4 en donde se muestran los aportes de pendiente de cada término. Como la función de transferencia posee dos polos en el Escuela de Ingeniería Eléctrica Universidad de Costa Rica 309 Término 0,2 < ω < 2 2 < ω < 10 10 < ω < 40 40 < ω < 400 0,5 −2 s s + 1 40 0 −40 0 0 −40 0 0 -40 0 0 −40 20 −1 s + 1 −1 2 s + 1 10 0 −20 −20 −20 0 0 −20 −20 Total −40 −60 −80 −60 Cuadro 7.4: Aporte de pendientes para el diagrama de magnitud. Figura 7.29: Diagrama aproximado de Bode. origen, el punto inicial se determinará evaluando la magnitud de la función cuando s → 0,2j (la menor frecuencia de interés). Así: q lı́m |H(s)| = s→0,2j (0,025 · 0,2)2 + 1 q q 0,22 0,1 · 0,2)2 + 1 (0,2)2 + 22 ≈ 12,4 Por lo que el diagrama de magnitud comienza en 20 log(12,4) ≈ 18,3 dB. Con estos datos se puede crear el diagrama de Bode asintótico como se muestra en la Figura 7.29, en donde se ha trazado de una vez el diagrama aproximado (como la escala de magnitud es muy alta, no tiene mucho sentido ubicar exactamente el error de 3 dB en cada intersección). El aporte de pendientes para el diagrama de fase se muestra en el Cuadro 7.5. Para Escuela de Ingeniería Eléctrica Universidad de Costa Rica 310 conocer la fase inicial del diagrama a bajas frecuencias se puede utilizar la fórmula: ∠G(ω)|ω→0 = 90◦ (nc − np) + 180◦ (ncd − npd) + 90◦ (1 − signo(K)) Donde: np Número de polos en el origen. nc Número de ceros en el origen. ncd Número de ceros en el semiplano derecho. npd Número de polos en el semiplano derecho. ∠H(ω)|ω→0 =90◦ (nc − np) + 180◦ (ncd − npd) + 90◦ (1 − signo(K)) =90◦ (0 − 2) + 180◦ (0 − 0) + 90◦ (1 − 1) = − 180◦ Otra alternativa un poco más exacta para determinar la fase inicial es evaluar la fase de la función de transferencia en la menor frecuencia de interés (0,2 rad/s para este problema). Si esto se hace resultaría: (0,025(jω) + 1) =∠ 2 (jω) (0,1(jω) + 1)((jω) + 2) ( ∠H(ω)|ω→0,2 ) , ω→0,2 = tan−1 (0,025 · 0,2) − 2 · 90◦ − tan−1 (0,1 · 0,2) − tan−1 ≈173◦ . 0,2 , 2 Término 0,2 < ω < 1 1<ω<4 4 < ω < 20 20 < ω < 100 100 < ω < 400 0,5 −2 s s + 1 40 0 0 0 0 0 0 0 0 45◦ 0 0 45◦ 0 0 45◦ −1 s + 1 2 −1 s + 1 10 −45◦ −45◦ −45◦ 0 0 0 −45◦ −45◦ −45◦ 0 Total −45◦ −90◦ −45◦ 0 45◦ Cuadro 7.5: Aporte de pendientes para el diagrama de magnitud. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 311 Figura 7.30: Diagrama de fase asintótico. Figura 7.31: Diagrama aproximado para la fase de la función de transferencia. Sin embargo, como lo que interesa por ahora es dibujar el diagrama asintótico, se utilizará la primera opción, es decir −180◦ . Con el punto inicial (−180◦ ) y las pendientes se puede trazar el diagrama de fase asintótico como se muestra en la Figura 7.30. Como solo hay polos simples, el error en la intersección de las asíntotas será de 6◦ . En la Figura 7.31 se muestra la aproximación del diagrama de fase de la función de transferencia. En la Figura 7.32 se muestra el diagrama de Bode determinado con MATLAB, el código utilizado fue: s=tf(’s’); h=(0.025*s+1)/(s^2*(0.1*s+1)*(s+2)); Bode(h,{0.2,400}); grid Escuela de Ingeniería Eléctrica Universidad de Costa Rica 312 Figura 7.32: Diagrama de Bode la función de transferencia. Ejercicio 7.7 Dada la siguiente función de transferencia: G(s) = a106 (s + 1)(s2 + 25s + 10000) 1. Realice el diagrama de Bode de la función de transferencia para a = 1. 2. Marque en el diagrama de Bode la frecuencia de cruce de ganancia y cruce de fase. 3. Determine el valor de a para que la nueva frecuencia de cruce de ganancia sea de 10 rad/s. Solución: 1.) Reordenando la función de transferencia de la siguiente forma: Escuela de Ingeniería Eléctrica Universidad de Costa Rica 313 Término 0,1 < ω < 1 1 < ω < 100 100 < ω < 1000 100 (s + 1)−1 2 s 25s + + 1 10000 10000 0 0 0 0 −20 0 0 −20 −40 Total 0 −20 −60 Cuadro 7.6: Aporte de pendientes para el diagrama de magnitud. a106 (s + 1)(s2 + 25s + 10000) a106 1 2 = 10000 (s + 1) s + 25s + 1 10000 10000 100a 2 = 25s s + 10000 +1 (s + 1) 10000 G(s) = Y además como: 2 2 s + 25s + 10000 = s + 2ξωn s + ωn2 ( ⇒ ωn = 100 ξ = 0,125 Se observa que la función de transferencia tiene: Una ganancia de 100 (tomando a = 1). Un polo simple en 1 rad/s. Un polo cuadrático en 100 rad/s. Un coeficiente de amortiguamiento de 0,125. A partir de esta información se puede crear la Cuadro 7.6 donde se muestra los aportes de pendientes para el diagrama de magnitud (éste se ha construido tomando el rango de interés como una década antes del primer polo o cero y una década después del último polo o cero). Escuela de Ingeniería Eléctrica Universidad de Costa Rica 314 Figura 7.33: Diagrama de Bode de magnitud asintótico. Para conocer el punto inicial del diagrama de Bode de magnitud se puede evaluar la función en 0 rad/s (esto debido a que no hay polos en el origen). De esta forma se obtiene: |G(s)|s→0 a106 = = 100 ⇒ |G(s)|dB = 20 log(100) = 40 dB (0 + 1)(0 + 25 · 0 + 10000) Por lo que el diagrama asintótico sería como el mostrado en la Figura 7.33. Como ξ = 0,125 < 0,707, habrá un pico de resonancia ubicado en la frecuencia de resonancia dada por: q ωr =ωn 1 − 2ξ 2 q =100 1 − 2 · 0,1252 ≈98,5 rad/s ≈100 rad/s La amplitud en decibelios del pico será: q MrdB = − 20 log 2ξ 1 − ξ2 q = − 20 log 2 · 0,125 1 − 0,1252 ≈12,1 dB Con esta información, y tomando en cuenta el error de 3 dB provocado por el primer polo simple, se puede trazar el diagrama de magnitud como se muestra en la Figura 7.34. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 315 Figura 7.34: Diagrama de magnitud aproximado. Término ω < 0,1 0,1 < ω < 10 10 < ω < 1000 1000 < ω 100 −1 2 (s + 1) 25s s + + 1 10000 10000 0 0 0 0 −45◦ 0 0 0 −90◦ 0 0 0 Total 0 −45◦ −90◦ 0 Cuadro 7.7: Aporte de pendientes para el diagrama de fase. La fase inicial puede ser determinada como: ∠H(ω)|ω→0 =90◦ (nc − np) + 180◦ (ncd − npd) + 90◦ (1 − signo(K)), =90◦ (0 − 0) + 180◦ (0 − 0) + 90◦ (1 − 1), =0◦ . Con lo que el diagrama asintótico de Bode para la fase quedaría como el mostrado en la Figura 7.35. Como el coeficiente de amortiguamiento es pequeño, habrá que corregir el diagrama de fase cerca del polo cuadrático, esto se puede hacer evaluando la fase real de la función de transferencia una octava antes y una octava después de la frecuencia de transición. La fase de la función de transferencia es: ∠G(ω) = tan−1 Escuela de Ingeniería Eléctrica 0 25ω − tan−1 (ω) − tan−1 100 10000 − ω 2 Universidad de Costa Rica 316 Figura 7.35: Diagrama asintótico de Bode para la fase. Figura 7.36: Comparación del diagrama asintótico de la fase con el real. Y como la frecuencia de transición es ωn = 100 rad/s se tendría: 0 25 · 50 ∠G(0,5ω) = tan − tan−1 (50) − tan−1 ≈ −98◦ 2 100 10000 − 50 0 25 · 200 −1 −1 −1 ∠G(2ω) = tan − tan (200) − tan ≈ −260◦ 100 10000 − 2002 −1 2.) La frecuencia de cruce de ganancia se determina cuando la ganancia de la función de transferencia es la unidad, además, la frecuencia de cruce de fase es la frecuencia a la cual la fase del sistema es −180◦ . En un diagrama de Bode la frecuencia de cruce de fase se puede medir directamente, sin embargo, al estar el diagrama de magnitud en decibelios, la frecuencia de cruce de ganancia será la frecuencia para la cual: 20 log [|G(ωc )|] = 20 log[1] = 0 En la Figura 7.37 se muestra el diagrama de Bode determinado a partir del programa MATLAB, en donde se han marcado las frecuencias buscadas, resultando: Escuela de Ingeniería Eléctrica Universidad de Costa Rica 317 Figura 7.37: Diagrama de Bode determinado con MATLAB. ωc ≈130 rad/s ωπ =100 rad/s 3.) Para que la nueva frecuencia de cruce de ganancia sea de 10 rad/s, se debe medir primero cuántos decibeles hay entre el eje de 0 rad/s y la magnitud original a 10 rad/s. En la Figura 7.38 se muestra que hay 20 dB, por lo tanto, si a todo el diagrama de magnitud se le restan 20 dB, la nueva frecuencia de corte de ganancia sería 10 rad/s (esto porque el diagrama de magnitud valdría 0 dB para esa frecuencia). Para encontrar el valor de a se puede utilizar la fórmula: k = 10 Moriginal −Majuste 20 siendo Moriginal la magnitud original de la función de transferencia a bajas frecuencias. Majuste la magnitud necesaria para el ajuste. k la ganancia de la función de transferencia a bajas frecuencias. En este caso: Escuela de Ingeniería Eléctrica Universidad de Costa Rica 318 Figura 7.38: Decibelios entre el diagrama de magnitud y el eje de 0 dB. Moriginal = 40 dB. Majuste = −20 dB. k = 100a. Por lo tanto: 40−20 100a =10 20 , a =0,1. En la Figura 7.39 se muestra el diagrama de Bode de la nueva función de transferencia (con a = 0,1) y la original (con a = 1), se comprueba que la nueva frecuencia de cruce de ganancia es de 10 rad/s. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 319 Figura 7.39: Frecuencia de cruce de ganancia con la ganancia ajustada. Construcción de la gráfica polar Ejercicio 7.8 Determine la gráfica polar de la función de transferencia dada por: H(s) = s+1 (0,1s + 1)(0,5s + 1)(0,02s + 1) Solución: La magnitud de la función de transferencia evaluada en s = jω es: √ ω2 + 1 q q |H(jω)| = q (0,1ω)2 + 1 (0,5ω)2 + 1 (0,02ω)2 + 1 En el Cuadro 7.8 se muestra la magnitud de la función de transferencia para algunos valores de ω. Cuando se realizan diagramas polares, siempre se deben evaluar las frecuencias ω = 0 y ω → ∞. Por otro lado, la fase de la función de transferencia sería: ∠H(jω) = tan−1 (ω) − tan−1 (0,1ω) − tan−1 (0,5ω) − tan−1 (0,02ω). Escuela de Ingeniería Eléctrica Universidad de Costa Rica 320 ω 0 1 |H(jω)| 1 1, 26 ω 20 30 40 0,54 0,38 |H(jω)| 0,83 2 3 4 5 1, 71 1, 68 50 60 70 80 90 0,28 0,21 0,16 0,13 0,11 1, 55 1, 68 6 7 1, 64 1, 58 8 9 10 1, 51 1, 44 1, 37 100 200 ∞ 0,089 0,024 0 Cuadro 7.8: Magnitud de la función de transferencia para distintas frecuencias. ω 0 1 ∠H(jω) 0 11, 6 4, 83 −4, 88 −13, 8 ω 20 30 40 50 60 ∠H(jω) −82, 4 ◦ 2 ◦ ◦ −100 ◦ 3 ◦ ◦ −113 4 ◦ ◦ −122 5 ◦ ◦ −129 6 7 −21, 8 −28,8 −35, 1 −40,8 −46 70 80 90 100 200 ◦ ◦ −135 −140 ◦ 8 ◦ ◦ −144 9 ◦ ◦ −147 10 ◦ −178 −50,7 ∞ ◦ −180◦ Cuadro 7.9: Fase de la función de transferencia para distintas frecuencias. En el Cuadro 7.9 se muestra la magnitud de la función de transferencia para algunos valores de ω. Algo importante es que siempre se deben evaluar las mismas frecuencias que se utilizaron para el diagrama de magnitud. A partir de los datos obtenidos en el Cuadro 7.8 y el Cuadro 7.9, se puede construir el diagrama polar formando vectores de la forma [|H(jω)| , ∠H(jω)], como se muestra en la Figura 7.40, para los distintos valores de ω. Además, siempre se deben marcar tres cosas, el punto donde ω = 0, el punto donde ω = ∞ y la dirección de crecimiento del diagrama polar. Figura 7.40: Diagrama polar para la función de transferencia. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 321 ω 0 1 2 3 4 5 6 7 8 9 ∞ |H(ωi)| ∞ 13, 3 5, 2 2, 65 1, 56 0,99 0,678 0,482 0,355 0,269 0 Cuadro 7.10: Magnitud de la función de transferencia para distintas frecuencias. ω 0 1 2 3 4 5 6 7 8 9 ∞ ∠H(ωi) −90◦ −122◦ −146◦ −163◦ −175◦ 175◦ 167◦ 160◦ 155◦ 150◦ 90◦ Cuadro 7.11: Magnitud de la función de transferencia para distintas frecuencias. Ejercicio 7.9 Determine el diagrama polar de una función de transferencia dada por: H(s) = 15 s(0,5s + 1)(0,1s + 1) Además, marque en el diagrama la frecuencia de corte de ganancia y la frecuencia de cruce de fase si es que existen. Solución: La magnitud de la función de transferencia evaluada en s = jω es: |H(jω)| = 15 q q ω (0,5ω)2 + 1 (0,1ω)2 + 1 En el Cuadro 7.10 se muestra la magnitud de la función de transferencia para distintos valores de la frecuencia, cabe destacar que la magnitud es infinita para ω = 0, esto se debe a la presencia del polo en el origen. Por otro lado, la fase de la función de transferencia sería: ∠H(iω) = −90◦ − tan−1 (0,5ω) − tan−1 (0,1ω). En el Cuadro 7.11 se muestra la fase de la función de transferencia para distintos valores de la frecuencia. A partir de estos datos se puede construir la gráfica polar mostrada en la Figura 7.41a. Para determinar las frecuencias de cruce de ganancia y cruce de fase, se pueden observar las tablas anteriormente construidas, en el Cuadro 7.10 se puede ver que a una frecuencia de 5 rad/s la magnitud es de 0,99, por lo tanto: ωc ≈ 5 rad/s, Escuela de Ingeniería Eléctrica Universidad de Costa Rica 322 además, a partir del Cuadro 7.11 se tiene que la fase del sistema es −175◦ a 4 rad/s y 175◦ a 5 rad/s, por lo que: ωπ ≈ 4,5 rad/s. En la Figura 7.41b se han marcado las frecuencias de cruce de ganancia y cruce de fase, para localizar la frecuencia de cruce de ganancia se puede trazar un círculo de radio 1 sobre el diagrama polar, el diagrama polar tendrá magnitud unitaria en la intersección de ambas curvas. Para localizar la frecuencia de cruce de fase se puede determinar el punto donde el diagrama polar cruza el eje real (o donde la parte imaginaria es cero). (a) Gráfica polar para la función de transferen- (b) Círculo de radio unitario y diagrama polar cia Figura 7.41: Diagramas del ejercicio 7.9 Escuela de Ingeniería Eléctrica Universidad de Costa Rica Bibliografía Alfaro, V. M. (2005). Modelado y Análisis de los Sistemas Dinámicos utilizando la Red Generalizada. Technical report, Universidad de Costa Rica, San José, Costa Rica. Alfaro, V. M. (2006a). Identificación de modelos de orden reducido a partir de la curva de reacción del proceso. Ciencia y Tecnología (UCR), 24(2):2. Alfaro, V. M. (2006b). Ie-1032, control e instrumentación de procesos industriales. Technical report, Universidad de Costa Rica, San José, Costa Rica. Aström, K. J. y Hägglund, T. (2009). Control PID avanzado. Prentice-Hall. Baehr, H. D. y Stephan, K. (2011). Heat and Mass Transfer. Springer, Londres, 3 edición. Canales, R. y Barrera, R. (1977). Análisis de sistemas dinámicos y control automático. Limusa, México. Chapra, S. C. y Canale, R. P. (2006). Métodos numéricos para ingenieros. McGraw Hill, 5 edición. Close, C. M., Frederick, D. K., y Newell, J. C. (2002). Modeling and Analysis of Dynamic Systems. John Wiley and sons. Domínguez, S., Campoy, P., Sebastián, J. M., y Jiménez, A. (2006). Control en el Espacio de Estados. Pearson Education, Madrid, 2 edición. Dorf, R. C. y Bishop, R. H. (2005). Sistemas de Control Moderno. Pearson Education, Madrid, 10 edición. Dorf, R. C. y Svoboda, J. A. (2000). Circuitos Eléctricos, Introducción al Análisis y Diseño. Alfaomega, México, 3 edición. Eykhoff (1977). Identificarea sistemelor. Tehnica, Bucuresti. 323 324 Ho, W., Hang, C., y Cao, L. (1995). Tuning of PID controllers based on gain and phase margin specification. Automatica, 31:497–502. Hubert, C. I. (2002). Electric Machines. Theory, Operation Application, Adjustments and Control. Prentice Hall, 2 edición. Kuo, B. C. (1996). Sistemas de Control Automático. Pearson Education, México, 7 edición. Loría, G. (2008). Fundamentos teóricos para el modelado y análisis de procesos y sistemas. Teoría del curso IE0409. Technical report, Escuela de Ingeniería Eléctrica, Universidad de Costa Rica, San José, Costa Rica. Loría, G. y Mazón, I. (1989). Modelado y Análisis de Sistemas Dinámicos. Editorial de la Universidad de Costa Rica, San José, Costa Rica, 1 edición. Ministerio de Economía, Industria y Comercio (2010). Reglamento Técnico RTCR 443:2010, Metrología. Unidades de Medidas. Sistema Internacional (SI). Ogata, K. (1987). Dinámica de Sistemas. Prentice Hall, 1 edición. Ogata, K. (2003). Ingeniería de Control Moderna. Pearson Education, Madrid, 4 edición. Rao, G. S. (2010). Numerical Analysis. New Age International Publishers, 4 edición. Skogestad, S. (2003). Simple analityc rules for model reduction and PID controller tuning. Journal of Process Control, 13(4):291–309. Ziegler, J. y Nichols, N. (1942). Optimum settings for automatic controllers. ASME Transactions, 64:759–768. Escuela de Ingeniería Eléctrica Universidad de Costa Rica Parte IV. Apéndices 325 A. La transformada de Laplace Dentro de la Teoría de Análisis de Sistemas como de la de Control Automático, la transformada de Laplace es un pilar fundamental en el estudio de los sistemas lineales, puesto que permite convertir ecuaciones diferenciales a ecuaciones algebraicas. Es más, de acuerdo con Ogata1 . Una ventaja del método de la Transformada de Laplace es que permite el uso de técnicas gráficas para predecir el comportamiento del sistema, sin tener que resolver las ecuaciones diferenciales del sistema. Otra ventaja de este método es que, cuando se resuelve la ecuación diferencial, es posible obtener simultáneamente tanto la componente transitoria como la estacionaria de la solución. Desde el punto de vista del estudio de sistemas, la transformada de Laplace traslada las ecuaciones desde el dominio temporal (es decir, la variable t, que se utiliza generalmente para denotar el tiempo) al llamado dominio de la frecuencia (que en este caso está denotado con la variable compleja s, tal que, s = σ + jω. A.1. Definición Sean f (t): Una función del tiempo t tal que f (t) = 0 para t < 0, s = σ + jω: variable compleja, L : símbolo que indica que se aplicará la transformada de Laplace a una función, F (s): transformada de Laplace de f (t). Entonces la Transformada de Laplace de f (t) se obtiene mediante: L [f (t)] = F (s) = 1 Z ∞ 0 f (t)e−st dt. Ogata K. Ingeniería de Control Moderna, 4ta edición. Prentice Hall Madrid. 2003 326 (A.1) 327 También se puede encontrar la función temporal a partir de la función en el dominio de la frecuencia mediante la Transformada Inversa de Laplace, definida por: L −1 1 Z c+j∞ F (s)est ds, para t > 0, [F (s)] = f (t) = 2πj c−j∞ (A.2) donde c, la abscisa de convergencia, es una constante real que se eligió más grande que las partes reales para todos los puntos singulares de F (s). Por supuesto, no se va a utilizar estas expresiones para evaluar la transformada cada vez que sea necesaria. Para ello existen tablas con las funciones más importantes de transformación. A.2. Tablas de la Transformada de Laplace A continuación se presentan los pares de transformadas más útiles para el estudio de los sistemas lineales. En textos de matemática u otros de control, se pueden encontrar listas más extensas. El Cuadro A.1 presenta las principales propiedades de la transformada de Laplace, mientras que en el Cuadro A.2, se muestra la transformada de Laplace de las funciones más importantes en el área del análisis de sistemas lineales. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 328 Propiedad 1 L [af (t)] = aF (s) 2 L f ( a1 t) = aF (as) 3 L [f1 (t) ± f2 (t)] = F1 (s) ± F2 (s) 4 L [f (t − α)µ(t − α)] = e−αs F (s) 5 L [e−αt f (t)] = F (s + α) h i h i 6 L f t a = aF (as) 7 L [ dtd f (t)] = sF (s) − f (0) 8 L [ dtd 2 f (t)] = s2 F (s) − sf (0) − f˙(0) 9 L [ dtd n f (t)] = sn F (s) − sn−1 f (0) − sn−2 f 0 (0) − · · · − sf 2 n 0 (n−2) (0) − f 0 (n−1) (0) dn 10 L {tn f (t)} = (−1)n ds F (s) 11 L 12 L 13 Z t 0 Z t 0 f (t) dt = F (s) s f1 (t − τ )f2 (τ ) dτ = F1 (s)F2 (s) lı́m f (t) = lı́m sF (s) t→∞ s→0 Cuadro A.1: Propiedades de la transformada de Laplace. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 329 f (t) F (s) 1 Impulso unitario δ(t) 1 2 Escalón unitario µ(t) 3 t 4 tn n = 1, 2, 3, 1 s 1 s2 n! sn+1 1 s+a 5 e 6 te−at 1 (s+a)2 7 sen(ωt) ω s2 +ω 2 8 cos(ωt) s s2 +ω 2 1 (1 a 9 1 b−a 10 1 ab 11 1+ −at e−at − e−bt 1 a−b 1 s(s+a) − e−at ) 1 (s+a)(s+b) be−bt − ae−at 1 s(s+a)(s+b) 12 e−at sen(ωt) ω (s+a)2 +ω 2 13 e−at cos(ωt) s+a (s+a)2 +ω 2 1 2ω 14 15 √ωn 1−ξ (sen (ωt) + ωt cos (ωt)) √ e−ξωn t sen(ωn 1 − ξ 2 t), (0 < ξ < 1)) 2 √ −ξωn t 2t + φ e sen ω 1 − ξ n 1−ξ 2 √ 1−ξ 2 φ = tan−1 ξ π 0 < ξ < 1, 0 < φ < 2 √ −ξωn t κp e sen ωn 1 − ξ 2 t + θ s2 (s2 +ω 2 )2 2 ωn 2 s2 +2ξωn s+ωn 1− √1 16 κp = ωn 17 θ = tan−1 r 2 α2 −2αξωn +ωn 1−ξ 2 √ ωn 1−ξ 2 α−ξωn 2 ωn 2) s(s2 +2ξωn s+ωn 2 (s+α) ωn 2 s2 +2ξωn s+ωn (ξ < 1) Cuadro A.2: Pares de transformadas de Laplace. Escuela de Ingeniería Eléctrica Universidad de Costa Rica B. Resumen de álgebra lineal En este apéndice, se presenta un resumen de las propiedades y elementos del álgebra lineal matricial que más se utilizan en el análisis de sistemas. B.1. Nomenclatura En el caso de análisis de sistemas, cuando se hable de un vector, este se va a denotar con letras minúsculas en negrita y siempre se va a suponer que se trata de un vector columna, a menos que se indique lo contrario: v= v1 v2 .. . , (B.1) vn donde el término vn representa el n-ésimo elemento del vector. Las matrices se van a representar con letras mayúsculas en negrita: A= a11 a21 .. . a12 a22 .. . ··· ··· .. . a1n a2n .. . am1 am2 ··· amn . (B.2) En este caso, la matriz A tiene m filas y n columnas, por lo que se dice que el orden de esta matriz es m × n. El término amn representa el elemento de la matriz que se encuentra en la fila m columna n. La transpuesta de una matriz corresponde a intercambiar de posición las filas y las columnas de cada elemento. La transpuesta de A se denota como AT . Si los elementos de AT se denotan como a0ij , entonces se cumple que: a0ij = aji . (B.3) La transpuesta de un vector corresponde a un vector fila. Una matriz cuadrada es una matriz que tiene igual número de filas que de columnas. Algunas propiedades de la transposición de matrices son (Kuo, 1996): 330 331 AT T = A. Si k es un escalar, entonces (kA)T = kAT . (A + B)T = AT + BT . (AB)T = BT AT . B.2. Determinantes e inversas El determinante de una matriz cuadrada se denota como: det (A) = |A| = a11 a21 .. . a12 a22 .. . ··· ··· ... a1n a2n .. . an1 an2 ··· ann . (B.4) El cofactor de un elemento determinante se define de la siguiente manera (Kuo, 1996): “Dado un determinante de n-ésimo orden |A|, el cofactor de cualquier elemento aij denotado como Aij , es el determinante que se obtiene al eliminar todos los elementos de la i-ésima fila y la j-ésima columna que después se multiplica por (−1)i+j ”. Por ejemplo, si se tiene una matriz 3 × 3 dada por: a11 A = a21 a31 a12 a22 a32 a13 a23 , a33 el cofactor de elemento a11 viene dado entonces por: A11 = (−1)1+1 a22 a32 a23 a33 = a22 a33 − a23 a32 , y el del término a12 por: A12 = (−1)1+2 a21 a31 a23 a33 = − (a21 a33 − a23 a1 ) . Utilizando los cofactores se puede calcular el valor del determinante de una matriz cuadrada n × n. Para cualquier fila i = 1, o 2, o . . . , o n: det A = n X (B.5) aij Aij . j=1 Algunas propiedades de los determinantes se encuentran en Ogata (2003): Escuela de Ingeniería Eléctrica Universidad de Costa Rica 332 Si se intercambian cualquiera dos filas o columnas consecutivas, el determinante cambia de signo. Si cualquier fila o columna está formada por ceros, entonces el determinante es igual a cero. Si k es un escalar, y A es n × n entonces |kA| = k n |A| . |AB| = |A| |B|. Se define como matriz adjunta a la matriz cuyo elemento en la i-ésima fila y la j-ésima columna es igual al cofactor Aji . Esta matriz se representa mediante adj A: adj A = Se puede mostrar que A11 A12 .. . A21 A22 .. . ··· ··· ... An1 An2 .. . A1n A2n ··· Ann . (B.6) A (adj A) = |A| I lo que permite encontrar una forma de obtener la inversa de una matriz: A−1 adj A = = |A| A11 |A| A12 |A| . . . A1n |A| A21 |A| A22 |A| ··· ··· An1 |A| An2 |A| .. . .. .. . A2n |A| ··· . Ann |A| . (B.7) Algunas propiedades de la inversión de matrices son las siguientes: AA−1 = I. −1 (A−1 ) = A. (AB)−1 = B−1 A−1 . Escuela de Ingeniería Eléctrica Universidad de Costa Rica 333 En el caso de una matriz 2 × 2, de la forma " A= # a b c d , la matriz inversa vendría dada por: −1 A 1 = ad − bc " d −c −b a # . Y en el caso de una matriz 3 × 3, de la forma a b c A= d e f , g h i la matriz inversa vendría dada por: A−1 = 1 |A| con |A| = a Escuela de Ingeniería Eléctrica e f h i − e h d g f i d g e h f i −b b − h c i a g c i − d g − a b g h f i +c d g b e c f a d c f a d b e , e . h Universidad de Costa Rica C. Métodos numéricos para la simulación de sistemas En este capítulo se introducen algunos conceptos importantes de análisis numérico, que son relevantes para la simulación de sistemas dinámicos. El poder de cálculo que han alcanzado las computadoras digitales actuales, ha motivado el aumento en la importancia de la simulación de sistemas, tanto para el análisis como para el diseño. El uso de algoritmos numéricos no se restringe sólo a software de simulación de sistemas generales (como MATLAB, OpenModelica, COMSOL, VisSim1 , etc.), si no que cualquier software específico de algún área de ingeniería (por ejemplo, la simulación de circuitos eléctricos) deberá implementar algún tipo de método numérico para la resolución de problemas. Es por esta razón que es importante conocer al menos los elementos básicos de este tipo de algoritmos. En la Sección C.1 se hace una pequeña introducción a la idea de cifras significativas, representación de números y errores numéricos. En la Sección C.2 se presentan algunos algoritmos para la resolución de ecuaciones algebraicas. Algunos métodos de aproximación de integrales y derivadas se muestran en la Sección C.3 y por último, la solución de sistemas de ecuaciones diferenciales se presenta en la Sección C.4. C.1. Representación numérica y medidas de error C.1.1. Representación digital de números Cuando se desea almacenar números en una computadora, a veces no es posible escribirlos de una manera “completa”. Por ejemplo, en una computadora digital binaria, es posible almacenar el número entero 3 de una manera muy sencilla, sin embargo, almacenar números irracionales como π requiere de ciertos compromisos. π se puede escribir con decimales como π = 3,141592653 . . .2 Puesto que tiene un 1 http://www.mathworks.com, https://www.openmodelica.org/, http://www.comsol.com/ y http://www.vissim.com/ 2 En http://www.geom.uiuc.edu/~huberty/math5337/groupe/digits.html se pueden encontrar los primeros cien mil decimales y en http://www.numberworld.org/misc_runs/pi-12t/ pre- 334 335 infinito número de decimales, es imposible almacenarlos de una manera práctica en una computadora. Es aquí cuando surge la necesidad del redondeo y el concepto de cifras significativas. De acuerdo con Chapra y Canale (2006), las cifras significativas son la cantidad de dígitos que se utilizan para representar un número en los cuales se tiene certeza de su validez. Este concepto también aparece cuando se realizan mediciones con instrumentos: cuando se mide una distancia con una regla, cuya marca más pequeña es de un milímetro, se dice que cualquier medida que se haga con ella tendrá una incertidumbre de ±0,5 mm. Por lo tanto, solo una cantidad finita de dígitos de esa medición serán “ciertos” y por lo tanto significativos. En Rao (2010), se pueden encontrar algunas reglas para definir qué dígitos son significativos en un número: Todos los números que no son iguales a cero. Los dígitos que son cero si: • Se comprenden entre dígitos significativos. • Están a la derecha de la coma y también a la derecha de otras cifras significativas. • Se dice explícitamente que son significativos. Entonces, por ejemplo, si se presenta un valor como 3,58 este número tiene tres cifras significativas. De igual manera 0,00358 también tiene tres cifras significativas (3, 5 y 8). Cuando se utiliza la notación científica de los números, la cantidad de números que se encuentran en la mantisa son las cifras significativas (por ejemplo el número 3,58 × 10−3 tiene también tres cifras significativas). A veces es necesario escribir un número con una cantidad definida de cifras significativas. En estos casos es necesario redondear o cortar el número para cumplir esta restricción. De acuerdo con (Chapra y Canale, 2006), redondear produce un error menor en la representación de los números, pero muchas veces, por facilidad, en una computadora los números más bien se cortan, de manera que se descarten los dígitos más allá de las cifras significativas necesarias. Así por ejemplo si se tiene el número 4,5681 y se desean tres cifras significativas, el número resultante quedaría como 4,57. Si más bien se necesitan cuatro cifras significativas, el número quedaría como 4,568. Si el dígito que se debe descartar es exactamente 5, entonces se suele sumar una unidad a la última cifra significativa si los números después de este 5 son diferentes de cero. En caso de que sean iguales a cero, lo que se hace es poner el número par sentan los primeros 12 billones de decimales. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 336 bit de signo mantisa exponente Figura C.1: Almacenamiento del número decimal con el estándar IEEE 754. más cercano que sea mayor igual a la última cifra significativa. Así por ejemplo 78,5 y 77,5 ambos se escribirían como 78 con dos cifras significativas. Para representar números en una computadora con cierta cantidad de cifras significativas, se suele utilizar el estándar de la IEEE “Standard for Floating-Point Arithmetic (IEEE 754)”. La idea de este estándar es representar a los números decimales mediante la forma: (−1)s × c × bq , (C.1) donde s es el bit de signo (s = 1 para números negativos y s = 0 para positivos), c es la mantisa que contiene las cifras significativas (cuya cantidad varía dependiendo del número de bits que se dispongan), b es la base (puede ser base 10 o base 2) y q es el exponente. Para almacenar el número, entonces se guarda en memoria los números s, c y q, tal y como se presenta en la Figura C.1. De manera general, cuando se escribe el valor de la mantisa en binario, se normaliza de forma que siempre el primer dígito sea un 1, por lo que este dígito se suele omitir a la hora de escribir la mantisa. Cuando se almacenan números con un número finito de dígitos, surgen inevitablemente errores debido al redondeo. A estos errores también se les llama en este contexto “errores de cuantización”, debido a que con este formato, no es posible escribir cualquier número decimal. Si se sigue el ejemplo que aporta Chapra y Canale (2006), y se toma una versión simplificada del estándar en el que el número del exponente se expresa con un bit de signo y dos de magnitud y con una mantisa de tres bits, el número positivo más pequeño que se podría escribir sería 0111100, que corresponde a 0,0625. Es decir, cualquier número entre 0 y 0,0625 tendrá que redondearse a alguno de estos dos números o simplemente cortarse a cero. Sin embargo, las computadoras modernas pueden utilizar palabras de 32, 64 o 128 bits para representar los números. Así, por ejemplo, si se utilizan 32 bits, normalmente se utilizan 23 bits de mantisa y 8 para el exponente, lo que da una precisión en base 10 de aproximadamente siete cifras significativas. Con 64 bits se podría tener hasta 15 cifras significativas. Por lo que con el avance de las computadoras, el error por redondeo cada vez se hace más pequeño. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 337 Precisión Exactitud (i) (ii) (iii) (iv) Valor real Dato obtenido Figura C.2: Diferencia entre exactitud y precisión: (i) Datos ni precisos ni exactos, (ii) Datos exactos pero poco precisos, (iii) Datos precisos pero poco exactos, (iv) Datos precisos y exactos. C.1.2. Medida del error Siempre que se esté tratando con un método numérico, se tendrá un error asociado. El error se define como la diferencia que existe entre el valor verdadero y el resultado del proceso de medida o cálculo que se obtiene: Error = |Valor verdadero − Valor aproximado obtenido| De acuerdo con Rao (2010) y Chapra y Canale (2006) existen tres tipos de error: Errores inherentes: Se refieren a los errores en los datos (pueden ser experimentales) o los parámetros que se utilizan para resolver un problema. Cuando se tienen datos reales, la calidad de estos datos se pueden cuantificar mediante su precisión y su exactitud. Un conjunto de datos son exactos cuando, después de tomar varias muestras, el valor que arrojan los instrumentos de medición se acercan al valor real de la medición. Por supuesto, para conocer la exactitud, es necesario calibrar los instrumentos antes con un patrón que sea conocido. Por otro lado, la precisión está más relacionada con la variabilidad de las muestras: si se realiza varias veces la misma medición y los resultados están muy esparcidos se dice que las mediciones son poco precisas. Se debe tener claro que la exactitud y la precisión son relativamente independientes y se pueden tener datos que sean precisos pero no exactos y viceversa, tal y como se presenta en la Figura C.2. Errores de redondeo: Como los números con expansión decimal no se pueden Escuela de Ingeniería Eléctrica Universidad de Costa Rica 338 almacenar completamente en una computadora, a la hora que se corte un número en cierto decimal, se produce un error por redondeo. Errores por truncamiento: Estos errores se deben a las aproximaciones que se hacen para poder realizar los cálculos en una computadora. Por ejemplo, si se deseara implementar la función senoidal en una computadora, se podría utilizar la expansión de Taylor hasta cierto orden para su cálculo. Sin embargo, como sólo se puede usar un orden finito en la serie, esta diferencia entre el valor real y el valor que se está utilizando en el cálculo es lo que se denomina error por truncamiento. Para poder comparar el valor del error de un procedimiento con el de otro, se suele utilizar una medida del error que es relativa al valor verdadero: t = |valor verdadero − valor aproximado| 100 %. valor verdadero (C.2) Esta medida es útil cuando se conoce el valor verdadero, pero muchas veces este valor no se tiene a mano, por lo que la medida del error se debe aproximar de alguna manera. Tal y como lo indica Chapra y Canale (2006), muchos métodos numéricos son iterativos por lo que una medida de error relativo se puede definir como: a = |valor aproximado actual − valor aproximado anterior| . valor aproximado actual (C.3) Una de los criterios de finalización de los algoritmos numéricos es el momento en que este error relativo se hace menor que cierto valor s . Cuando se terminan las iteraciones por esta condición, se puede garantizar que el resultado es correcto en al menos n cifras significativas cumpliendo que Chapra y Canale (2006): s = (0,5 × 102−n ) % C.2. (C.4) Solución numérica de ecuaciones algebraicas Muchas veces, mientras se resuelve algún problema en ingeniería, es necesario encontrar la solución de una ecuación que, posiblemente, no se pueda resolver fácilmente de manera analítica. En estos casos, lo que se hace es tratar el problema matemático utilizando un método numérico. En esta sección se van a estudiar tres de estos métodos: De la falsa posición, Newton-Raphson y método de la secante. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 339 Figura C.3: Método de la falsa posición. C.2.1. Método de la falsa posición El método de la falsa posición, es un algoritmo que se basa en criterios gráficos para encontrar una raíz real de una función continua cualquiera. El método se puede explicar a partir de la Figura C.3: Suponga que se quiere resolver la ecuación f (x) = 0 y que se tienen los puntos xl y xu que son conocidos y cumplen que el signo de f (xl ) es diferente al signo de f (xu ). Puesto que la función es continua y estos dos puntos tienen diferente signo, entonces es claro que debe existir al menos una raíz (cruce por cero) en este intervalo. La idea de este método es trazar una línea recta entre xl y xu de manera que sea posible encontrar el punto xr en el que esta recta corta el eje x y suponer que este punto es una aproximación (una posición falsa) de la raíz verdadera. A partir de la Figura C.3, se pueden trazar dos triángulos que tengan en común el punto xr . Por triángulos semejantes se puede escribir que (Chapra y Canale, 2006): f (xl ) f (xu ) = . xr − xl xu − xr Despejando xr se obtiene: xr = xu f (xl ) xl f (xu ) − . f (xl ) − f (xu ) f (xl ) − f (xu ) (C.5) Si se suma y resta xu al lado derecho de (C.5), se llega a: xr = xu − Escuela de Ingeniería Eléctrica f (xu )(xl − xu ) , f (xl ) − f (xu ) (C.6) Universidad de Costa Rica 340 que es la ecuación que se utiliza para calcular el valor de xr . Un método parecido a este es el método de la bisección, pero en lugar de calcular el valor de xr con (C.6), lo que hace es colocar la aproximación de la raíz en el punto medio entre xl y xr . La ventaja del método de la falsa posición es que, en la mayoría de los casos, la convergencia es más rápida que utilizando el método de la bisección. Por supuesto, el valor verdadero de la raíz no necesariamente es igual al valor calculado de xr , por lo que se debe proceder a buscar una mejor aproximación. Lo que se hace es cambiar alguno de los límites xl y xu dependiendo de la siguiente prueba: Si f (xl ) · f (xr ) < 0, quiere decir que existe una solución en el intervalo entre xl y xr , por lo que se hace xu = xr y se repite el cálculo en (C.6). Si f (xr ) · f (xu ) < 0, quiere decir que existe una solución en el intervalo entre xr y xu , por lo que se hace xl = xr y se repite el cálculo en (C.6). Si f (xr )·f (xu ) = 0 o f (xl )·f (xr ) = 0 entonces quiere decir que xr es exactamente la raíz y por lo tanto no hay que continuar con el algoritmo. El algoritmo debe terminar en algún momento, por lo que se debe definir un criterio de salida. Uno de estos criterios puede ser que se haya alcanzado el número máximo de iteraciones que se van a permitir o que el error aproximado en la i-ésima iteración dado por: xr,i − xr,i−1 · 100 % (C.7) a = xr,i sea menor que cierto valor preestablecido. Ejemplo C.1 Utilizando el método de la posición falsa, resuelva la ecuación: √ 1 x x+ x=8 3 Solución: El método de la posición resuelve problemas de la forma f (x) = 0, por lo tanto √ falsa 1 se tiene que f (x) = x x + 3 x − 8. Si se hace xl = 1 se tiene que f (xl ) ≈ −6,667, y si se toma xu = 5 se tiene que f (xu ) ≈ 4,847. Por lo tanto, como se tiene que los signos en estos puntos son diferentes, se concluye que la raíz se encuentra entre 1 y 5. Al aplicar el método se tiene los resultados que se observan en el Cuadro C.1. Como se puede observar, después de cinco iteraciones, el error relativo es de 0,0002 %. Con la sexta iteración, ya se tienen cinco decimales que no varían entre esta iteración y Escuela de Ingeniería Eléctrica Universidad de Costa Rica 341 la anterior. Es más, utilizando seis decimales, el valor de f (xr ) en esta iteración se puede considerar prácticamente igual a cero, por lo que se puede dar por resuelto este problema. iteración xl f (xl ) xu f (xu ) xr f (xr ) a 0 1 2 3 4 5 6 1 3,316087 3,568836 3,588743 3,590269 3,590385 3,590394 −6,666667 −0,856002 −0,068369 −0,005246 −0,000401 −0,000031 −0,000002 5 5 5 5 5 5 5 4,847007 4,847007 4,847007 4,847007 4,847007 4,847007 4,847007 3,316087 3,568836 3,588743 3,590269 3,590385 3,590394 3,590395 −0,856002 −0,068369 −0,005246 −0,000401 −0,000031 −0,000002 0,000000 7,0821 % 0,5547 % 0,0425 % 0,0033 % 0,0002 % 0,0000 % Cuadro C.1: Ejecución del algoritmo de la falsa posición para el ejemplo C.1 C.2.2. Método de Newton-Raphson El método de Newton-Raphson se basa en el conocimiento de la derivada de la función f (x) en el punto xi para encontrar una aproximación de la raíz de la ecuación f (x) = 0. Desde el punto de vista matemático, lo que se hace es aproximar la función f (x) mediante una serie de Taylor truncada al primer orden de manera que se pueda encontrar, mediante algunas iteraciones, el valor de la raíz. Gráficamente, el método se explica en la Figura C.4. Se puede observar que, con el conocimiento de la derivada en el punto xi , se puede tener una aproximación del punto de intersección con el eje, trazando la recta tangente a ese punto. Una vez que se calcula xi+1 , se repite el procedimiento hasta que se cumple cierta condición de paro. La ecuación del método se obtiene a partir de la aproximación de Taylor de primer orden alrededor de xi : f (xi+1 ) ∼ (C.8) = f (xi ) + f 0 (xi ) · (xi+1 − xi ) . Puesto que lo que se desea es obtener una aproximación del punto en que se cruza el eje, se define f (xi+1 ) = 0. Tomando en cuenta esto, se despeja xx+1 de manera que: xi+1 = xi − Escuela de Ingeniería Eléctrica f (xi ) . f 0 (xi ) (C.9) Universidad de Costa Rica 342 Figura C.4: Método de Newton-Raphson para resolver ecuaciones de manera numérica. Obviamente, esta ecuación sólo es válida si f 0 (xi ) 6= 0. Una desventaja de este método es que se necesita conocer el valor de la derivada de f (x), al contrario del método de la falsa posición en el que sólo era necesario conocer f (x). Otro problema es que, al ser un método que no “encierra” la raíz en un intervalo, es posible que el método diverja, dependiendo de la forma de función. Sin embargo, si el método converge, lo hará de una manera más rápida que en el caso de la falsa posición. Es más, se puede demostrar que, de converger, la velocidad con que lo hace es cuadrática, lo que significa que el error de cada iteración es proporcional al cuadrado del error anterior, permitiendo que, con cada iteración se tenga, el doble de decimales correctos (Chapra y Canale, 2006). Ejemplo C.2 Resuelva la ecuación del ejemplo C.1 utilizando el método de Newton-Raphson. Solución En el Cuadro C.2 se puede observar las iteraciones necesarias con el método de Newton-Raphson. Como se puede observar, después de tres iteraciones, el método llega a la misma solución que con el método anterior, lo que muestra su superioridad en lo que a velocidad de convergencia se refiere. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 343 iteración xi f (xi ) 0 1 2 3 5 3,6855 3,5909 3,5904 4,8470 0,3039 0,0017 6,044 × 10−8 f 0 (xi ) xi+1 a 3,6874 3,6855 35,67 % 3,2130 3,5909 2,63 % 3,1758 3,5904 0,02 % 3,1755 3,5904 0,00 % Cuadro C.2: Solución de la ecuación con el método de Newton-Raphson. El método también se puede aplicar para resolver sistemas de ecuaciones no lineales. Supóngase que se quiere resolver el sistema: ( f (x, y) = 0 . g(x, y) = 0 (C.10) Al igual que en caso de una sola ecuación, se procede a obtener la expansión de Taylor de primer orden para f (x, y) y g(x, y) alrededor del punto (xi , yi ), con la diferencia que en este caso, se tienen dos variables (x y y) para cada una de las funciones: ∂f (xi , yi ) ∂f (xi , yi ) + (yi+1 − yi ) , ∂x ∂y ∂g(xi , yi ) ∂g(xi , yi ) + (yi+1 − yi ) , g(xi+1 , yi+1 ) ≈ g(xi , yi ) + (xi+1 − xi ) ∂x ∂y f (xi+1 , yi+1 ) ≈ f (xi , yi ) + (xi+1 − xi ) (C.11) (C.12) haciendo f (xi+1 , yx+1 ) = g(xi+1 , yi+1 ) = 0 y despejando para xi+1 y yi+1 se obtiene: xi+1 = xi − yi+1 = yi − ∂g(xi ,yi ) f (xi , yi ) − ∂y ∂f (xi ,yi ) ∂g(xi ,yi ) − ∂x ∂y ∂f (xi ,yi ) g(xi , yi ) − ∂x ∂f (xi ,yi ) ∂g(xi ,yi ) − ∂x ∂y ∂f (xi ,yi ) g(xi , yi ) ∂y , ∂f (xi ,yi ) ∂g(xi ,yi ) ∂y ∂x ∂g(xi ,yi ) f (xi , yi ) ∂x , ∂f (xi ,yi ) ∂g(xi ,yi ) ∂y ∂x (C.13) (C.14) que es la ecuación para resolver un sistema de dos ecuaciones no lineales. Este cálculo se repite hasta que se logre reducir el error relativo a un valor predeterminado. C.2.3. Método de la secante El método de la secante es otra manera de resolver ecuaciones algebraicas (Chapra y Canale, 2006). Este utiliza la misma idea del método de Newton-Raphson pero trata Escuela de Ingeniería Eléctrica Universidad de Costa Rica 344 Figura C.5: Representación gráfica del método de la secante. de solventar una de sus desventajas: en el método de Newton-Raphson es necesario conocer la derivada de la función por resolver en cada una de las iteraciones, pero dependiendo del problema, esta derivada puede ser muy difícil o incluso imposible de obtener. El método de la secante lo que hace es aproximar el cálculo de la derivada como una diferencia: f (xi−1 ) − f (xi ) f 0 (xi ) ≈ , (C.15) xi−1 − xi como se puede observar, el cómputo de la derivada de la función se obtiene mediante el cálculo de la misma función con el valor de la aproximación actual de la raíz (xi ) y el valor en la iteración anterior xi−1 . Si se cambia entonces la aproximación (C.15), en (C.9), se obtiene la ecuación para obtener la raíz: xi+1 = xi − f (xi ) (xi−1 − xi ) . f (xi−1 ) − f (xi ) (C.16) La solución que se obtiene utilizando esta ecuación se puede representar gráficamente como se muestra en la Figura C.5. El algoritmo que se seguiría es igual que el de Newton, con excepción de que se está aproximando la tangente mediante una secante. Tal y como se menciona en (Chapra y Canale, 2006), la ecuación del método de la secante es igual al del método de la falsa posición. La diferencia radica en cómo se van eligiendo los nuevos valores de xi en cada iteración, puesto que el método de la secante no requiere que los dos puntos que se utilizan durante la iteración tenga Escuela de Ingeniería Eléctrica Universidad de Costa Rica 345 signo contrario. Por esta razón es posible que el método de la secante, al igual que del Newton-Raphson, puedan divergir en algunos casos. Ejemplo C.3 Resuelva la ecuación del ejemplo C.1 utilizando el método de la secante. Solución Aplicando (C.16) al problema, con valores iniciales x−1 = 5 y x0 = 4, se obtiene los resultados del Cuadro C.3 Iteración xi−1 f (xi−1 ) xi f (xi ) 0 1 2 3 4 5,0000 4,0000 3,6205 3,5911 3,5904 4,8470 1,3333 0,0959 0,0023 0,0000 4,0000 3,6205 3,5911 3,5904 3,5904 1,3333 0,0959 0,0023 4,37 × 10−6 2,00 × 10−10 xi+1 a 3,6205 10,48 % 3,5911 81,87 % 3,5904 2,04 % 3,5904 0,00 % 3,5904 0,00 % Cuadro C.3: Solución del Problema C.3 utilizando el método de la secante. Como se puede observar, la convergencia del método es casi igual a la de NewtonRaphson. La elección de los valores iniciales C.3. Métodos de diferenciación e integración numéricas En esta sección se presentan los métodos numéricos para aproximar las operaciones de derivación e integración. C.3.1. Aproximación de derivadas Muchas veces es necesario aproximar de alguna manera la derivada de una función numéricamente, ya sea porque solo se tiene un conjunto de puntos sin conocer exactamente la función o porque obtener esta derivada de manera analítica sería muy complicado. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 346 Supóngase que se tiene una función f (x) que se quiere conocer el valor de su derivada en el punto xi . Partiendo de la serie de Taylor se obtiene: 1 f (xi+1 ) = f (xi ) + f 0 (xi ) · (xi+1 − xi ) + f 00 (xi ) · (xi+1 − xi )2 + . . . 2 (C.17) Si se trunca la serie hasta el primero orden y se despeja f 0 (xi ), se llega a que: f 0 (xi ) ≈ f (xi+1 ) − f (xi ) , xi+1 − xi (C.18) a esta aproximación se le conoce como “aproximación de la primera derivada hacia adelante”, porque para obtener la aproximación de la derivada en el punto xi se debe conocer el además el valor de la función en xi+1 . Normalmente se define el término h = xi+1 − xi como el paso. Claramente, cuanto más pequeño sea este paso, más exacto será el valor de la aproximación de la derivada. En caso de que se prefiera utilizar valores anteriores para el cálculo de la derivada, se obtiene la “aproximación de la primera derivada hacia atrás”: f 0 (xi ) ≈ f (xi ) − f (xi−1 ) . xi − xi−1 (C.19) Existe una tercera posibilidad de aproximación mediante “diferencias centradas”. La expansión en series de Taylor completa para el caso de la aproximación hacia atrás viene dada por: 1 f (xi−1 ) = f (xi ) + f 0 (xi ) · (xi−1 − xi ) + f 00 (xi ) · (xi−1 − xi )2 + . . . , 2 considerando que h = xi+1 − xi = xi − xi−1 , se llega a que: 1 f (xi−1 ) = f (xi ) − f 0 (xi )h + f 00 (xi )h2 − . . . 2 (C.20) Si se resta (C.20) a (C.17) se obtiene f (xi+1 ) − f (xi−1 ) = 2f 0 (xi )h + 2 (3) f (xi )h3 + . . . 3! (C.21) En este caso, se pueden despreciar los elementos de tercer orden y superior (conservamos el de segundo orden, pero como se puede observar, este es igual a cero). Al despejar la primera derivada en (C.21), se llega a la ecuación para calcular la primera derivada mediante diferencias centradas: f 0 (xi ) ≈ Escuela de Ingeniería Eléctrica f (xi+1 ) − f (xi−1 ) , 2h (C.22) Universidad de Costa Rica 347 adelanto real atraso centrado Figura C.6: Diferencia entre los tres métodos para calcular derivadas. en este caso, se utilizan tanto el punto anterior como el posterior. Gráficamente, la diferencia entre los tres métodos se puede apreciar en la Figura C.6: teniendo en cuenta que la derivada de una función es igual a la pendiente de la recta tangente, lo que se puede observar es que se está aproximando esta tangente mediante secantes. La diferencia entre cada uno de los métodos es, cuáles son los puntos por los que cruzan estas secantes. Aunque el paso h sea el mismo tanto hacia atrás como hacia adelante, en la mayoría de los casos la diferencia entre f (xi ) y f (xi−1 ) va a ser diferente a la diferencia entre f (xi ) y f (xi+1 ), por lo que el método de la diferencia hacia atrás y la diferencia hacia adelante, en general, dará aproximaciones con valores distintos. Ejemplo C.4 Calcular numéricamente la derivada de la función f (x) = x2 ln(x) y compararlo con su derivada real. Solución. Se utilizan las ecuaciones (C.18), (C.19) y (C.22), para calcular las aproximaciones de las derivadas con un valor arbitrario de h = 0,5. En el Cuadro C.4 se muestran los resultados de los cálculos y en la Figura C.7 se muestra esta comparación de una manera gráfica. Como se puede observar, si se tiene una serie de diez números de xi , sólo se podrán calcular nueve derivadas con los métodos de diferencia en adelanto y diferencia en atraso y sólo ocho para el caso de la diferencia centrada. Sin embargo, la aproximación con la diferencia centrada es mucho mejor que con los otros dos casos, debido a que se omiten menos términos de la serie de Taylor. Qué tan buenas son estas aproximaciones depende también de qué tan bruscos Escuela de Ingeniería Eléctrica Universidad de Costa Rica 348 xi 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 f 0 (xi ) real f 0 (xi ) adelanto f 0 (xi ) atraso f 0 (xi ) centrada −0,193 1,000 2,716 4,773 7,081 9,592 12,269 15,090 18,037 21,094 0,347 1,825 3,721 5,908 8,321 10,918 13,669 16,554 19,557 - 0,347 1,825 3,721 5,908 8,321 10,918 13,669 16,554 19,557 1,086 2,773 4,815 7,115 9,620 12,293 15,111 18,055 - Cuadro C.4: Comparación de los tres métodos para obtener la aproximación de la derivada. sean los cambios en la función y de qué tan pequeño sea el paso que se utilice. C.3.2. Integración numérica Para resolver la integral, I= Z b a f (x) d (C.23) de manera numérica, lo que se hace es aproximar la función f (x) mediante un polinomio de orden bajo. Tal y como se explica en Chapra y Canale (2006) y Rao (2010), si se aproxima mediante un polinomio de orden uno, se obtendrá el método conocido como regla del trapecio, si se aproxima utilizando tres puntos conocidos por lo que que pase una parábola, se conoce como el método de Simpson de 1/3 y si se aproxima utilizando un polinomio de grado tres con cuatro puntos conocidos, se le llama método de Simpson de 3/8. En este curso se va a estudiar el método del trapecio por ser más sencillo y porque, si se aplica el método sobre un segmento pequeño y se repite para múltiples segmentos de la integral en cuestión, se puede obtener un buen resultado. En la Figura C.8, se puede observar la aproximación que se está haciendo de la función mediante una línea recta. Son claros dos aspectos: dependiendo de la complejidad de la función que se esté integrando, esta aproximación puede acarrear un error muy grande, pero, si el rango en que se aproxima esta función es pequeño, esta aproximación comienza a parecerse más a la función real. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 349 25 Real Adelanto 20 Atraso Centrado f’(x) 15 10 5 0 −5 0.5 1 1.5 2 2.5 x 3 3.5 4 4.5 5 Figura C.7: Comparación de la derivada con los tres métodos. Figura C.8: Aproximación trapezoidal de una integral. Es posible derivar el área bajo la línea mediante métodos de cálculo, pero en este caso se utilizará el conocimiento previo del área de un trapecio. Es sabido que el área de un trapecio es igual a la altura por el promedio de las bases del trapecio, a saber, si la altura mide d, y las bases miden c y C, el área del trapecio sería entonces: Atrap = (C + c)d 2 Con respecto a la Figura C.8, se puede obtener que: d = b − a, c = f (a) y C = f (b), por lo tanto, la aproximación de la integral vendría dada por: I ≈ (b − a) Escuela de Ingeniería Eléctrica f (a) + f (b) . 2 (C.24) Universidad de Costa Rica 350 Figura C.9: Aplicación múltiple de la regla del trapecio. Cuando se desea aplicar este método para rangos grandes, lo que se hace es dividir el rango en n segmentos y aplicar la fórmula para cada uno, como quedaría representado en la Figura C.9. Si se suman las áreas de cada uno de los trapecios individuales, se obtiene que f (x0 ) + f (x1 ) f (x1 ) + f (x2 ) + (x2 − x1 ) + ··· 2 2 f (xn ) + f (xn−1 ) + (xn − xn−1 ) 2 I ≈ (x1 − x0 ) (C.25) Si se supone que todos los puntos están igualmente espaciados (es decir xi − xi−1 = h, ∀i), (C.25) se puede escribir como: f (x0 ) + f (x1 ) f (x1 ) + f (x2 ) f (xn ) + f (xn−1 ) I≈h + + ··· + , 2 2 2 " # (C.26) y agrupando los términos se llega a que: h I≈h f (x0 ) + f (xn ) + 2 2 Pn−1 i=1 i f (xi ) . (C.27) Por supuesto, se debe cumplir que n es un número entero positivo, por lo que el paso h está sujeto a que: f (xn ) − f (x0 ) h= (C.28) n De nuevo, cuando más pequeño sea el paso, más exacta será la aproximación de la integral, pero se deberán realizar más cálculos. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 351 Ejemplo C.5 R Encuentre el resultado de I = 0π x sen(x) dx mediante la regla del trapecio, con diferentes pasos de integración. Solución: Este problema se puede resolver analíticamente y se sabe que el valor de esa integral es I = π. Se resolverá el problema utilizando n = 1, 3, 5, 10, 50, 100. El código en MATLAB que implementa el algoritmo se presenta a continuación, aunque también es posible utilizar directamente la función trapz: % Script que implementa la regla del trapecio clear ; clc ; tic ; % se empieza a medir el tiempo f = @( x ) x .* sin ( x ) ; % acá se define la función dentro del mismo script x0 =0; % valor inicial xn = pi ; % valor final n =10; % número de pasos que se desean , en este caso 10 , pero se puede cambiar h =( xn - x0 ) / n ; % cálculo del paso x = x0 : h : xn ; % estos son todos los puntos de x que se desean y = f ( x ) ; % se calcula el valor de la función en cada uno de los puntos % --------------------------------------------% Esto de acá implementa la ecuación C .24 y (1) = y (1) /2; y ( end ) = y ( end ) /2; I = h * sum ( y ) ; % --------------------------------------------t = toc ; %tiempo transcurrido disp ([ 'I = ' , num2str ( I ) ]) ; % El valor de la integral disp ([ ' Tiempo : ' , num2str ( t ) , ' s ' ]) ; % El tiempo transcurrido e = abs (I - pi ) / pi *100; % El error disp ([ ' Error : ' , num2str ( e ) , ' %' ]) ; % Se pone el error en la pantalla Cuando se ejecuta el script con los pasos deseados, los resultados son los siguientes: Escuela de Ingeniería Eléctrica Universidad de Costa Rica 352 n I 1 6,0434 × 10−16 3 2,8491 5 3,0376 10 3,1157 50 3,1406 100 3,1413 1000 3,1416 error ( %) tiempo (ms) 100 9,31 3,312 0,824 0,0329 0,008 8,223 × 10−5 2,85 2,19 3,78 4,20 4,06 4,04 3,29 Cuadro C.5: Aplicación de la regla del trapecio para varios valores de h. Al principio, conforme el paso se hace más pequeño (n más grande), el tiempo de ejecución va aumentando, pero llega a un punto en el que, posiblemente debido a características propias de la implementación de MATLAB, logra disminuir el tiempo, aunque se esté tratando con una mayor. Debe tomarse en cuenta que los resultados podrían variar si se ejecuta el mismo script en diferentes computadoras debido a la arquitectura y la velocidad del procesador y de la memoria RAM, sin embargo, los valores de la integral deberían ser muy parecidos a los que se presentan en el Cuadro C.5. C.4. Solución numérica de ecuaciones diferenciales Otros de los problemas que se suelen resolver comúnmente con métodos numéricos es la resolución de ecuaciones diferenciales de la forma: dy = f (x, y). dx (C.29) La idea es obtener un conjunto de puntos de manera que se pueda obtener la trayectoria que es solución de la ecuación diferencial, sin tener que resolverla analíticamente de forma explícita. El método más sencillo es el de Euler en el que se hace una aproximación que utiliza un sólo valor de la función f (x, y) para aproximar el siguiente punto de la trayectoria. Otros métodos caen en la categoría de métodos de Runge-Kutta que se estudian en la sección C.4.2 y que utilizan una mejor aproximación a la de Euler. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 353 valor calculado error valor real Figura C.10: Representación del método de Euler. Adaptado de Chapra y Canale (2006). C.4.1. Método de Euler Partiendo de la ecuación C.29 y aproximando la derivada con una diferencia hacia adelante, es posible obtener una estimación del valor siguiente de la trayectoria, que se encuentra a una distancia h del punto actual (el paso de integración), suponiendo que la trayectoria tiene una dirección parecida a la de la derivada, tal y como se muestra en la Figura C.10. Por supuesto, esto produce un error en el cálculo de f (xi+1 ), puesto que, a menos que sea una línea recta, la trayectoria no tiene la misma derivada en todos los puntos. Cuando se cambia la derivada por su aproximación en diferencia hacia adelante se obtiene: yi+1 = yi + hf (xi , yi ), (C.30) que corresponde a la manera de calcular el siguiente punto de la trayectoria, conociendo el punto anterior. Si el paso es muy grande, el error que se produce es importante. Por el otro lado, para reducir el error a valores pequeños, se necesitan pasos muy pequeños, lo que implica una gran cantidad de cálculos. El objetivo de los métodos de Runge-Kutta es mejorar la aproximación de la pendiente de manera que se logre obtener una trayectoria más cercana a la real con tamaño de pasos razonables. C.4.2. Métodos de Runge-Kutta A partir del método de Euler, es claro que la forma de ir resolviendo la ecuación diferencial es ir calculando cada nuevo punto, tomando en cuenta el punto actual, el Escuela de Ingeniería Eléctrica Universidad de Costa Rica 354 paso y una dirección: yi+1 = yi + paso · dirección, pero, con Euler, esta dirección se calculaba como la derivada en el punto actual, pero esta no es una muy buena aproximación si el paso no es muy pequeño. En general los métodos que caen dentro de la categoría “Runge-Kutta” calculan esta dirección utilizando la forma (Chapra y Canale, 2006): yi+1 = yi + hφ(xi , yi , h), (C.31) φ(xi , yi , h) = a1 k1 + a2 k2 + · · · + an kn , (C.32) definiendo φ como: con: k1 = f (xi , yi ), k2 = f (xi + p1 h, yi + q11 k1 h), k3 = f (xi + p2 h, yi + q21 k1 h + q22 k2 h), .. .. .=. kn = f (xi + pn−1 h, yi + qn−1,1 k1 h + qn−1,2 k2 h + · · · + qn−1,n−1 kn−1 h). Así por ejemplo si n = 2, se contaría con un método de Runge-Kutta de segundo orden en el que se debería evaluar la función f (x, y) dos veces. Es más, el método de Euler se puede considerar como un método de Runge-Kutta de primer orden. Por supuesto, se deben buscar los parámetros ak , pk y qk,l para poder utilizar estas ecuaciones. En este texto se mostrará el procedimiento para el caso de segundo orden, siguiendo los pasos mostrados en Chapra y Canale (2006) y luego se darán los valores de los parámetros para el caso de cuarto orden, puesto que se trata del método de Runge-Kutta más popular. En el caso del segundo orden, se tiene que: yi+1 = yi + h [a1 k1 + a2 k2 ] , (C.33) con: k1 = f (xi , yi ) k2 = f (xi + p1 h, yi + q11 k1 h) Escuela de Ingeniería Eléctrica Universidad de Costa Rica 355 Ahora bien, si se supone que la solución de la ecuación diferencial (C.29) viene dada por y(x), su expansión de Taylor hasta el segundo orden vendría dada por: y(xi + h) = y(xi ) + h dy dx + xi ,yi h2 d2 y 2 dx2 . xi ,yi Haciendo y(xi + h) = yi+1 , y(xi ) = yi y tomando en cuenta (C.29) se obtiene: yi+1 = yi + hf (xi , yi ) + h2 0 f (xi , yi ). 2 La derivada de la función f (x, y) con respecto a x, vendría dada por: f 0 (x, y) = pero hay que recordar que dy dx ∂f (x, y) ∂f (x, y) dy + , ∂x ∂y dx = f (x, y), por lo que: h2 ∂f (xi , yi ) ∂f (xi , yi ) = yi + hf (xi , yi ) + + f (xi , yi ) . 2 ∂x ∂y " yi+1 # (C.34) Para encontrar los valores de los parámetros, habría que igualar (C.33) con (C.34). Como no tienen exactamente las misma forma, lo que se hace es escribir la expansión de Taylor de primer orden de f (xi + p1 h, yi + q11 k1 h): f (xi + p1 h, yi + q11 k1 h) = f (xi , yi ) + p1 h ∂f (xi , yi ) ∂f (xi , yi ) + q11 k1 h ∂x ∂y (C.35) por lo que, al final, introduciendo (C.35) en (C.33) y reordenando, se llega a que: h2 ∂f (xi , yi ) ∂f (xi , yi ) yi+1 = yi + h(a1 + a2 )f (xi , yi ) + 2a2 p1 + 2a11 a2 f (xi , yi ) . 2 ∂x ∂y (C.36) Entonces, igualando (C.34) con (C.36), se tiene que se debe cumplir que: " # a1 + a2 = 1, 1 a2 p 1 = , 2 1 a2 q11 = , 2 Escuela de Ingeniería Eléctrica Universidad de Costa Rica 356 es decir, se tiene un sistema de tres ecuaciones con cuatro incógnitas, por lo que se tiene un número infinito de soluciones. Si se selecciona a2 = 1/2, se tiene un método llamado método de Heun con un predictor. Si a2 = 1, se llega a un método conocido como el método del punto medio. Sin embargo, si a2 = 2/3, se obtiene el método de Ralston, que, de acuerdo con Chapra y Canale (2006), es el que tiene el menor error por truncamiento. Con este valor, el método de resolución de ecuaciones de segundo orden quedaría como: 2 1 (C.37) k1 + k2 h, yi+1 = yi + 3 3 con: k1 = f (xi , yi ), 3 3 k2 = f (xi + h, yi + k1 h). 4 4 (C.38) (C.39) Como se puede observar, con esta aproximación es necesario evaluar dos veces la función en cada iteración, al contrario del caso de Euler que sólo se evaluaba una vez. En el caso del método de Runge-Kutta de cuarto orden, el procedimiento es el mismo que para el caso del de segundo orden, pero utilizando más términos de la serie de Taylor. Igualmente, se llega a que existe un infinito número de posibilidades para escoger el valor de los parámetros. Sin embargo, la versión normalmente utilizada viene dada por: 1 yi+1 = yi + (k1 + 2k2 + 2k3 + k4 ) h, (C.40) 6 donde: k1 = f (xi , yi ) 1 1 k2 = f (xi + h, yi + k1 h) 2 2 1 1 k3 = f (xi + h, yi + k2 h) 2 2 k4 = f (xi + h, yi + k3 h) (C.41) (C.42) (C.43) (C.44) Ejemplo C.6 Resuelva la ecuación diferencial: y 0 (x) + 0,5y(x) = 4e0,8x Escuela de Ingeniería Eléctrica Universidad de Costa Rica 357 Utilizando el método de Euler, Runge-Kutta de segundo orden y cuarto orden, con un paso de h = 1, desde x = 0 hasta x = 5, suponga que y(0) = 2. Solución En este caso, f (x, y) = 4e0,8x − 0,5y. Hay que recordar que con los métodos numéricos no se obtiene una expresión analítica de la solución, sino que lo que se obtiene son un conjunto de puntos que pertenece a la trayectoria que es solución de la ecuación. Sin embargo, para efectos de comparación, la solución analítica de esta ecuación diferencial viene dada por: y(x) = 40 4 x 14 − 1 x e3 − e 2 13 13 como el paso es de h = 1, se van a tener que calcular 6 puntos de la solución. El primero es el valor inicial que es justamente y(0) = 2. Una posible manera de implementar este problema en MATLAB se presenta en el siguiente script: clear ; clc ; %limpiamos variables f = @( x , y ) 4* exp (0.8* x ) -0.5* y ; %definición de la función h =1; % paso x0 =0; %punto inicial xf =5; %punto final x = x0 : h : xf ; % vector de x %inicialización de variables yEuler = zeros ( size ( x ) ) ; yEuler (1) =2; yRK2 = yEuler ; yRK4 = yEuler ; % % Cálculo de los tres métodos for i =1: length ( x ) -1 %Cálculo para Euler yEuler ( i +1) = yEuler ( i ) + h * f ( x ( i ) , yEuler ( i ) ) ; % Cálculo para RK2 k1 = f ( x ( i ) , yRK2 ( i ) ) ; k2 = f ( x ( i ) +3/4* h , yRK2 ( i ) +3/4* k1 * h ) ; yRK2 ( i +1) = yRK2 ( i ) + h *(1/3* k1 +2/3* k2 ) ; % Cálculo para RK4 k1 = f ( x ( i ) , yRK4 ( i ) ) ; Escuela de Ingeniería Eléctrica Universidad de Costa Rica 358 k2 = f ( x ( i ) +1/2* h , yRK4 ( i ) +1/2* k1 * h ) ; k3 = f ( x ( i ) +1/2* h , yRK4 ( i ) +1/2* k2 * h ) ; k4 = f ( x ( i ) +h , yRK4 ( i ) + k3 * h ) ; yRK4 ( i +1) = yRK4 ( i ) +1/6*( k1 +2* k2 +2* k3 + k4 ) * h ; end yreal =40/13* exp (4/5* x ) -14/13* exp ( -1/2* x ) ; % Solución real % Métrica para calcular el error errorEuler = sum ( abs ( yreal - yEuler ) * h ) ; errorRK2 = sum ( abs ( yreal - yRK2 ) * h ) ; errorRK4 = sum ( abs ( yreal - yRK4 ) * h ) ; %resultados plot (x , yreal ,x , yEuler , ' --x ' ,x , yRK2 , ' --o ' ,x , yRK4 , ' - -* ') ; legend ( ' Analítico ' ,[ ' Euler , error : ' , num2str ( errorEuler ) ] , ... [ 'RK2 , error : ' , num2str ( errorRK2 ) ] ,... [ 'RK4 , error : ' , num2str ( errorRK4 ) ] ,... ' location ' , ' northwest ') ; xlabel ( 'x ') ; ylabel ( 'y ') ; grid on ; El resultado del script es la gráfica de la Figura C.11. Como se puede observar, el método de Euler es el que presenta el mayor error, mientras que con el método de Runge-Kutta se obtiene prácticamente la solución correcta. Por supuesto, también es cierto que este paso de integración es grande y que podría mejorarse todas las soluciones haciendo el paso más pequeño. Sin embargo este ejemplo es simplemente para mostrar la manera de implementar los métodos y los posibles resultados que se pueden obtener. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 359 180 Analítico Euler, error: 72.6411 RK2, error: 15.9199 RK4, error: 0.39362 160 140 120 y 100 80 60 40 20 0 0 1 2 3 4 5 x Figura C.11: Comparación utilizando los tres métodos de resolución de ecuaciones diferenciales. Escuela de Ingeniería Eléctrica Universidad de Costa Rica D. Análisis en el espacio de estados En los capítulos 2 y 5, se trató el modelado de sistemas físicos en el espacio de estados y con funciones de transferencia. En este capítulo, se introducirá el análisis de estos modelos en el espacio de estados con los conceptos de controlabilidad y observabilidad. Ya se sabe que los distintos modelos solo representan algunos aspectos de los sistemas físicos. Sin embargo, en este capítulo se supondrá que estos modelos son lo suficientemente buenos como para utilizarlos como si fueran totalmente equivalentes a la dinámica que rige el sistema real en estudio. Por lo tanto, al analizar el modelo en espacio de estados, se supondrá que los resultados son inmediatamente trasladables al sistema real. En la sección D.1 se presenta la forma general en que se puede convertir el modelo de un sistema en el espacio de estados, a uno equivalente, mediante un cambio en la asignación de estados. En la sección D.2 se presenta el estudio de controlabilidad de un sistema mientras que en la sección D.3 se presenta el caso de la observabilidad. En la sección D.4 se muestra la relación que existe entre la controlabilidad y la observabilidad. El capítulo cierra con el estudio de la separación del espacio de estados en su parte controlable y observable mediante la Descomposición de Kalman en la sección D.5. D.1. Transformación de los modelos en variables de estado Se ha dicho en capítulos anteriores que el modelo en variables de estados no es único, puesto que basta con definir las variables de estado de manera distinta para obtener diferentes matrices del sistema. Pero también es posible encontrar una matriz de transformación que produzca una transformación lineal de un espacio de estado a otro espacio equivalente. Sea el sistema: ẋ = Ax(t) + Bu(t), y = Cx(t) + Du(t). 360 (D.1) 361 Si se define esta matriz de transformación T tal que: x(t) = Tx0 (t), (D.2) con x0 (t) la nueva definición de variables de estado. Al introducir (D.2) en (D.1) se obtiene el nuevo modelo equivalente: ẋ0 = A0 x0 (t) + B0 u(t), y = C0 x0 (t) + D0 u(t), (D.3) con A0 = T−1 AT, B0 = T−1 B, C0 = CT y D0 = D. Este tipo de transformación no modifica la ecuación característica del sistema. La ecuación característica del sistema original viene dada por |sI − A| = 0. Por otro lado la ecuación característica del sistema transformado viene dada por: |sI − A0 | = 0. (D.4) Puesto que A0 = T−1 AT, (D.4) se puede escribir como: sI − T−1 AT = 0, (D.5) y como T es invertible por definición, entonces se puede decir que T−1 T = I y por lo tanto (D.5) se puede escribir como: sI − T−1 AT = 0, sT−1 T − T−1 AT = 0, T−1 (sI − A) T = 0, T−1 |sI − A| |T| = 0, y como |T| = 6 0 por ser invertible, al final se obtiene que: |sI − A0 | = |sI − A| = 0, por lo que, al tener la misma ecuación característica, ambos modelos tienen los mismos valores propios (polos). El modelo transformado también tiene la misma función de transferencia. En el caso del sistema transformado, la función de transferencia viene dado por: G0 (s) = C0 (sI − A)−1 B0 + D0 , Escuela de Ingeniería Eléctrica Universidad de Costa Rica 362 que se puede escribir en función de las matrices originales como: G0 (s) = CT sI − T−1 AT Se puede demostrar que (sI − T−1 AT) se llega a: −1 −1 T−1 B + D. = T−1 (sI − A)−1 T, por lo que al final G0 (s) = CTT−1 (sI − A)−1 TT−1 B + D. G0 (s) = C (sI − A)−1 B + D. G0 (s) = G(s) D.1.1. Forma canónica de Jordan Una de las transformaciones más comunes es convertir un modelo en variables de estado a otro que tenga una matriz A0 que sea diagonal. A esta forma se le llama forma canónica de Jordan. Para lograr este cambio, las columnas de la matriz de transformación T corresponden a los vectores propios de la matriz A. Cabe recordar que, dado un valor propio λi de la matriz A, el vector propio vi que le corresponde a este valor propio, viene dado por: (λi I − A) vi = 0 (D.6) Tal y como lo comenta Kuo (1996), cuando los valores propios tienen multiplicidad mayor a uno, no es posible encontrar todos los vectores propios utilizando (D.6). En esos casos se utilizan los vectores propios generalizados. Suponga que se tiene un sistema de orden n de los cuales se cuenta con q valores propios distintos y un valor propio de orden m (m ≤ n − q). Puesto que se tiene un valor propio de orden m, se necesitan m ecuaciones para encontrar los m vectores propios que corresponden. Suponiendo que el valor propio de orden m es λj , estos vectores propios se pueden encontrar resolviendo las siguientes ecuaciones: (λj I − A)vn−q+1 = 0, (λj I − A)vn−q+2 = −vn−q+1 , (λj I − A)vn−q+3 = −vn−q+2 , .. .. .=. (λj I − A)vn−q+m = −vn−q+m−1 . Es decir, primero se calcula el primer vector propio con (D.6) y luego se calculan los restantes valores propios de manera iterativa, utilizando el resultado anterior. Este procedimiento solamente funciona si los valores propios son reales. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 363 D.2. Análisis de controlabilidad La definición de controlabilidad se puede encontrar en Kuo (1996): “Un estado x(t) es controlable en t = t0 si existe una entrada continua por intervalos u(t) que mueve el estado a cualquier estado final x(tf ) en un tiempo finito tf − t0 ≥ 0. Si cada estado x(t0 ) es controlable en un espacio de tiempo finito, se dice que el sistema es de estado completamente controlable o simplemente controlable”. En otras palabras, un sistema es controlable si es posible encontrar una entrada que lleve al sistema desde un estado inicial a un estado final cualquiera, en un tiempo finito. Si la ecuación de estados viene dada por: ẋ = Ax(t) + Bu(t). Partiendo del estado cero hasta un estado particular x(tf ) con una entrada u(t) se cumple que: x(tf ) = Z tf t0 Φ (tf − τ ) Bu(τ ) dτ = Z tf t0 eA(tf −τ ) Bu(τ ) dτ . (D.7) Se puede demostrar (ver Ogata (2003)) que la matriz exponencial se puede escribir de la forma: At e 2 = α0 (t)I + α1 (t)A + α2 (t)A + · · · + αn−1 (t)A n−1 = n−1 X αk Ak . (D.8) k=0 Entonces sustituyendo (D.8) en (D.7), se obtiene: x(tf ) = n−1 X k A B Z tf t0 k=0 Si se define: Z tf t0 αk (tf − τ )u(τ ) dτ . (D.9) αk (tf − τ )u(τ ) dτ = β k , entonces: x(tf ) = n−1 X (D.10) (D.11) Ak Bβ k , k=0 o de manera equivalente: x(tf ) = h B AB ··· An−1 B i β0 β1 .. . . (D.12) β n−1 Escuela de Ingeniería Eléctrica Universidad de Costa Rica 364 El estado final es combinación lineal de las columnas de la matriz Q, dada por: Q= h B AB A2 B An−1 B ··· i (D.13) . Por lo tanto, para que x(tf ) pueda ser cualquier punto del espacio de estado, es necesario que hayan por lo menos n columnas linealmente independientes en Q puesto que la dimensión del vector de estado es igual a n (Domínguez et al., 2006). De acá se desprende la condición de controlabilidad: Un sistema LTI es totalmente controlable si el rango1 de la matriz de controlabilidad Q dada por (D.13) es n A esta condición se le conoce como prueba de Kalman para controlabilidad y fue propuesta por el ingeniero eléctrico Rudolf Kálmán, quien fue el primero en proponer los conceptos de controlabilidad y observabilidad. Si la matriz Q es cuadrada, esta condición se puede verificar simplemente calculando su determinante. Si |Q| = 6 0, entonces la matriz Q es de rango máximo y el sistema es entonces controlable. D.2.1. Forma canónica controlable para sistemas SISO Se le llama sistema SISO a aquellos que tienen solamente una entrada y una salida (Single-Input Single-Output). En el caso de que el sistema sea controlable, es posible encontrar una transformación lineal de los estados que deje el sistema en la forma canónica controlable. En el caso específico de la transformación para la forma canónica controlable, si la ecuación característica del sistema viene dada por: |sI − A| = sn + an−1 sn−1 + · · · + a1 s + a0 = 0. (D.14) La matriz de transformación T se define entonces como: T = QM, (D.15) donde Q es la matriz de controlabilidad definida en (D.13) y M es: M= a1 a2 .. . an−1 1 a2 a3 .. . 1 0 ··· ··· .. . ··· ··· an−1 1 .. . 0 0 1 0 .. . 0 0 , (D.16) 1 El rango de una matriz viene dado por el número de filas o columnas que son linealmente independientes. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 365 de esta manera, el sistema queda de la forma: A0 = 0 0 .. . 0 −a0 1 0 .. . 0 −a1 0 1 .. . 0 −a2 B0 = ··· ··· .. . 0 0 .. . 0 1 ··· ··· 0 0 .. . 1 −an−1 , (D.17) . (D.18) Las matrices C y D no siguen ningún patrón en particular. D.2.2. Subespacio controlable En el caso de que el sistema no sea totalmente controlable, es posible que una parte de él sí lo sea. En ese caso, es interesante saber cuáles estados son controlables y cuáles no lo son. El subespacio controlable se define de la siguiente manera (Domínguez et al., 2006): Dado un sistema LTI de la forma: ẋ(t) = Ax(t) + Bu(t), el conjunto de puntos del espacio de estados alcanzables partiendo del estado inicial cero forman un subespacio vectorial, al que se le denomina subespacio controlable XC , generado por los vectores columna de Q. Para obtener la base que forma este subespacio lo que se debe hacer es seleccionar de la matriz Q, las columnas que sean linealmente independientes, empezando desde la izquierda. En el momento que se encuentre una columna que sea linealmente dependiente de las columnas anteriores, se descarta esa columna y todas las demás posteriores. Las columnas seleccionadas corresponden a una base del subespacio controlable. Si la dimensión del subespacio controlable es rC < n, siendo n la dimensión del vector de estado, entonces existe una matriz de transformación TC : x(t) = TC x̂(t). Escuela de Ingeniería Eléctrica (D.19) Universidad de Costa Rica 366 Subsistema controlable Subsistema no controlable Figura D.1: Separación del sistema en su parte controlable y no controlable. Entonces, la ecuación de estado del sistema transformado queda de la forma: " x̂˙ a (t) x̂˙ b (t) # " = Âaa 0 Âab Âbb #" x̂a (t) x̂b (t) # " + B̂a 0 # u(t). (D.20) El subsistema formado por la sección del estado x̂a y cuya dinámica viene representada por Âaa y B̂a , coincide con la dimensión del espacio controlable rC . La otra sección constituida por x̂b no se ve afectada por la entrada, y por lo tanto corresponde a la parte no controlable. Esta relación se puede representar gráficamente, mediante el diagrama de la Figura D.1. La matriz de transformación TC se construye a partir de la base del subespacio controlable. Lo primero que se debe hacer es formar una matriz Ta de dimensiones n × rC a partir de los vectores columna que forman el subespacio controlable. Luego se debe construir una matriz Tb formada por n − rC vectores linealmente independientes entre ellos y los vectores columna de Ta . Con estas dos matrices, se construye entonces la matriz de transformación: TC = h Ta Tb i . (D.21) En caso de que el subsistema controlable tenga algún estado inestable y el subsistema no controlable sea estable, entonces se dice que el sistema es estabilizable, es decir, mediante un controlador adecuado, es posible estabilizar el sistema. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 367 D.2.3. Cálculo de la entrada para obtener un estado determinado De acuerdo con la Sección 2.3.3, la ecuación de estados de un sistema LTI, viene dado por la ecuación (2.84). Si se sabe que el sistema es controlable y lo que se desea es obtener un estado particular x(t1 ) a partir de un estado inicial x(t0 ) en un tiempo finito t1 − t0 , entonces el problema consiste en encontrar la entrada u(t) que cumpla: x(t1 ) = Φ(t1 − t0 )x(t0 ) + Z t1 t0 Φ(t1 − τ )Bu(τ ) dτ . (D.22) Este problema tiene un infinito número de soluciones. Algunas soluciones se basan en criterios de optimización de energía (como es el caso del control óptimo), o en encontrar ciertos parámetros de una entrada con forma predeterminada que cumpla con (D.22). La entrada más común que se puede calcular es una formada por escalones. Este método en su forma más sencilla tiene dos pasos (Domínguez et al., 2006): 1. Fijar el número de escalones que se utilizarán. En general, si se quieren ajustar n variables de estado, se necesitarán n escalones diferentes cuyas alturas deben calcularse. 2. Fijar el intervalo en el que cada cada escalón deberá ser aplicado. Lo normal en este punto es fijar la longitud arbitrariamente, dándole el mismo tiempo a cada uno de los escalones (n subintervalos de igual longitud). No obstante, también sería posible incluir dentro del mismo procedimiento de cálculo, la obtención del tiempo del intervalo de cada escalón que se debe aplicar, por lo que sería posible tener un sistema con n ecuaciones (cada uno de los estados) pero con 2n − 1 grados de libertad (n diferentes alturas de escalones y n − 1 longitudes de subintervalos). D.3. Análisis de observabilidad La observabilidad se define de la siguiente manera (Kuo, 1996): “Dado un sistema lineal e invariante con el tiempo que se describe mediante las ecuaciones: ẋ(t) = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t), Escuela de Ingeniería Eléctrica (D.23) Universidad de Costa Rica 368 se dice que el estado x(t0 ) es observable si dada cualquier entrada u(t), existe un tiempo finito tf ≥ t0 tal que del conocimiento de u(t) para t0 ≤ t < tf , las matrices A, B, C, D; y la salida y(t) para t0 ≤ t < tf son suficientes para determinar x(t0 ). Si cada estado del sistema es observable para un tf finito, se dice que el sistema es totalmente observable o simplemente observable”. Es decir, que un sistema es observable si, al tener acceso a la salida y a la entrada de un sistema, es posible calcular el valor del estado. Para ello es necesario que los estados afecten las salidas de alguna manera. Si un estado no afecta las salidas, entonces no es posible calcular su valor a partir de la observación de las salidas y las entradas solamente. La salida de un sistema como el de (D.23) viene dada por: y(t) = CeAt x(0) + C Z t 0 eA(t−τ ) Bu(τ ) dτ + Du(t). (D.24) El único elemento desconocido de esta ecuación es x(0), por lo que, si se pasa todos los elementos conocidos al lado izquierdo nos queda una ecuación de la forma: ỹ(t) = CeAt x(0), (D.25) donde ỹ(t) reúne todos los elementos conocidos. Si se procede igual que en el caso de la controlabilidad a expresar la matriz exponencial en términos de una serie finita de la forma (D.8) entonces (D.25) se puede escribir de la forma: ỹ(t) = n−1 X αk (t)CAk x(0), (D.26) k=0 ỹ(t) = α0 (t)Cx(0) + α1 (t)CAx(0) + · · · + αn−1 (t)CAn−1 x(0). (D.27) Se puede demostrar (ver Ogata (2003)), que para que se pueda determinar el estado x(0) dada la salida y(t), la matriz P de tamaño n · q × n (q salidas y n estados) dada por: C CA , P= (D.28) .. . CAn−1 debe tener rango n. Entonces para probar si un sistema es observable, se puede recurrir a la siguiente prueba: Un sistema LTI es totalmente observable si el rango de la matriz de observabilidad P dada por (D.28) es n A esta prueba se le conoce como prueba de observabilidad completa de Kalman. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 369 D.3.1. Forma canónica observable para sistemas SISO Al igual que para el caso de la controlabilidad, existe una forma de convertir el MVE de un sistema observable en un MVE equivalente en su forma canónica. Supóngase que se tiene un sistema de la forma (D.1) con una ecuación característica dada por (D.14). La transformación de los estados a la forma canónica observable, viene dada por: x(t) = Tx̄(t). (D.29) Al igual que con cualquier transformación, las nuevas matrices del sistema vendrían dadas por: (D.30) Ā = T−1 AT B̄ = T−1 B C̄ = CT D̄ = D . Una vez realizada la transformación, las matrices Ā y C̄ vendrían dadas por: Ā = C̄ = h 0 1 0 .. . 1 0 ··· 0 ··· 1 ··· .. . . . . 0 ··· 0 0 0 .. . 0 0 ··· 0 −a0 −a1 −a2 .. . 0 −an−1 1 i . , (D.31) (D.32) Las matrices B̄ y D̄ no siguen ningún patrón particular. Hay que darse cuenta que la matriz Ā es igual a la transpuesta de la matriz A0 del caso de la forma canónica controlable. La transpuesta de C̄ es igual a B0 . La matriz de transformación T viene dada por: T = (MP)−1 , (D.33) donde M es la matriz dada en (D.16) y P es la matriz de observabilidad dada en (D.28). D.3.2. Subespacio no-observable Tomando como base Domínguez et al. (2006), es posible definir el subespacio no observable: “Dado un sistema lineal invariante en el tiempo definido por (D.23), el conjunto de puntos del espacio de estado tales que, tomados como estado inicial ante una entrada nula, la salida del sistema es permanentemente nula y denominados no-observables, forman un subespacio vectorial que se denomina subespacio noobservable”. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 370 Puede parecer extraño que en lugar de definir el subespacio observable, se defina en su lugar el espacio no-observable. Pero esto se debe a que, la base de este subespacio se obtiene directamente de la matriz P. Si el rango de P es rP y la dimensión del espacio de estados es n, para determinar una base del subespacio no observable, se deben determinar n − rp vectores linealmente independientes que sean ortogonales a las filas de la matriz P. Para esto se sigue el siguiente procedimiento: se buscan las filas de la matriz P que sean linealmente independientes. Una vez que se encuentra una fila que sea linealmente dependiente, se descarta esa fila y todas las demás posteriores. Con esas filas se forma la matriz Pr . Con esta matriz se busca el espacio de todos los vectores que cumplan: Pr x = 0. (D.34) A partir de (D.34) es posible obtener la base del espacio no observable. De igual forma, es posible obtener una transformación lineal que separe el subsistema observable del no observable. La matriz de transformación tiene la siguiente forma: TO = h Ta Tb i (D.35) , Tb representa una base del sistema no observable, mientras que Ta esta formada por rP vectores que sean linealmente independientes entre sí y entre ellos y la base Tb . Al aplicar la transformación x(t) = TO x̂(t), el sistema queda de la forma: " x̂˙ a x̂˙ b # " = y(t) = h Âaa Âba Ĉa 0 Âbb #" " x̂a x̂b 0 i x̂a x̂b # " + B̂a B̂b # # u(t), (D.36) + Du(t). El subsistema correspondiente a los estados en x̂a representa la parte del sistema que es observable. Como se puede observar en la Figura D.2, la parte del sistema que no es observable, está desconectada de la salida, por lo que, cualquier cambio que ocurra en xb (t) no se verá reflejado en la salida, lo que hace a estas variables de estado no observables. Si los estados asociados a la parte no observable son estables, entonces se dice que el sistema es detectable. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 371 Subsistema observable Subsistema no observable Figura D.2: Sistema separado en su parte observable y no observable. D.4. Principio de dualidad Existe una relación entre controlabilidad y observabilidad para los sistemas LTI (Ogata, 2003). Si se tiene un sistema S1 de la forma: ẋ(t) = Ax(t) + Bu(t), y(t) = Cx(t), con n estados, p entradas y q salidas, con las matrices A, B, C de dimensiones correspondientes, el sistema dual S2 viene definido por: ż(t) = A∗ z(t) + C∗ v(t), w(t) = B∗ z(t), (D.37) donde z(t): es un vector de estado (dimensión n). v(t): es un vector de entrada (dimensión q). w(t): es un vector de salida (dimensión p). A∗ : es la transpuesta conjugada de A. B∗ : es la transpuesta conjugada de B. C∗ : es la transpuesta conjugada de C. El principio de dualidad indica que el sistema S1 es completamente controlable (observable) si el sistema dual S2 es completamente observable (controlable). Escuela de Ingeniería Eléctrica Universidad de Costa Rica 372 D.5. Descomposición de Kalman Si un sistema no es completamente observable ni completamente controlable, es posible escribirlo de manera que las partes controlables y observables estén separadas (Domínguez et al., 2006). Partiendo de un sistema en la forma de MVE: ẋ(t) = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t), existe una TCO invertible con la que se puede realizar un cambio de base de la forma: x(t) = TCO x̂(t), (D.38) de manera que las matrices transformadas queden de la forma: Â = T−1 CO ATCO = 0 Âbb 0 0 Âaa Âba 0 0 B̂ = T−1 CO B Ĉ = CTCO = h = Ĉa B̂a B̂b 0 0 Âac Âbc Âcc Âdc 0 Âbd 0 Âdd , (D.39) , 0 Ĉc (D.40) 0 i . (D.41) Los estados transformados quedan de la forma: x̂ = h x̂aT x̂bT x̂cT x̂dT iT , (D.42) así, el subsistema asociado a los estados transformados x̂a , caracterizado por las h i matrices Âaa , B̂a , Ĉa es totalmente controlable y observable. A este subsistema se le llama realización mínima del sistema, porque la función de transferencia que se obtiene a partir de él es exactamente igual a la que se obtendría utilizando el sistema completo. Entonces, por ello se dice que, un MVE es una realización mínima del sistema si y solo si es controlable y observable. Los estados formados por x̂a y x̂b , son los estados controlables del sistema, asociados al subsistema: "" # " # # h i Âaa 0 B̂a , , Ĉa 0 . Âba Âbb B̂b Escuela de Ingeniería Eléctrica Universidad de Costa Rica 373 Subsistema controlable y observable Subsistema no controlable y observable Subsistema no controlable y no observable Subsistema controlable y no observable Figura D.3: Separación del sistema en sus partes controlables y observables. Y por último, los estados x̂a y x̂c están asociados a un subsistema totalmente observable caracterizados por las matrices: "" Âaa 0 Âac Âcc # " , B̂a 0 # , h Ĉa Ĉc # i . Esta separación se puede apreciar gráficamente en la Figura D.3. La parte del sistema que es totalmente controlable está conectado de alguna manera con las entradas del sistema, por lo que, por medio de la manipulación de estas, es posible cambiar el valor de los estados asociados. En el caso de la parte del subsistema observable, los estados están conectados de alguna manera a la salida del sistema, por lo que, es posible detectar variaciones en estos estados a partir de la salida. Hay una parte del sistema que no es ni controlable ni observable, lo que significa que sus estados evolucionan de manera independiente de las entradas y tampoco afectan la salida del sistema. Es claro entonces que si los estados asociados a este subsistema son inestables, será imposible controlar de manera correcta la evolución del sistema puesto que, no habrá opción de cómo controlarlos ni tampoco será posible detectar esta inestabilidad en la salida. Escuela de Ingeniería Eléctrica Universidad de Costa Rica 374 Cálculo de la matriz TCO La matriz de transformación TCO tiene la forma: TCO = h Ta Tb Tc Td i . (D.43) Las distintas submatrices se deben calcular en este orden (Domínguez et al., 2006): Tb : Es una matriz que contiene una base del subespacio que se obtiene de la intersección entre el subespacio no observable y el subespacio controlable. Es decir, se debe encontrar una base que defina al conjunto de vectores que pertenezcan tanto al espacio controlable como al no observable. Ta : Los vectores columna de Ta junto con los vectores de Tb , tienen que formar una base del subespacio controlable. Es decir, Ta contiene un conjunto de vectores linealmente independientes entre sí y entre los vectores de Tb , que en conjunto forman una base del subespacio controlable. Td : Los vectores columna de Td junto con los vectores de Tb , tienen que formar una base del subespacio no observable. Es decir, Td contiene un conjunto de vectores linealmente independientes entre sí y entre los vectores de Tb , que en conjunto forman una base del subespacio no observable. Tc : Es un conjunto de vectores que, en conjunto con Ta , Tb y Td , forman una base del espacio de estado. Ejemplo D.1 Obtener un MVE equivalente en el que se separe la parte controlable y la observable del sistema dado por: A= B= C= Escuela de Ingeniería Eléctrica h 2 −3 −3 −3 3 0 3 2 2 −2 −3 3 −4 0 −1 −2 4 0 3 0 2 0 3 −3 4 −1 1 3 −4 0 −2 , , 3 2 0 5 i . Universidad de Costa Rica 375 Solución: Lo primero que se debe hacer en este caso es obtener las bases de los subespacios controlable y no observable. Aplicando la prueba de Kalman de controlabilidad se obtiene: Q= = A2 B A3 B A4 B h B 0 3 −3 9 −15 3 −4 6 −10 18 2 −2 2 −2 2 . 2 −5 5 −11 17 −2 5 −5 11 −17 AB i (D.44) El rango de la matriz Q es 3, por lo que el sistema no es completamente controlable. Una base del sistema vendría dada por las 3 primeras columnas linealmente independientes de Q. Sin embargo, siempre es mejor simplificar estas bases. La manera de simplificar la base es la siguiente: se forma una matriz cuyas filas son iguales a las columnas de los vectores de la base del subespacio controlable. Se reduce esta matriz hasta que se llegue a una forma escalonada. Las filas que resultan corresponden a la base simplificada del subespacio. Realizando este procedimiento con las primeras tres columnas de Q se obtiene la base para el subespacio controlable: BC = 1 0 0 −1 1 , 0 1 0 0 0 , 0 0 1 1 −1 . (D.45) Realizando la prueba de Kalman para observabilidad, se obtiene el siguiente resultado: C −3 3 2 0 5 CA −6 0 8 0 8 2 6 8 0 14 P= (D.46) CA = −12 . 3 CA −24 −6 32 0 26 CA4 −48 18 32 0 50 El rango de esta matriz también es igual a 3, lo que significa que la dimensión del subespacio no observable es igual a 2. Para obtener la base del subespacio, hay que Escuela de Ingeniería Eléctrica Universidad de Costa Rica 376 resolver el siguiente sistema de ecuaciones: −3 3 2 0 −6 0 8 0 −12 6 8 0 5 8 14 x1 x2 x3 x4 x5 = 0. (D.47) Puesto que se tienen tres ecuaciones pero cinco variables, el sistema quedará dependiendo de dos parámetros f y g. Al reducir el sistema de ecuaciones se encuentra la siguiente solución x1 = 0, x2 = −f , x3 = −f , x4 = g y x5 = f , es decir, la solución general se puede escribir de la forma: x1 x2 x3 x4 x5 =f 0 −1 −1 0 1 +g 0 0 0 1 0 . (D.48) Por lo tanto, una base para el subsistema no observable viene dada por: BŌ = 0 −1 −1 0 1 , 0 0 0 1 0 . (D.49) El siguiente paso es encontrar una base para el subespacio que es intersección del subespacio controlable y el no observable BC ∩ BŌ . Una manera para encontrar este espacio es definir las ecuaciones algebraicas que definen cada uno de estos subespacios y encontrar el vector que satisfaga todas las ecuaciones al mismo tiempo. Para el caso del subespacio no observable, se verifica que los vectores que pertenecen a este subespacio deben cumplir: x1 = 0 x2 = −x5 (D.50) x3 = −x5 Para el caso del subespacio controlable, la ecuación que define el subespacio viene dada por: x4 = −x5 . (D.51) Escuela de Ingeniería Eléctrica Universidad de Costa Rica 377 Puesto que los componentes x1 , x2 y x3 pueden tomar cualquier valor independientemente de los otros componentes del vector de estados. El sistema formado por (D.50) y (D.51), forma un sistema de cuatro ecuaciones con cinco variables, por lo que la solución dependerá de un parámetro. Al resolver el sistema se llega a: x1 x2 x3 x4 x5 a = 0 −1 −1 −1 1 , (D.52) por lo tanto, la base del subespacio que es intersección del subespacio controlable y no observable, viene dado por: BC∩Ō = 0 −1 −1 −1 1 . (D.53) Con todas estas bases es posible encontrar las submatrices de TOC : La matriz Tb es la base de BC∩Ō : Tb = 0 −1 −1 −1 1 . Ta junto con Tb deben ser base del espacio controlable. Entonces, basta tomar dos vectores de BC que sean linealmente independientes de Tb , por lo tanto: Ta = 1 0 0 −1 1 0 1 0 0 0 . Td junto con Tb deben ser una base del subespacio no observable. Por lo que basta tomar un vector de BŌ que sea linealmente independiente de Tb . Se Escuela de Ingeniería Eléctrica Universidad de Costa Rica 378 puede elegir por ejemplo: 0 −1 −1 0 1 Td = . Puesto que el espacio de estados es de dimensión 5 (se trata de R5 ), y se tienen 4 vectores linealmente independientes, solo es necesario encontrar un vector linealmente independiente de los demás para formar el espacio de estados. Por simplicidad, se puede escoger: Tc = 1 0 0 0 0 . Por lo tanto, la matriz de transformación queda definida como: TCO = h Ta Tb Tc Td i = 1 0 0 −1 1 0 1 0 0 0 0 1 0 −1 0 −1 −1 0 −1 . −1 0 0 1 0 1 (D.54) De esta manera, las matrices transformadas quedan de la forma: Â = TCO −1 ATCO = 1 3 0 0 0 0 −2 0 0 0 0 0 −1 3 0 0 0 0 2 0 0 0 0 0 −1 B̂ = TCO −1 B = Ĉ = CTCO = h 2 3 0 1 −2 0 0 , (D.55) , 0 −3 (D.56) 0 i , (D.57) por lo tanto se obtienen los siguientes resultados: Escuela de Ingeniería Eléctrica Universidad de Costa Rica 379 " D.6. Aaa = Aba = Abc Acc 1 3 0 −2 # " 0 0 Aac = Abb = −1 =3 Abd =0 =2 Adc =0 h 0 0 i Add = −1 Ba = Bb = −2 Ca = Cc = −3 " 0 1 h 2 # # 3 i Ejercicios resueltos Prueba de Kalman Ejercicio D.1 Sea un sistema caracterizado por el siguiente modelo en variables de estado: 1 0 2 1 ẋ(t) = 2 1 −1 x(t) + 2 u(t), 0 1 3 0 y(t) = h 0 1 0 i x(t). Determine si el sistema es completamente controlable. Solución: Como se solicita determinar si el sistema es totalmente controlable, se debe realizar la prueba de Kalman, la cual indica que si la matriz de controlabilidad Q definida por: Q= Escuela de Ingeniería Eléctrica h B AB A2 B ··· An−1 B i , Universidad de Costa Rica 380 posee n columnas linealmente independientes, el sistema es completamente controlable. En este caso: 1 0 2 1 A = 2 1 −1 B = 2 n = 3, 0 1 3 0 donde n es el número de estados del modelo en variables de estado, por lo tanto: Q= h B A2 B AB 1 1 = 2 2 0 0 1 = 2 0 1 4 2 i , 2 0 2 1 1 0 2 1 1 −1 · 2 2 1 −1 · 2 , 1 3 0 0 1 3 0 5 4 . 10 Para verificar si Q posee n columnas linealmente independientes y dado que Q es cuadrada, lo más fácil es calcular su determinante, si el resultado es distinto de cero, Q posee n columnas linealmente independientes y el sistema será completamente controlable. Por lo tanto: 1 det(Q) = 2 0 1 4 2 5 4 = 32. 10 Como el determinante de Q es distinto de cero posee n columnas linealmente independientes y el sistema es completamente controlable. Ejercicio D.2 Sea un sistema caracterizado por el siguiente modelo en variables de estado: 1 ẋ(t) = 0 1 y(t) = h 0 0 1 1 −1 1 −1 x(t) + 2 3 0 1 0 i 0 1 u(t), 1 x(t). 1. ¿Cuántas entradas tiene el sistema? 2. Determine si el sistema es completamente controlable Escuela de Ingeniería Eléctrica Universidad de Costa Rica 381 3. Determine si el sistema es completamente controlable utilizando cada una de las entradas. Solución: 1) Como la matriz B es de tamaño 3 × 2, entonces, necesariamente existen dos entradas en este sistema, por lo que el vector de entradas se puede redefinir como: " u(t) = u1 (t) u2 (t) # . 2) La matriz de controlabilidad para este sistema es: Q= h B 1 = 2 0 1 = 2 0 A2 B AB i , 0 1 1 0 1 1 0 1 1 0 −1 1 1 −1 2 1 3 0 1 −1 2 0 3 4 0 1 1 0 1 1 0 1 1 2 −1 1 −1 2 3 0 0 1 1 −2 −5 −1 −4 , 12 11 de donde se obtiene que su rango es 3 (se deja como ejercicio demostrarlo), por lo que el sistema es completamente controlable. 3) Si solo se usa la primera entrada, la matriz B se puede “reescribir” como: B1 = h 1 2 0 iT , por lo que la matriz de controlabilidad Q1 sería: Q1 = h B1 AB1 A2 B 1 1 1 = 2 0 0 1 1 = 2 0 0 1 1 i , −1 1 1 −1 2 0 3 0 1 0 1 1 2 −1 1 −1 2 , 3 0 1 −2 2 −1 . 3 12 Calculando el determinante de Q1 se observa que éste es distinto de cero (da −9), por lo que el sistema es controlable utilizando la primera entrada. Si se utiliza la segunda entrada se tiene: h iT B1 = 0 1 1 , Escuela de Ingeniería Eléctrica Universidad de Costa Rica 382 entonces: Q2 = h B2 AB2 A2 B 2 0 1 0 = 1 0 1 1 1 1 i , −1 0 1 −1 1 0 3 1 1 2 0 1 1 −1 0 −1 1 , 3 1 0 −1 −5 = 1 0 −4 . 1 4 11 y como det(Q2 ) = −5 6= 0 se tiene que la matriz posee 3 vectores columna l.i. y el sistema es completamente controlable utilizando la segunda entrada. Ejercicio D.3 Determine si es posible calcular el valor de los estados de sistema definido por: " A= −2 −1 0 −1 # " C= a 0 0 b # , a partir de las mediciones realizadas a las salidas. Solución: Si se solicita verificar si el vector de estados se puede determinar a partir de las mediciones de la salida se está solicitando realizar un análisis de reconstructibilidad, para ello, se puede determinar el rango de la matriz de reconstructibilidad P definida como: C CA , P= .. . CAn−1 donde n es el número de estados del sistema, si el rango de la matriz P es igual al número de estados quiere decir que el sistema sí es observable. Como A es de tamaño 2 × 2, n = 2 (de paso, como C es de tamaño 2 × 2 hay dos salida en el sistema), así, la matriz de controlabilidad sería: a 0 0 b P= Escuela de Ingeniería Eléctrica a 0 0 b ! ! −2 −1 0 −1 ! = a 0 0 b −2a −a 0 −b , Universidad de Costa Rica 383 con el primer vector fila de P se pueden cancelar todos los primeros elementos de las restantes filas, además, se puede utilizar la segunda fila para eliminar a todos los segundos elementos también, por lo tanto, el rango de P es dos y el sistema es completamente observable (siempre y cuando a 6= 0 y b 6= 0). Un aspecto importante de este ejercicio es que como: y(t) = Cx(t), siempre que la matriz C sea cuadrada e invertible se tiene que: x(t) = C−1 y(t), por lo que conociendo el vector de salida y la matriz C se pueden determinar todos los estados del sistema. No obstante, la matriz C casi nunca es cuadrada e invertible a la vez. Ejercicio D.4 Determine si existe un valor del matrices: 0 A= 2 0 parámetro a para que el sistema definido por las 0 6 h 0 0 C= 1 a 0 0 1 i , no sea observable. En este caso, la matriz de observabilidad sería: h C P = CA = CA2 h h 1 0 1 0 1 i 1 i 1 0 1 0 2 0 0 2 0 i 0 0 a 0 0 a 6 0 0 6 0 0 2 1 0 1 a 6 = 0 . 2a 6a 0 Para saber si el sistema es totalmente observable, P debe ser invertible (o sea, poseer tres vectores fila linealmente independientes). El determinante de P es det(P) = (−36a) + (−2a2 ) = −2a2 − 36a, el cual será cero para a = 0 y a = −18, por lo que si a = 0 o a = −18, P no poseería tres filas linealmente independientes y el sistema no sería totalmente observable. Escuela de Ingeniería Eléctrica Universidad de Costa Rica Índice alfabético Actuador, 12 Caja blanca, 24 gris, 25 negra, 25 Ceros, 61, 282, 293 de fase no mínima, 134, 135, 276 Cifras significativas, 335 Controlabilidad, 363 Controlador, 11 Curva de reacción, 126 Descomposición, 32 Descomposición de Kalman, 372 Detectabilidad, 370 Diagrama de bloques, 90 Diagrama de Bode, 277 inverso, 288 Diagrama de flujo, 103 Diagrama polar, 290 Ecuación característica, 115 Ecuación de Bernoulli, 190 Engranes, 170 Entradas, 18 determinísticas, 18 estocásticas, 18 Estabilidad, 114 criterio de Routh-Hurwitz, 119 Estabilizabilidad, 366 Estado, 27, 28 alcanzable, 31 cero, 31 estacionario, 31, 195 Factor de amortiguamiento, 284 Factor derivativo, 279, 291 Factor integral, 279, 291 Forma canónica controlable, 364 observable, 369 Función de transferencia, 59 Ganancia, 126, 279 Half rule, 136 Homogeneidad, 32 IEEE 754, 336 Impedancia, 63 Inercia rotacional, 168 Ley de Fourier, 183 Ley de Ohm, 35 Leyes de Kirchhoff, 36, 64 Linealidad, 31 Linealización, 198 LTI, 55 Ludwig von Bertalanffy, 10 Método numérico de la secante, 343 diferencias centradas, 346 Euler, 353 384 385 falsa posición, 339 Newton-Raphson, 341 primera derivada hacia adelante, 346 primera derivada hacia atrás, 346 regla del trapecio, 348 Runge-Kutta, 353 Masa, 160 Matriz de transición de estados, 54 Matriz exponencial, 53 Medio, 14 Modelado analítico, 24 experimental, 26 Modelos anticipativos, 23 causales, 23 con memoria, 23 definición, 19 estáticos, 195 invariantes en el tiempo, 22 lineales, 22 no lineales, 22 parámetros concentrados, 23 parámetros distribuidos, 23 sin memoria, 24 tiempo continuo, 21 tiempo discreto, 21 variantes en el tiempo, 22 Motor de corriente directa, 178 Parámetros, 15 Perturbaciones, 18 Pervariable, 154 π, 334 Pico de resonancia, 285 Polos, 61, 115, 281, 293 dominantes, 136 Principio de dualidad, 371 Propiedad Escuela de Ingeniería Eléctrica de muestreo, 17 Reactancia capacitiva, 64 inductiva, 63 Red generalizada, 154 Redondeo, 335 Relación Entrada Salida, 28 Relación Entrada Salida Estado, 28 Resorte de torsión, 170 Respuesta a entrada cero, 52, 60 a estado cero, 58 al impulso, 58 en frecuencia, 271 forzada, 16, 18 natural, 16, 18 Retardo, 124, 126, 276, 294 Salidas, 18 Segunda ley de Newton, 160 Sensor de nivel, 11 Sistema, 14, 27 conceptual, 14 dual, 371 eléctrico, 33, 156 electromecánico, 172 físico, 14 hidráulico, 187 mecánico rotacional, 166 mecánico traslacional, 159 térmico, 182 Sistema de primer orden más tiempo muerto, 125 Sistema de segundo orden más tiempo muerto, 127 Skogestad, 136 Superposición, 22, 32 Teoría General de Sistemas, 10 Universidad de Costa Rica 386 Tiempo muerto, 126 Transformada de Laplace, 29 Transvariable, 154 Universo, 14 Valores propios, 115 Variables de estado, 16, 28, 44, 48 propiedades, 30 Escuela de Ingeniería Eléctrica Universidad de Costa Rica