t,θ - Pontificia Universidad Javeriana

Anuncio
IDENTIFICACION DE SISTEMAS
IDENTIFICACIÓN PARAMÉTRICA
Ing. Fredy Ruiz Ph.D.
[email protected]
Maestría en Ingeniería Electrónica
Pontificia Universidad Javeriana
2013
Identificación paramétrica
• En general un sistema dinámico LTI esta descrito
como:
• Con v(t) representado como un proceso
estocástico w.s.s.
• v(t) se modela como ruido blanco filtrado.
PROBLEMA: el problema de la estima de un
sistema dinámico es un problema infinito
dimensional.
Métodos paramétricos
• El objetivo de los métodos de identificación
paramétrica es:
Transformar el problema de la estima de un
sistema dinámico (infinitos parámetros) en un
problema de estima paramétrica (con dimensión
finita).
• Para reducir la dimensión del vector de parámetros
se considera que el sistema pertenece a un
conjunto de modelos,
modelos parametrizado por un
vector de parámetros
Métodos paramétricos
• Para reducir la dimensión del vector de parámetros
se considera que el sistema pertenece a un
conjunto de modelos,
modelos con una estructura fija
M(θ), definido por un vector de parámetros,
limitados a un subconjunto DM de Rd:
• A cada valor de θ corresponde un sistema:
Métodos paramétricos
• Además de parametrizar las funciones de
transferencia G(q,θ) y H(q,θ) en
• El modelo M(θ) puede incluir un modelo
estocástico de e(t):
– por ejemplo su varianza λ(θ)
– O parametrizar la entera función de
probabilidad de e(t):
Métodos paramétricos
• La información experimental disponible esta dada
por un 'batch' de N muestras de entrada-salida.
PROBLEMA DE IDENTIFICACION
PARAMETRICA
Determinar, a partir de la información disponible
en ZN, un vector de parámetros adecuado y
por ende, un modelo
en la familia
considerada
Métodos paramétricos
• De manera formal, un algoritmo de estima
paramétrica es una función que mapea cada
punto del espacio de medidas ZN, en un punto del
espacio de parámetros DM.
La pregunta es:
Como determinar cual es un “buen” modelo?
Hipótesis:
La dimensión del espacio de medidas es mucho
mayor que la dimensión del espacio de
parámetros
Métodos paramétricos
Algunos de los criterios para determinar un
“buen” modelo son:
• Minimización del error de predicción: Buscar un
modelo que sea capaz de predecir la salida del
sistema, conociendo los datos pasados.
• Maximum likelihood: Asumir que la f.d.p. De los
datos esta parametrizada por θ.
• Principio de Ortogonalidad: Elegir un modelo que
genere un error de predicción independiente
(descorrelacionado) de los datos pasados.
Métodos paramétricos
Antes de continuar, necesitamos aclarar:
• Error de predicción. Dado un modelo, cuál es la
mejor estima de la salida, conociendo los datos
pasados?
• Clases de modelos. Qué sub-conjuntos del espacio
de los sistemas LTI podemos usar?
Simulación y predicción
• Un modelo de un sistema tiene como uso
primordial simular la respuesta del sistema
ante varios tipos de entradas.
– Dado un modelo
y(t)=G(z)u(t)+H(z)e(t)
con u(t) conocida y e(t) ruido blanco, es posible simular
y'(t)=G(z)u'(t)
como la respuesta del sistema ante un ingreso.
– Generando números (pseudo)aleatorios es
posible también calcular los disturbios que
afectan la salida como:
v'(t)=H(z)e'(t)
Predicción
• Otro uso de un modelo es predecir los
valores futuros de la salida, dado el
conocimiento de la entrada y la salida, hasta
el instante actual.
• CASO 1: Sistema sin entradas exógenas:
u(t)=0, para todo t.
• En este caso
y(t) =H(z) e(t) = h(t)*e(t)
Predicción
El sistema inverso:
e(t)=H(z)-1 v(t)
– existe, es estable y causal si H(z) es una
factorización espectral del proceso v(t).
Entonces:
– H(z) es estable con inversa estable
– H(z) es mónico: h(0)=1.
Es posible recuperar e(t) con un filtro
blanqueador.
Predicción
• Tenemos que
recordando que h(0)=1.
• Definimos
• Teniendo en cuenta que e(t) tiene media cero, y es
independiente de e(t-1), e(t-2),...
Predicción
• La estima
corresponde al valor esperado condicionado de
v(t) y también minimiza el valor esperado del
error cuadrático medio
Predicción
Ejercicio:
• verificar que la estíma óptima a un paso,
para un sistema con ingreso es:
Tip: use la invertibilidad de H(z).
• Determiné cuánto es el error de predicción.
Clases de modelos
Se consideran clases de sistemas representados por
funciones de transferencia racionales:
– Polos y ceros
– Ecuación de diferencias
– Características del ruido de proceso
Ejemplos:
– ARX
– OE (diferencia fundamental con ARX)
– FIR
– Box-Jenkins
Clases de modelos
El modelo más sencillo considera que el ruido
afecta la ecuación:
• El vector de parámetros es:
• Represente este sistema como un diagrama de
bloques y determine su predictor a un paso.
Clases de modelos
Un modelo un poco más complejo realiza un
promedio móvil sobre el ruido:
• El vector de parámetros es:
• Represente este sistema como un diagrama de
bloques y determine su predictor a un paso.
Prediction error methods
• Históricamente, una de las principales
aplicaciones de los modelos identificados es
realizar predicciones.
• Se considera que el error de predicción es un buen
criterio para decidir si un modelo describe los
datos observados de manera adecuada.
• Se define entonces el error de predicción como
y se considera que un “buen” modelo es aquel que
produce pequeños errores de predicción cuando se
aplica a los datos observados.
Métodos paramétricos
• Para reducir la dimensión del vector de parámetros
se considera que el sistema pertenece a un
conjunto de modelos,
modelos con una estructura fija
M(θ), definido por un vector de parámetros,
limitados a un subconjunto DM de Rd:
• A cada valor de θ corresponde un sistema:
• Y un predictor a un paso:
con
Prediction error methods
• Con la información disponible es posible evaluar
el error de predicción
– Cada elemento de la clase
tiene asociado un predictor
que a cada instante t, depende únicamente de los
valores pasados de y(t) y de u(t).
Es posible evaluar ε(t,θ), dado θ, para t=1, 2, ... ,N.
Prediction error methods (PEM)
Un algoritmo de identificación PEM consiste en
seleccionar un modelo en la clase que presente el
menor error de predicción posible.
Problema: ε(t,θ) es una secuencia definida para
t=1, 2, ... ,N, que significa ε(t,θ) pequeño?
Dado un conjunto de datos ZN y un modelo
parametrizado por θ, ε(t,θ) puede ser interpretado
como un vector en RN y su tamaño pude ser
medido usando alguna norma en RN, cuadrática o
no.
Prediction error methods (PEM)
En primer lugar, se genera una versión filtrada del
error de predicción:
y se define la siguiente norma del error filtrado:
donde
es una función escalar de εF(t,θ),
usualmente positiva.
VN(θ, ZN) es una función escalar bien definida de θ y
es una medida adecuada de la calidad de un modelo
M(θ).
Prediction error methods (PEM)
El algoritmo de estima de minimización del error de
predicción se define como
Esta ecuación define varias familias de métodos de
identificación, que se diferencian en la función l( )
que mide el error a cada instante de tiempo, el
prefiltro L(q), la estructura de la familia de modelos
M(θ) asi como el método de optimización usado
para resolver el problema de minimización.
PRE-FILTRAJE
El filtro L(q) permite considerar interdependencias o
correlaciones entre los errores de predicción en
diferentes instantes de tiempo.
- L(q) pasabajos elimina los errores de alta frecuencia.
- L(q) con un cero en 1, elimina errores constantes
(offset).
- Es posible diseñar un filtro L(q) para enfatizar la
banda en la cual me interesa pesar el error.
PRE-FILTRAJE
Para un sistema de la forma:
El error de predicción filtrado es
Por lo tanto, equivale a cambiar el modelo de ruido
H(q,θ) por:
En conclusión, para sistemas lineales, el prefiltraje no
ofrece un beneficio “a priori”.
Norma del error
Otro elemento de la función de costo que aun no ha
sido definido es la función l(ε(t,θ)) que “mide” el
tamaño del error a cada instante t.
La función mas usada es una norma cuadrática:
Una función cuadrática es conveniente por motivos
computacionales y teóricos.
Existen aproximaciones en las cuales se gana robustez
usando otras normas, por ejemplo el valor absoluto
del error.
Minimización del error cuadrático
Consideremos la siguiente función de costo:
para el sistema
con
VN(θ, ZN) es la norma euclidiana (o energía)del error.
Realizando la DFT de la secuencia de errores ε(t,θ):
de la relación de Parseval se cumple que:
Minimización del error cuadrático
Definiendo
De los resultados de análisis espectral, la DFT de
w(t,θ) es:
con
Definiendo s(t,θ) = y(t) – w(t,θ)
se tiene
Finalmente,
tiene DFT
Minimización del error cuadrático
Reemplazando
y
en VN(θ, ZN) se obtiene
Minimización del error cuadrático
Recordando la definición de la ETFE
la función de costo VN(θ, ZN) se puede reescribir
como:
con
que aproximando como una integral resulta:
Minimización del error cuadrático
para modelos ARX
La familia mas sencilla de modelos es la siguiente
ecuación de diferencias:
definiendo:
Minimización del error cuadrático
para modelos ARX
M(θ) es
con:
El predictor optimo es:
recordando que A(q) y B(q) son polinomios en q y
definiendo el regresor:
el predictor se puede escribir como:
Minimización del error cuadrático
para modelos ARX
El error de predicción es
y la función de costo
corresponde a la función de costo de una estima por
mínimos cuadrados, con solución:
Minimización del error cuadrático
para modelos ARX
Llamando R(N)la matriz
cada uno de los elementos de esta matriz es de la
forma:
además de sumas similares de u(t-i)u(t-j) y de
términos cruzados y(t-i)u(t-j). Es decir, son estimas
de las funciones de correlación de u y y , y de su
correlación cruzada.
Minimización del error cuadrático
para modelos ARX
Hipoticemos que los datos has sido generados por un
sistema
La estima de mínimos cuadrados es
Las propiedades estadísticas de la estima dependen del
comportamiento de vo(t), que es el error del
estimador óptimo, NO el disturbio que actúa sobre
el sistema.
Minimización del error cuadrático
para modelos ARX
En el límite cunando N va a infinito tenemos:
Además:
Por lo tanto:
Minimización del error cuadrático
para modelos ARX
Por lo tanto la estima converge a:
Para que la estima sea consistente se debe cumplir:
• R* no singular: esto se cumple si u es
persistentemente excitante (se estudiará luego).
• h*=0: esto se cumple si:
– vo(t) es ruido blanco y por lo tanto independiente
del regresor
;
o
– na= 0 y por lo tanto el regresor no depende de
valores pasados de y(t). (sistema FIR).
TAREA
Dado el sistema
y(t)=1.2y(t-1)-0.32y(t-2)+u(t-1)+0.5u(t-2)+e(t)
con e(t) i.i.d. Gausiano con media cero y varianza 1.
1) Generar conjuntos de datos de identificación utilizando una
entrada u(t) construida como una realización de un proceso
estocástico i.i.d. con media 1 y varianza 4, e(t) ruido blanco
gausiano de varianza unitaria. Variando la duración del
experimento, desde N=100 hasta N=1000
2) Realizar estimas de la respuesta en frecuencia del sistema (ETFE
y SPA) y de la perturbación v(t). Graficar el comportamiento
de la estima a medida que aumenta N.
3) Estimar estructuras ARX en las clases:
• na=2 nb=2
• na=2, nb=1
• na=1, nb=1
Descargar