IDENTIFICACION DE SISTEMAS IDENTIFICACIÓN PARAMÉTRICA Ing. Fredy Ruiz Ph.D. ruizf@javeriana.edu.co Maestría en Ingeniería Electrónica Pontificia Universidad Javeriana 2013 Identificación paramétrica • En general un sistema dinámico LTI esta descrito como: • Con v(t) representado como un proceso estocástico w.s.s. • v(t) se modela como ruido blanco filtrado. PROBLEMA: el problema de la estima de un sistema dinámico es un problema infinito dimensional. Métodos paramétricos • El objetivo de los métodos de identificación paramétrica es: Transformar el problema de la estima de un sistema dinámico (infinitos parámetros) en un problema de estima paramétrica (con dimensión finita). • Para reducir la dimensión del vector de parámetros se considera que el sistema pertenece a un conjunto de modelos, modelos parametrizado por un vector de parámetros Métodos paramétricos • Para reducir la dimensión del vector de parámetros se considera que el sistema pertenece a un conjunto de modelos, modelos con una estructura fija M(θ), definido por un vector de parámetros, limitados a un subconjunto DM de Rd: • A cada valor de θ corresponde un sistema: Métodos paramétricos • Además de parametrizar las funciones de transferencia G(q,θ) y H(q,θ) en • El modelo M(θ) puede incluir un modelo estocástico de e(t): – por ejemplo su varianza λ(θ) – O parametrizar la entera función de probabilidad de e(t): Métodos paramétricos • La información experimental disponible esta dada por un 'batch' de N muestras de entrada-salida. PROBLEMA DE IDENTIFICACION PARAMETRICA Determinar, a partir de la información disponible en ZN, un vector de parámetros adecuado y por ende, un modelo en la familia considerada Métodos paramétricos • De manera formal, un algoritmo de estima paramétrica es una función que mapea cada punto del espacio de medidas ZN, en un punto del espacio de parámetros DM. La pregunta es: Como determinar cual es un “buen” modelo? Hipótesis: La dimensión del espacio de medidas es mucho mayor que la dimensión del espacio de parámetros Métodos paramétricos Algunos de los criterios para determinar un “buen” modelo son: • Minimización del error de predicción: Buscar un modelo que sea capaz de predecir la salida del sistema, conociendo los datos pasados. • Maximum likelihood: Asumir que la f.d.p. De los datos esta parametrizada por θ. • Principio de Ortogonalidad: Elegir un modelo que genere un error de predicción independiente (descorrelacionado) de los datos pasados. Métodos paramétricos Antes de continuar, necesitamos aclarar: • Error de predicción. Dado un modelo, cuál es la mejor estima de la salida, conociendo los datos pasados? • Clases de modelos. Qué sub-conjuntos del espacio de los sistemas LTI podemos usar? Simulación y predicción • Un modelo de un sistema tiene como uso primordial simular la respuesta del sistema ante varios tipos de entradas. – Dado un modelo y(t)=G(z)u(t)+H(z)e(t) con u(t) conocida y e(t) ruido blanco, es posible simular y'(t)=G(z)u'(t) como la respuesta del sistema ante un ingreso. – Generando números (pseudo)aleatorios es posible también calcular los disturbios que afectan la salida como: v'(t)=H(z)e'(t) Predicción • Otro uso de un modelo es predecir los valores futuros de la salida, dado el conocimiento de la entrada y la salida, hasta el instante actual. • CASO 1: Sistema sin entradas exógenas: u(t)=0, para todo t. • En este caso y(t) =H(z) e(t) = h(t)*e(t) Predicción El sistema inverso: e(t)=H(z)-1 v(t) – existe, es estable y causal si H(z) es una factorización espectral del proceso v(t). Entonces: – H(z) es estable con inversa estable – H(z) es mónico: h(0)=1. Es posible recuperar e(t) con un filtro blanqueador. Predicción • Tenemos que recordando que h(0)=1. • Definimos • Teniendo en cuenta que e(t) tiene media cero, y es independiente de e(t-1), e(t-2),... Predicción • La estima corresponde al valor esperado condicionado de v(t) y también minimiza el valor esperado del error cuadrático medio Predicción Ejercicio: • verificar que la estíma óptima a un paso, para un sistema con ingreso es: Tip: use la invertibilidad de H(z). • Determiné cuánto es el error de predicción. Clases de modelos Se consideran clases de sistemas representados por funciones de transferencia racionales: – Polos y ceros – Ecuación de diferencias – Características del ruido de proceso Ejemplos: – ARX – OE (diferencia fundamental con ARX) – FIR – Box-Jenkins Clases de modelos El modelo más sencillo considera que el ruido afecta la ecuación: • El vector de parámetros es: • Represente este sistema como un diagrama de bloques y determine su predictor a un paso. Clases de modelos Un modelo un poco más complejo realiza un promedio móvil sobre el ruido: • El vector de parámetros es: • Represente este sistema como un diagrama de bloques y determine su predictor a un paso. Prediction error methods • Históricamente, una de las principales aplicaciones de los modelos identificados es realizar predicciones. • Se considera que el error de predicción es un buen criterio para decidir si un modelo describe los datos observados de manera adecuada. • Se define entonces el error de predicción como y se considera que un “buen” modelo es aquel que produce pequeños errores de predicción cuando se aplica a los datos observados. Métodos paramétricos • Para reducir la dimensión del vector de parámetros se considera que el sistema pertenece a un conjunto de modelos, modelos con una estructura fija M(θ), definido por un vector de parámetros, limitados a un subconjunto DM de Rd: • A cada valor de θ corresponde un sistema: • Y un predictor a un paso: con Prediction error methods • Con la información disponible es posible evaluar el error de predicción – Cada elemento de la clase tiene asociado un predictor que a cada instante t, depende únicamente de los valores pasados de y(t) y de u(t). Es posible evaluar ε(t,θ), dado θ, para t=1, 2, ... ,N. Prediction error methods (PEM) Un algoritmo de identificación PEM consiste en seleccionar un modelo en la clase que presente el menor error de predicción posible. Problema: ε(t,θ) es una secuencia definida para t=1, 2, ... ,N, que significa ε(t,θ) pequeño? Dado un conjunto de datos ZN y un modelo parametrizado por θ, ε(t,θ) puede ser interpretado como un vector en RN y su tamaño pude ser medido usando alguna norma en RN, cuadrática o no. Prediction error methods (PEM) En primer lugar, se genera una versión filtrada del error de predicción: y se define la siguiente norma del error filtrado: donde es una función escalar de εF(t,θ), usualmente positiva. VN(θ, ZN) es una función escalar bien definida de θ y es una medida adecuada de la calidad de un modelo M(θ). Prediction error methods (PEM) El algoritmo de estima de minimización del error de predicción se define como Esta ecuación define varias familias de métodos de identificación, que se diferencian en la función l( ) que mide el error a cada instante de tiempo, el prefiltro L(q), la estructura de la familia de modelos M(θ) asi como el método de optimización usado para resolver el problema de minimización. PRE-FILTRAJE El filtro L(q) permite considerar interdependencias o correlaciones entre los errores de predicción en diferentes instantes de tiempo. - L(q) pasabajos elimina los errores de alta frecuencia. - L(q) con un cero en 1, elimina errores constantes (offset). - Es posible diseñar un filtro L(q) para enfatizar la banda en la cual me interesa pesar el error. PRE-FILTRAJE Para un sistema de la forma: El error de predicción filtrado es Por lo tanto, equivale a cambiar el modelo de ruido H(q,θ) por: En conclusión, para sistemas lineales, el prefiltraje no ofrece un beneficio “a priori”. Norma del error Otro elemento de la función de costo que aun no ha sido definido es la función l(ε(t,θ)) que “mide” el tamaño del error a cada instante t. La función mas usada es una norma cuadrática: Una función cuadrática es conveniente por motivos computacionales y teóricos. Existen aproximaciones en las cuales se gana robustez usando otras normas, por ejemplo el valor absoluto del error. Minimización del error cuadrático Consideremos la siguiente función de costo: para el sistema con VN(θ, ZN) es la norma euclidiana (o energía)del error. Realizando la DFT de la secuencia de errores ε(t,θ): de la relación de Parseval se cumple que: Minimización del error cuadrático Definiendo De los resultados de análisis espectral, la DFT de w(t,θ) es: con Definiendo s(t,θ) = y(t) – w(t,θ) se tiene Finalmente, tiene DFT Minimización del error cuadrático Reemplazando y en VN(θ, ZN) se obtiene Minimización del error cuadrático Recordando la definición de la ETFE la función de costo VN(θ, ZN) se puede reescribir como: con que aproximando como una integral resulta: Minimización del error cuadrático para modelos ARX La familia mas sencilla de modelos es la siguiente ecuación de diferencias: definiendo: Minimización del error cuadrático para modelos ARX M(θ) es con: El predictor optimo es: recordando que A(q) y B(q) son polinomios en q y definiendo el regresor: el predictor se puede escribir como: Minimización del error cuadrático para modelos ARX El error de predicción es y la función de costo corresponde a la función de costo de una estima por mínimos cuadrados, con solución: Minimización del error cuadrático para modelos ARX Llamando R(N)la matriz cada uno de los elementos de esta matriz es de la forma: además de sumas similares de u(t-i)u(t-j) y de términos cruzados y(t-i)u(t-j). Es decir, son estimas de las funciones de correlación de u y y , y de su correlación cruzada. Minimización del error cuadrático para modelos ARX Hipoticemos que los datos has sido generados por un sistema La estima de mínimos cuadrados es Las propiedades estadísticas de la estima dependen del comportamiento de vo(t), que es el error del estimador óptimo, NO el disturbio que actúa sobre el sistema. Minimización del error cuadrático para modelos ARX En el límite cunando N va a infinito tenemos: Además: Por lo tanto: Minimización del error cuadrático para modelos ARX Por lo tanto la estima converge a: Para que la estima sea consistente se debe cumplir: • R* no singular: esto se cumple si u es persistentemente excitante (se estudiará luego). • h*=0: esto se cumple si: – vo(t) es ruido blanco y por lo tanto independiente del regresor ; o – na= 0 y por lo tanto el regresor no depende de valores pasados de y(t). (sistema FIR). TAREA Dado el sistema y(t)=1.2y(t-1)-0.32y(t-2)+u(t-1)+0.5u(t-2)+e(t) con e(t) i.i.d. Gausiano con media cero y varianza 1. 1) Generar conjuntos de datos de identificación utilizando una entrada u(t) construida como una realización de un proceso estocástico i.i.d. con media 1 y varianza 4, e(t) ruido blanco gausiano de varianza unitaria. Variando la duración del experimento, desde N=100 hasta N=1000 2) Realizar estimas de la respuesta en frecuencia del sistema (ETFE y SPA) y de la perturbación v(t). Graficar el comportamiento de la estima a medida que aumenta N. 3) Estimar estructuras ARX en las clases: • na=2 nb=2 • na=2, nb=1 • na=1, nb=1