Clase 16 - Capítulo 6: Controlabilidad y Observabilidad Parte 2/4 Clase 16 - Capítulo 6: Controlabilidad y Observabilidad Parte 2/4 1. Observabilidad 2. Definiciones y tests 3. Gramiano de observabilidad 4. Tests PBH de observabilidad 5. Ejemplo Clase 16 - Capítulo 6: Controlabilidad y Observabilidad Parte 2/4 Observabilidad: definiciones y tests El concepto de observabilidad es dual al de controlabilidad, e investiga la posibilidad de estimar el estado del sistema a partir del conocimiento de la entrada y la salida. Consideramos el sistema lineal estacionario ẋ = Ax + Bu y = Cx + Du A ∈ Rn×n , B ∈ Rn×p , C ∈ Rq×n , D ∈ Rq×p . (1) Definición (Observabilidad) La ecuación de estado (1) es observable si para cualquier estado inicial x(0) (desconocido), existe un tiempo finito t1 tal que el conocimiento de la entrada u y la salida y sobre el intervalo [0, t1 ] es suficiente para determinar en forma única el estado inicial x(0). En caso contrario el sistema no observable. Clase 16 - Capítulo 6: Controlabilidad y Observabilidad Parte 2/4 Ejemplos de sistemas no observables En el circuito de la izquierda, si la entrada es nula, la salida es idénticamente nula para cualquier tensión en el capacitor, debido a la simetría de las resistencias. Este sistema es no observable. 1 + 1 1F u 1H + + 2R 1F y - x1 u 1 1R y 1 - - En el circuito de la derecha (segundo orden) si u = 0 y la tensión inicial en el capacitor es nula, la salida x2 (0) = 0 es nula independientemente de la corriente en la inductancia, que no necesariamente es nula. El estado inicial x1 (0) no puede ser determinado del conocimiento de u e y , y el sistema es no observable. Clase 16 - Capítulo 6: Controlabilidad y Observabilidad Parte 2/4 El problema de observación de x(0) Dado un estado inicial x(0) y una entrada u(t), la salida del sistema está dada por la fórmula Z t At y (t) = Ce x(0) + C eA(t−τ ) Bu(τ )dτ + Du(t). (2) 0 Para estudiar observabilidad, la salida del sistema y (t) y la entrada u(t) se suponen conocidas, siendo el estado inicial x(0) la única incógnita. Así, de (2) podemos escribir CeAt x(0) = ȳ (t) Z , y (t) − C t eA(t−τ ) Bu(τ )dτ + Du(t), 0 donde la variable ȳ (t) es una función conocida. ¿Cómo resolvemos (3) para obtener x(0) de ȳ (t)? (3) Clase 16 - Capítulo 6: Controlabilidad y Observabilidad Parte 2/4 Observación para un tiempo fijo Para un tiempo t fijo, CeAt es una matrix q × n real y constante, e ȳ (t) un vector q × 1 constante. Por su definición, ȳ (t) está siempre en la imagen de CeAt , por lo que siempre existe una solución x(0). La cuestión es si existe una solución única. En general q < n (menos salidas que estados), así que CeAt tiene rango a lo sumo q, ⇒ kernel no trivial ⇒ no podemos hallar un único valor x(0) de CeAt x(0) = ȳ (t) para un t fijo dado. Para poder determinar x(0) en forma única de CeAt x(0) = ȳ (t) es necesario utilizar el conocimiento de y (t) y u(t) sobre un intervalo de tiempo de longitud no nula, como mostramos en el siguiente teorema. Clase 16 - Capítulo 6: Controlabilidad y Observabilidad Parte 2/4 Primer test de observabilidad Teorema (Test Wo de observabilidad) La ecuación de estados (1) es observable si y sólo si la matriz Wo (t) ∈ Rn×n Z t T eA τ C T CeAτ dτ (4) Wo (t) = 0 es no singular para todo t > 0. Demostración T Multiplicamos por izquierda ambos lados de CeAt x(0) = ȳ (t) por eA t C T y luego integramos sobre [0, t1 ], lo que da „Z t1 « Z t1 T AT t T At eA t C T ȳ (t)dt. e C Ce dt x(0) = 0 0 Rt T Si Wo (t1 ) es no singular, entonces x(0) = Wo−1 (t1 ) 01 eA t C T ȳ (t)dt da una única solución x(0). Así hemos mostrado que si Wo (t) es no singular entonces el sistema es observable. Clase 16 - Capítulo 6: Controlabilidad y Observabilidad Parte 2/4 Demostración (continuación) Para mostrar la reversa supongamos que Wo (t1 ) es singular. Notar que entonces Wo (t1 ) es semi-definida positiva: existe v ∈ Rn×1 tal que Z t1 T T v T eA t C T CeAt vdt v Wo (t1 )v = 0 Z t1 = kCeAt v k2 dt = 0. 0 Pero, por la propiedad de la norma, esto implica que CeAt v ≡ 0, para todo t ∈ [0, t1 ]. (5) Si u(t) ≡ 0 entonces las condiciones iniciales x(0) = v 6= 0 y x(0) = 0 dan ambas la misma salida y (t) = CeAt x(0) ≡ 0 y por lo tanto no pueden diferenciarse. Así Wo (t) singular ⇒ el sistema es inobservable. De la definición de la matriz Wo (t) la observabilidad sólo depende de A y C: la observabilidad es una propiedad del par (A, C), e independiente de las matrices B y D. Clase 16 - Capítulo 6: Controlabilidad y Observabilidad Parte 2/4 Dualidad Controlabilidad/Observabilidad Teorema (Dualidad entre controlabilidad y observabilidad) El par (A, C) es observable si y sólo si el par (AT , C T ) es controlable. El teorema de dualidad hace inmediata la demostración de tests de observabilidad análogos a los de controlabilidad. Teorema (Tests de Observabilidad) La siguientes afirmaciones son equivalentes: 1. El par (A, C), A ∈ Rn×n , C ∈ Rq×n , es observable. 2 3 2. La matriz de observabilidad, O = C CA 4 CA2 ··· CAn−1 5 , O ∈ Rnq×n , es de rango n (rango columna pleno). Rt T Rt T 3. La matriz n × n Wo (t) = 0 eA τ C T CeAτ dτ = 0 eA (t−τ ) C T CeA(t−τ ) dτ es no singular para todo t > 0. Clase 16 - Capítulo 6: Controlabilidad y Observabilidad Parte 2/4 Observación a través de diferenciación Una forma alternativa de resolver CeAt x(0) = ȳ (t) es a través de la diferenciación repetida de ȳ (t) en t = 0 Como ȳ (0) = Cx(0), ȳ˙ (0) = CAx(0), . . . , ȳ (n−1) (0) = CAn−1 x(0), tenemos " ȳ (0) # » – C CA ··· CAn−1 x(0) = ȳ˙ (0) ··· ȳ (n−1) (0) , es decir, Ox(0) = ỹ (0). Por construcción, ỹ (0) está en la imagen de O, y si el sistema es observable, el rango columna de O es pleno, rango O = n. Entonces existe una solución única de Ox(0) = ỹ (0), dada por x(0) = [OT O]−1 OT ỹ (0). Notar que aún seguimos necesitando conocimiento de ȳ (t) en un entorno de t = 0 para poder determinar ȳ˙ (0), . . . , ȳ (n−1) (0). Clase 16 - Capítulo 6: Controlabilidad y Observabilidad Parte 2/4 ¿Es práctico implementar observación diferenciando? Si bien se puede implementar observación via diferenciación, en la práctica no es recomendable, ya que I la medición de y (t) incluiye casi siempre ruido de alta frecuencia, I La diferenciación de ȳ (t) “amplifica” el ruido de alta frecuencia, aumentando los errores en el cálculo de x(0) I la integración “filtra” ruido de alta frecuencia, disminuyendo los errores en el cálculo de x(0) Es mucho mejor implementar un observador a través de integración, por ejemplo usando la fórmula Z t1 T −1 x(0) = Wo (t1 ) eA t C T ȳ (t)dt. 0 Clase 16 - Capítulo 6: Controlabilidad y Observabilidad Parte 2/4 Gramiano de observabilidad Si A es Hurwitz, Wo (t) converge para t = ∞. En ese caso notamos simplemente Wo (t) = Wo , y se llama gramiano de observabilidad. Si el par (A, C) es observable, entonces la matriz de observabilidad 3 2 C 6 CA 7 7 O=6 4 . . . 5 es de rango n. CAn−1 Como vimos en el Capítulo 4, esta condición, junto a que A es Hurwitz, garantiza que Wo es la única solución, y positiva definida, de la ecuación Wo A + AT Wo = −C T C. Las funciones M ATLAB Ob=obsv(A,C) y Wo=gram(A’,C’)’ calculan respectivamente la matriz de observabilidad O y el gramiano de observabilidad Wo . Chequeando el rango de O o Wo determinamos si un sistema es observable. Clase 16 - Capítulo 6: Controlabilidad y Observabilidad Parte 2/4 Tests PBH de observabilidad e invariancia con cambio de coordenadas La dualidad nos permite también extender los tests PBH al caso de observabilidad. Lema (Test PBH de autovectores) El par (A, C) es no observable si y sólo si existe un autovector derecho v ∈ Rn×1 de A, tal que Cv = 0. Lema (Test PBH de rango) El par (A, C) es observable si y sólo si » – sI − A rango =n C para todo s. Teorema (Invariancia respecto a cambio de coordenadas) La observabilidad es una propiedad invariante con respecto a transformaciones de equivalencia (cambios de coordenadas). Clase 16 - Capítulo 6: Controlabilidad y Observabilidad Parte 2/4 Ejemplo: Controlabilidad y observabilidad de un circuito RLC Analizamos controlabilidad y observabilidad del circuito RLC de la figura. R C iL + Vs - + Vc L + Vx - Las ecuaciones de estado son # » – " 2 – " 1 # 1 » − v̇C vC RC C = + RC vs 1 1 iL i̇L −L 0 L » – ˆ ˜ vC vx = −1 0 + vs . iL Clase 16 - Capítulo 6: Controlabilidad y Observabilidad Parte 2/4 Controlabilidad: Construimos la matriz de controlabilidad C, " 1 # 2 1 − + ˆ ˜ 2 2 LC R C C = B AB = RC . 1 1 − L RLC El rango de C puede chequearse mediante el determinante # " 1 2 1 − + 1 2 1 LC R2 C2 det C = det RC =− 2 2 + 2 2 − 2 1 1 R LC R LC L C − L RLC = 1 1 − · R 2 LC 2 L2 C La condición para que este determinante sea cero es 1 R 2 LC 2 que da R = p L/C. − 1 L2 C = 0, (6) Clase 16 - Capítulo 6: Controlabilidad y Observabilidad Parte 2/4 Observabilidad: Por otro lado, la matriz de observabilidad O es # » – " −1 0 C C= , = 2 1 CA − RC C que es siempre de rango completo. En conclusión, el sistema p es siempre observable, pero puede llegar a ser no controlable si R = L/C. Clase 16 - Capítulo 6: Controlabilidad y Observabilidad Parte 2/4 Veamos cómo aparece la posibilidad de pérdida de controlabilidad desde el punto de vista externo; analizamos la función transferencia. La calculamos de (6) con la fórmula conocida, Ĝ(s) = C(sI − A)−1 B + D " #−1 " 1 # 2 − C1 ˆ ˜ s + RC RC = −1 0 +1 1 1 s L L " #" 1 # 1 ˆ ˜ s 1 C RC −1 0 = +1 2 1 s(s + 2/RC) + 1/LC − 1L s + RC L " 1 # ˆ ˜ RC 1 +1 = 2 −s − C1 2 1 1 s + RC s + LC L ` 1 ´ 1 − s + LC = 2 RC2 +1 1 s + RC s + LC ` ´ 1 s s + RC = 2 · 2 1 s + RC s + LC Clase 16 - Capítulo 6: Controlabilidad y Observabilidad Parte 2/4 Calculamos la raíces del polinomio denominador (el polinomio característico de la matriz A) resolviendo la forma cuadrática, obteniendo r 1 1 1 s1,2 = − ± − · 2 2 RC R C LC Vemos que ambas raíces tienen parte real p negativa ⇒ estabilidad asintótica y BIBO ∀ R, L y C. En particular, si R = L/C (valor de R para el cual el sistema deviene no controlable) tenemos r 1 1 1 1 s1,2 = − ± − =− RC LC LC RC es decir, dos raíces iguales. Para este valor de R, ´ ` 1 s s + RC s ´, = ` Ĝ(s) = ` ´ 2 1 s + RC s+ 1 RC que es ahora un sistema de primer orden. Clase 16 - Capítulo 6: Controlabilidad y Observabilidad Parte 2/4 En resumen. . . I Para este particular valor de R los elementos almacenadores de energía combinan efectos de manera que el sistema se comporta, externamente, como de primer orden. I La pérdida de controlabilidad y la cancelación de un par polo-cero para p R = L/C no es una coincidencia; como veremos. I La observabilidad es una propiedad fundamental del sistema que determina si es posible determinar el estado del sistema a partir del conocimiento de la entrada y la salida. I Si un sistema es observable, es posible determinar x(0) a partir del conocimiento de u(t) y y (t) en un intervalo t ∈ [0, t1 ], t1 > 0. I La observabilidad depende de las matrices A y C del sistema. El par (A, C) es controlable sii » C – CA rango O = rango = n. ··· CAn−1 I La observabilidad es invariante respecto de cambios de coordenadas.