PS2316. Control óptimo. El regulador linear cuadrático LQR Williams Colmenares M. Universidad Simón Bolı́var Departamento de Procesos y Sistemas 4 de marzo de 2006 1. Introducción Hasta ahora hemos presentado métodos que construyen la ley de control como una de realimentación de estados en la que, si el sistema es controlable, los polos del sistema de lazo cerrado pueden ubicarse en cualquier locación del plano “s”. De igual forma, hemos presentado posibles ubicaciones de los polos del sistema que aseguran una respuesta temporal predeterminada. En este capı́tulo presentaremos un enfoque diferente a la construcción de la ley de control, que se basa en encontrar una ley de control que minimice la suma de los esfuerzos de control y las desviaciones de la señal de salida de su valor deseado. Este problema se conoce como el de Control Óptimo. Pasemos ahora a formular este problema. Considere un sistema modelado en representación de estados de la forma: ẋ(t) = Ax(t) + Bu(t) y(t) = Cx(t) (1) donde x(t) ∈ Rn y las señales de entrada y salida (u(t), y(t)) son escalares. Se desea encontrar una ley de control uopt (t) que minimice: Z ∞ (xT (t)Qx(t) + ru2 (t))dt J(x, u) = 0 La solución del problema de optimización planteado, que demostraremos en el apéndice, es: uopt (t) = −Kopt x(t) = −r −1 B T P x(t) donde la matriz P se obtiene de la siguiente ecuación algebraica de Riccati: AT P + P A − P Br −1 B T P + Q = 0 (2) es decir, la ley de control óptima resulta ser una de realimentación de estados en la que la ganancia de realimentación se obtiene de una ecuación algebraica de Riccati. Recordemos que la función de transferencia asociada al sistema (1) es: G(s) = C(sI − A)−1 B 1 Supongamos que Q = C T C, se puede demostrar (ver apéndice) que, si el par (A, C) es observable, los autovalores de A − BKopt , i.e. los polos del sistema óptimo de lazo cerrado, son las raı́ces estables de: ∆(s) = 1 + r −1 G(s)G(−s) = 0 (3) Basándonos en este hecho podemos utilizar la estrategia de Control Óptimo para ubicar los polos del sistema en las locaciones que salgan del Lugar de las Raı́ces (3). 2. Caso de estudio Retomemos el sistema que hemos venido trabajando en estos apuntes, al que le hemos añadido un integrador (la tercera variable de estado) para asegurar rechazo perfecto de perturbaciones estacionarias. ẋ1 (t) x1 (t) −3 −0,25 0 0,5 ẋ2 (t) = 8 + 0 u(t) 0 0 R x2 (t) y(t) (y(τ )dτ ) 0 0,5 0 0 {z } | | {z } A B x (t) 1 £ ¤ 0 0,5 0 R x2 (t) y(t) = (y(τ )dτ ) x1 (t) £ ¤ R 0 0 1 x2 (t) y(τ )dτ = | {z } R (y(τ )dτ ) C que equivale,Ren representación entrada salida, entre la señal de control y la nueva variable de estado (u → y), a: 2 G(s) = 2 s(s + 3s + 2) Observe que: G(−s) = (−s3 −2 + 3s2 − 2s) El Lugar de las Raı́ces de 1 + kG(s)G(−s) se muestra en la figura (1). Observe que, con k = 0,22, todos los polos que se obtendrı́an con la estrategia de Control Óptimo serı́an reales (dos de ellos en -0.682) por lo que la respuesta serı́a del tipo sobreamortiguada (sin oscilación), con un tiempo de estabilización del orden de 6 s. Tomemos Q = C T C y r = 1/k, entonces: 0 0 0 Q = 0 0 0 ; r = 4,5. 0 0 1 Resolviendo (2) se obtiene: 6,8900 2,7486 4,2426 P = 2,7486 1,1124 1,7940 ; 4,2426 1,7940 3,4170 Kopt = 2 £ 0,7656 0,3054 0,4714 ¤ Root Locus 6 4 Imag Axis 2 0 System: t Gain: 0.22 Pole: −0.682 Damping: 1 Overshoot (%): 0 Frequency (rad/sec): 0.682 −2 −4 −6 −8 −6 −4 −2 0 2 4 6 8 Real Axis Figura 1: Lugar de las Raı́ces. Ubicación de polos de ∆(s). Los polos del sistema a lazo cerrado están en: −2,0177 y −0,6825 ± 0,0375i. El margen de fase es de 72o y el del ganancia 21 dB. La respuesta del sistema a lazo cerrado se muestra en la figura (2). 3 Step Response 1 0.9 0.8 0.7 Amplitude 0.6 0.5 0.4 0.3 0.2 0.1 0 0 2 4 6 8 10 12 Time (sec) Figura 2: Lugar de las Raı́ces. Ubicación de polos de ∆(s). 4