Universidad Nacional de Ingenierı́a - Facultad de Ingenierı́a Mecánica Departamento Académico de Ingenierı́a Aplicada CONTROL MODERNO Y ÓPTIMO (MT 227C) Clase05-02 Elizabeth Villota Cerna 29/09/2010 Semestre 2010II - UNI En lo que sigue discutiremos métodos para el diseño de controladores por realimentación para el caso de sistemas lineales. El proceso de diseño involucra tres pasos. En el primer paso asumimos que todos los estados están disponibles y procedemos con el diseño de leyes de control por realimentación de estados. Luego procedemos con el segundo paso; que corresponde al diseño del estimador, también denominado como el observador del vector de estados. El último paso consiste en combinar los dos pasos anteriores tal que la ley de control, diseñada en el primer paso, usa el estimador de estados en vez de el vector de estados real. El resultado de este paso es un compensador combinado controlador-estimador. A continuación discutiremos el controlador por realimentación de estados. 5.2. Control por realimentación de estados El estado de un sistema dinámico es una colección de variables que permiten la predicción del desarrollo de un sistema a futuro. A continuación exploraremos la idea de diseñar la dinámica de un sistema a través de realimentación de estados. La ley de control por realimentación será desarrollada paso a paso usando una única idea: la ubicación de los autovalores del sistema en lazo cerrado en posiciones deseadas. 5.2.1. Estructura del controlador La Fig. 1 muestra un diagrama de un sistema de control por realimentación de estados tı́pico. El sistema completo consiste del proceso dinámico (planta), que es considerado lineal, los elementos del controlador K y kr , la entrada de referencia (o señal de comando) r y procesos de disturbio d. El objetivo del controlador por realimentación es regular la salida del sistema z tal que rastree la señal de referencia aún en la presencia de disturbios y también incerteza en el proceso. Figura 1: Sistema de control por realimentación de estados. El controlador usa el estado del sistema x y la entrada de referencia r para comandar el proceso (planta) a través de su entrada u. El disturbio es modelado a través de una entrada aditiva d. Un elemento importante del diseño de control es la especificación de desempeño. La especificación más simple de desempeño es la de estabilidad: en la ausencia de disturbios, nuestro objetivo es hacer que el punto de equilibrio del sistema sea asintóticamente estable. A menudo, especificaciones de desempeño más sofisticadas dotan de propiedades deseadas a una respuesta al escalón o a la respuesta en frecuencia del sistema, tales como tiempo de levantamiento, sobreimpulso y tiempo de establecimiento de la respuesta al escalón. Adicionalmente, una preocupación frecuente es que el sistema posea propiedades de atenuación de disturbios. Considerando un sistema descrito por la ecuación diferencial lineal: ẋ(t) = Ax(t) + Bu(t), x(0) = xo z(t) = Cx(t) + Du(t), , y(t) = In x(t) donde hemos ignorado el disturbio d por ahora. Nuestro objetivo es llevar la salida z a una referencia deseada r y mantenerla alli. CONTROL POR REALIMENTACIÓN DE ESTADOS/DISEÑO DE CONTROLADORES 5.2.2. Estabilización por realimentación de estados Asumiendo que todos los componentes del vector de estados pueden ser medidos. Dado que el estado en el tiempo t contiene toda la información necesaria para predecir el comportamiento futuro del sistema, la ley de control invariante en el tiempo más general es una función del estado y de la entrada de referencia: u = α(x, r). Si la ley de control por realimentación de estados es asumida lineal, entonces la realimentación se puede escribir como una combinación lineal de todas las variables de estado, incluyendo la referencia: u = −Kx + kr r, donde K ∈ Rm×n es una matriz constante y r es el valor de referencia, asumido por ahora constante. El sistema en lazo cerrado es entonces: ẋ = Ax + B(−Kx + kr r), x(0) = xo ẋ = (A − BK)x + Bkr r, x(0) = xo Los polos del sistema en lazo cerrado son las raices de la ecuación caracterı́stica: det(sIn − A + BK) = 0. La ley de control por realimentación de estados consiste en seleccionar ganancias: kij , i = 1, 2, ..., m, j = 1, 2, .., n, tal que las raices de la ecuación caracterı́stica del sistema en lazo cerrado: det(sIn − A + BK) = 0, esten en las ubicaciones deseadas en el plano complejo. Si asumimos que el diseñador ha hecho una selección de los polos deseados del sistema en lazo cerrado, y ellos son: p1 , p2 , ..., pn . Los polos (del sistema en lazo cerrado) deseados pueden ser reales o complejos. Si son complejos, ellos deben estar en pares complejos conjugados. Esto es debido al uso de ganancias reales kij . Una vez que definimos los polos deseados, podemos formar el polinomio caracterı́stico en lazo cerrado deseado, αc (s) = (s − p1 )(s − p2 )...(s − pn ) αc (s) = sn + αn−1 sn−1 + ... + α1 s + αo . Nuestro objetivo es seleccionar una matriz de realimentación K tal que: det(sIn − A + BK) = sn + αn−1 sn−1 + ... + α1 s + αo . El problema arriba presentado es también llamado problema de ubicación de polos o problema de asignación de autovalores. Primero discutiremos el problema de ubicación de polos para una planta con una entrada. Ubicación de polos para sistemas de una entrada En este caso, K = k ∈ R1×n . La solución de este problema se obtiene fácilmente si el Ax(t) + bu(t) ya está en la forma canónica controlable. En tal caso tenemos: 0 1 0 ... 0 0 0 0 1 ... 0 0 . .. .. A − bk = . 0 0 0 ... 0 1 −ao − k1 −a1 − k2 −a2 − k3 ... −an−2 − kn−1 −an−1 − kn Entonces, las ganancias deseadas son: k1 k2 = αo − ao , = α1 − a1 , .. . kn = αn−1 − an−1 Clase05-02, pág. 8 . sistema ẋ(t) = . CONTROL POR REALIMENTACIÓN DE ESTADOS/DISEÑO DE CONTROLADORES Si el sistema ẋ(t) = Ax(t)+bu(t) no está en la forma canónica controlable, primero transformamos el sistema en la forma canónica y luego calculamos el vector de ganancias k̃ tal que: det(sIn − Ã + b̃k̃) = sn + αn−1 sn−1 + ... + α1 s + αo . Entonces, k̃ = Luego: αo − ao α1 − a1 ... αn−1 − an−1 k = k̃T, . donde T es la transformación que lleva al sistema ẋ(t) = Ax(t) + bu(t) a la forma canónica controlable. Podemos representar la fórmula de arriba para la matriz de ganancias en una forma alternativa. Para esto, nótese que: q1 q1 A k̃T = αo − ao α1 − a1 ... αn−1 − an−1 . .. . n−1 q1 A k̃T = q1 (αo In + α1 A + ... + αn−1 An−1 ) − q1 (ao In + a1 A + ... + an−1 An−1 ). Por el teorema de Cayley-Hamilton, tenemos: An = −(ao In + a1 A + ... + an−1 An−1 ). Entonces: k = q1 αc (A). La expresión para el vector fila de ganancias fue propuesto por Ackerman en 1972 y ahora se conoce como Fórmula de Ackerman para ubicación de polos. Ejemplo, sistema de una entrada Para el sistema dinámico lineal: ẋ = 1 −1 1 −2 x+ 2 1 u, usaremos la fórmula de Ackerman para diseñar el controlador por realimentación de estados, u = −Kx, tal que los polos en lazo cerrado esten localizados en {−1, −2}. Para usar la fórmula de Ackerman, primero formamos la matriz de controlabilidad del sistema ẋ(t) = Ax(t) + bu(t) y luego encontramos la última fila de su inversa, denotada por q1 . La matriz de controlabilidad es: 2 1 b Ab = . 1 0 La inversa de la matriz arriba es: Entonces, q1 = 0 1 1 −2 . 1 −2 . El polinomio caracterı́stico del sistema en lazo cerrado deseado es: αc (s) = (s + 1)(s + 2) = s2 + 3s + 2. Luego, k = q1 αc (A) 2 = q1 (A + 3A + 2I2 ) 1 0 1 −1 1 −1 1 −1 +2 +3 = q1 0 1 1 −2 1 −2 1 −2 0 1 3 −3 2 0 + + = q1 −1 3 3 −6 0 2 5 −2 = 1 −2 2 −1 = 1 0 Clase05-02, pág. 9 CONTROL POR REALIMENTACIÓN DE ESTADOS/DISEÑO DE CONTROLADORES Ubicación de polos para sistemas de múltiples entrada Si el sistema ẋ(t) = Ax(t) + Bu(t) ya se encuentra en la forma canónica controlable, procedemos como a continuación. Primero representamos la matriz B como: 0 0 ... 0 0 0 0 ... 0 0 0 0 ... 0 0 0 0 ... 0 0 .. .. .. .. . . . . 1 x x x x 1 0 0 0 0 0 0 ... 0 0 0 0 ... 0 0 1 x x x x 0 0 ... 0 0 0 0 ... 0 0 0 1 x x x .. .. .. .. .. = B̂Γ .. .. = . . . . B= . . . 0 1 x x x 0 1 0 0 0 0 0 ... 1 x . . .. .. .. . 0 0 0 0 1 . . . 0 0 ... 0 0 0 0 ... 0 0 0 0 ... 0 0 0 0 ... 0 0 . . .. .. . .. . . . 0 0 0 0 1 0 0 0 0 1 donde la matriz Γ es no singular y cuadrada que consiste de filas de B diferentes de cero. Luego, sea: K̂ = ΓK. Nótese que: 0 0 .. . k̂ 11 0 0 . B̂ K̂ = .. k̂21 . . . 0 0 .. . k̂m1 0 0 ... ... 0 0 0 0 .. . k̂12 0 0 ... ... ... k̂1n−1 0 0 k̂1n 0 0 .. . k̂22 ... k̂2n−1 0 0 ... ... 0 0 k̂2n .. . 0 0 .. . k̂m2 ... k̂mn−1 k̂mn ; esto es, las filas no ceros en el producto B̂ K̂ coinciden con las filas no ceros de la matriz A en su forma canónica controlable. Si seleccionamos, por ejemplo, las ganancias kij , i = 1, 2, ..., m y j = 1, 2, ..., n, tal que: 0 1 0 ... 0 0 0 0 1 ... 0 0 .. .. ; A − BK = A − B̂ K̂ = . . 0 0 0 ... 0 1 −αo −α1 α2 ... αn−2 αn−1 donde: K = Γ−1 K̂. Si el sistema ẋ(t) = Ax(t) + Bu(t) no está en la forma canónica controlable, primero lo llevaremos a esa forma y luego calcularemos la matriz de ganancias que ubica los polos del sistema en lazo cerrado en las posiciones deseada para el sistema ẋ(t) = Ax(t) + Bu(t) en la forma canónica controlable. la matriz de ganancias que ubica los polos del sistema en lazo cerrado en las posiciones pre-especificadas para el sistema ẋ(t) = Ax(t) + Bu(t) en sus coordinadas originales es entonces dado por: K = Γ−1 K̂T. Clase05-02, pág. 10 CONTROL POR REALIMENTACIÓN DE ESTADOS/DISEÑO DE CONTROLADORES donde T es la matriz de transformación que lleva al sistema ẋ(t) = Ax(t) + Bu(t) a la forma canónica controlable. Ejemplo, múltiples entradas Para el sistema dinámico lineal: 0 1 ẋ = 0 0 0 0 1 0 1 2 3 −21 0 0 x + 0 5 0 0 u, 0 1 1 0 0 0 usaremos su forma canónica controlable para encontrar la matriz K ∈ R2×4 tal que los polos en lazo cerrado esten ubicados en: −2, −3 + −3 + i, −3 − i, −4. Primero transformamos ẋ(t) = Ax(t) + Bu(t) a la forma canónica controlable. de controlabilidad: 1 0 0 0 0 0 0 1 0 0 b1 b2 Ab1 Ab2 A2 b1 ... = 0 0 0 0 1 0 1 0 5 0 Para eso, formamos la matriz ... ... . ... ... Entonces seleccionamos, procediendo de izquierda a derecha, las primeras cuatro columnas linealmente independientes de la matriz de controlabilidad. Obtenemos: b1 b2 Ab1 A2 b1 . Entonces, los ı́ndices de controlabilidad son d1 = 3 y d2 = 1. Rearreglamos las columnas y formamos la matriz L de la forma: L = b1 Ab1 A2 b1 b2 = I4 = L−1 . Las últimas filas que necesitamos para la construcción de la matriz de transformación son: q1 = 0 0 1 0 and q2 = 0 0 0 1 . La matriz de transformación es: T = q1 q1 A q1 A2 0 0 q2 = 1 0 Y el sistema ẋ(t) = Ax(t) + Bu(t) en el nuevo sistema 0 1 0 0 0 0 1 0 Ã = T AT −1 = 1 2 3 0 −21 0 0 5 0 1 1 3 3 11 0 0 0 0 . 0 1 coordenado tiene la forma: 0 0 0 0 and B̃ = T B = 1 0 0 1 El polinomio caracterı́stico del sistema en lazo cerrado es: . αc (s) = (s + 2)(s + 3 − i)(s + 3 + i)(s + 4) = s4 + 12s3 + 54s2 + 108s + 80. Una posible elección de la matriz de ganancias K̃, dentro de tantas, que funciona para el caso es K̃ tal que: 0 1 0 0 0 0 1 0 . Ã − B̃ K̃ = 0 0 0 1 −80 −108 −54 −12 Nótese que Γ = I2 . Entonces: K̃ = 1 59 2 108 3 54 −1 17 Clase05-02, pág. 11 , CONTROL POR REALIMENTACIÓN DE ESTADOS/DISEÑO DE CONTROLADORES y luego: K = K̃T = 3 54 11 270 40 977 −1 17 . El algoritmo aqui presentado para ubicación de polos para sistemas de múltiples entradas presenta más un valor teórico antes que práctico. EL algoritmo presenta problemas de implementación numérica porque la transformación del sistema ẋ(t) = Ax(t)+Bu(t) a la forma canónica controlable sufre de propiedades numéricas pobres. Existen otros algoritmos más robustos, como los implementados en MATLAB, especificamente en la función place. La solución del problema de ubicación de polos para un sistema de múltiples entradas no es única. Entonces, los grados de libertad restantes pueden ser usados para alcanzar objetivos secundarios. En la semanas siguientes discutiremos un método para construir una ley de control lineal por realimentación de estados que ubica los polos del sistema en lazo cerrado en posiciones pre-especificadas y al mismo tiempo minimiza un ı́ndice de desempeño cuadrático. Como resultado de la discusión en esta parte, enunciaremos un teorema fundamental de sistemas lineales: Teorema El problema de ubicación de polos tiene solución para todas las elecciones de los n polos en lazo cerrado, simétricos con respecto al eje real, si y sólo si el sistema ẋ(t) = Ax(t) + Bu(t) es controlable. ⋄ 5.2.3. Desempeño. Control para la solución en estado estacionario Nótese que kr no afecta la estabilidad del sistema (que es determinado por los autovalores de A − BK) pero si afecta la solución en estado estacionario. En particular, el punto de equilibrio y la salida del sistema en lazo cerrado estan dados por: ẋe = 0 = (A − BK)xe + Bkr r, xe ze = −(A − BK)−1 Bkr r, = Cxe + Due entonces kr debe ser elegido tal que ze = r (el valor deseado de la salida). Asumiendo que D = 0 (el caso más común), entonces: ze = r = −C(A − BK)−1 Bkr r, luego para cuando kr sea un escalar (sistema de una entrada y una salida) tenemos: kr = −1/(C(A − BK)−1 B). Nótese que kr es exactamente la inversa de la ganancia en la frecuencia cero del sistema en lazo cerrado. 5.2.4. Especificaciones del diseño del control por realimentación de estados La ubicación de los autovalores determina el comportamiento de la dinámica en lazo cerrado, y como consecuencia, la decisión más importante es donde ubicaremos los autovalores. Como en todos los casos de diseño de sistemas de control, existe una concesión mutua entre la magnitud de la entrada de control, la robustez del sistema a las perturbaciones y el desempeño del sistema en lazo cerrado. En esta sección revisaremos brevemente estas concesiones mutuas con el caso especial de sistemas de segunda orden. Sistema de segunda orden El sistema de segunda orden es una clase de sistema que ocurre frecuentemente en el análisis y diseño de sistemas de relimentación. Un sistema de segunda orden se puede escribir como: q̈ + 2ζωo q̇ + ωo2 q = kωo2 u, En la forma de espacio de estados, el sistema se escribe como: dx 0 ωo 0 = x+ u, −ωo −2ζωo kωo dt Clase05-02, pág. 12 y = q. y= 1 0 x. CONTROL POR REALIMENTACIÓN DE ESTADOS/DISEÑO DE CONTROLADORES Los autovalores del sistema están dados por: λ = −ζωo ± p ωo2 (ζ 2 − 1), y observamos que el origen es un punto de equilibrio estable si ωo > 0 y ζ > 0. Nótese que los autovalores son complejos si ζ < 1 y reales en caso contrario. La forma de la solución depende del valor de ζ, el cual se denomina factor de amortiguamiento del sistema. Si ζ > 1, decimos que el sistema es sobreamortiguado, y la respuesta natural (u = 0) del sistema está dado por: βx1o + x2o −αt αx1o + x2o −βt y(t) = e − e , β−α β−α p p donde α = ωo (ζ + ζ 2 − 1) y β = ωo (ζ − ζ 2 − 1). Vemos que la respuesta consiste en la suma de dos señales que decaen exponencialmente. Si ζ = 1, entonces el sistema es criticamente amortiguado y la solución resulta: y(t) = e−ζωo t (x1o + (x2o + ζωo x1o )t). Nótese que la respuesta es aún asintóticamente estable mientras que ωo > 0, a pesar que el segundo término en la solución este creciendo con el tiempo (pero más lento que el término exponencial decayente que lo multiplica). Finalmente, si 0 < ζ < 1, entonces la solución es oscilatoria y se dice que el sistema es subamortiguado. El parámetro ωo es conocido como la frecuencia natural del sistema. La respuesta natural del sistema esta dado por: 1 ζωo −ζωo t x1o + x2o sin ωd t), y(t) = e (x1o cos ωd t + ωd ωd p donde ωd = ωo 1 − ζ 2 es llamada la frecuencia amortiguada. Debido a la forma simple de un sistema de segunda orden, es posible resolver el sistema en forma analı́tica para una entrada del tipo escalón. Para este caso, la solución depende de ζ: ! ζ −ζωo t −ζωo t y(t) = k 1 − e cos ωd t + p e sin ωd t , ζ < 1 1 − ζ2 y(t) = k 1 − e−ζωo t (1 + ωo t) , ζ = 1 √ 2 √ 2 1 1 ζ ζ + 1)e−ζωo t(ζ− ζ −1) + ( p − 1)e−ζωo t(ζ+ ζ −1) y(t) = k 1 − ( p 2 2 1 − ζ2 1 − ζ2 ! , ζ > 1, donde hemos tomado x(0) = 0. La Fig. 2 muestra respuestas de un sistema de 2da orden a una entrada del tipo escalón con k = 1 y para diferentes valores de ζ. La forma de la respuesta es determinado por ζ, y la velocidad de la respuesta es determinada por ωo : la respuesta es más rápida si ωo es grande. 2 Im ζ = 0.4 ζ = 0.7 ζ =1 ζ = 1.2 ζ =0 1.5 Re y 1 0.5 0 0 (a) Eigenvalues ζ 5 10 Normalized time ω0 t 15 (b) Step responses Figure 6.8: Step response for a second-order system. Normalized step responses h for the Figura 2: Respuestas de un sistema de 2da orden a una entrada del tipo escalón unitario Clase05-02, pág. 13 CONTROL POR REALIMENTACIÓN DE ESTADOS/DISEÑO DE CONTROLADORES Adicionalmente también podemos calcular las propiedades de la respuesta al escalón. Por ejemplo, para un sistema subamortiguado: ! ζ y(t) = k 1 − p e−ζωo t sin(ωd t + ϕ) , 1 − ζ2 donde ϕ = arccosζ. El sobreimpulso máximo ocurrirá por primera vez cuando la derivada de y sea cero, que se puede mostrar que es: √ 2 Mp = eπζ/ 1−ζ . De la misma forma se pueden calcular otras caracterı́sticas de la respuesta al escalón, Cuadro 3. Property Value Steady-state value k ϕ/ tan ϕ Rise time Tr = 1/ω0 · e √ 2 M p = e−π ζ / 1−ζ Overshoot Settling time (2%) Ts ≈ 4/ζ ω0 ζ = 0.5 √ ζ = 1/ 2 ζ =1 k k k 1.8/ω0 2.2/ω0 2.7/ω0 16% 4% 0% 8.0/ω0 5.9/ω0 5.8/ω0 Figura 3: Propiedades de la respuesta al escalón para un sistema de 2do orden con 0 < ζ < 1. La respuesta en la frecuencia también puede ser calculada explı́citamente y está dada por: M eiθ = kωo2 kωo2 = (iω)2 + 2ζωo (iω) + ωo2 ωo2 + 2iζωo ω + −ω 2 Una ilustración gráfica de la respuesta en frecuencia está dada en la Fig. 4. Nótese que el pico de la resonancia aumenta a medida que crece ζ. 2 10 Im ζ ≈ 0 Gain ζ = 0.08 ζ = 0.2 ζ = 0.5 ζ 0 10 −2 ζ =1 10 Phase [deg] Re 0 ζ −90 −180 −1 10 (a) Eigenvalues 0 10 Normalized frequency ω/ω0 10 1 (b) Frequency responses Figura 4: Respuesta en frecuencia de un sistema de 2do orden. Sistema de orden alto Para sistemas de orden alto, la ubicación de polos es considerablemente más dificil, especialmente cuando tratamos de considerar las múltiples concesiones mutuas presentes en el diseño de control por realimentación. Una de las razones por las que los sistemas de segundo orden son tan importantes en los sistemas de realimentación es que aún para sistemas complicados la respuesta es a menudo caracterizada por los autovalores dominantes. Para definir los autovalores dominantes, consideremos el sistema con autovalores λj j = 1, ..., n. Definimos el factor de amortiguamiento para el autovalor complejo como: ζ= −Reλ . kλk Decimos que el par de autovalores complejos conjugados λ, λ∗ es un par dominante si tiene el menor factor de amortiguamiento comparado con los otros autovalores del sistema. Por consiguiente, se puede decir que el Clase05-02, pág. 14 CONTROL POR REALIMENTACIÓN DE ESTADOS/DISEÑO DE CONTROLADORES par dominante de autovalores será el factor principal en la respuesta del sistema después que los transientes debido a otros términos (autovalores) hayan desaparecido. A pesar de que esto último no siempre se cumple, a menudo el caso de los autovalores dominantes determinana la respuesta (al escalón) del sistema. El único requerimiento formal en la asignación de autovalores es que el sistema sea controlable. En la práctia existen otras restricciones porque la selección de autovalores tiene un gran efecto en la magnitud y la variación del cambio de la señal de control. Autovalores grandes requerirán por lo general grandes señales de actuación ası́ como también rápidos cambios de estas señales. La capacidad de los actuadores impondrá restricciones en la posible ubicación de los autovalores del sistema en lazo cerrado. A continuación, usaremos las ganancias K y kr para diseñar la dinámica del sistema en lazo cerrado y satisfacer nuestro objetivo. Los ejemplos a seguir pretender ilustrar y proveer mayor intuición en como construir tal ley de control por realimentación de estados. 5.2.5. Ejemplo, sistema de balance Considerando el sistema de la Fig. 5, recordemos que este sistema es un modelo para una clase de sistemas en los que el centro de masa es balanceado sobre un punto pivote. MODELO DEL SISTEMA - puede ser NO LINEAL Las ecuaciones (no lineales) de movimiento del sistema estan dados por: p̈ F (M + m) −ml cos θ cṗ + ml sin θθ̇2 = . + 0 −ml cos θ (J + ml2 ) θ̈ γ θ̇ − mgl sin θ Por simplicidad tomamos c = γ = 0. PUNTO DE EQUILIBRIO PARA LINEALIZACIÓN - LINEALIZACIÓN Linealizando en torno al punto de equilibrio xe son: 0 0 0 0 A= 0 m2 l2 g/µ 0 Mt mgl/µ = (p, 0, 0, 0), la matriz 0 1 0 0 0 1 , B = Jt /µ 0 0 lm/µ 0 0 donde µ = Mt Jt − m2 l2 , Mt = M + m y Jt = J + ml2 . dinámica y la matriz de control , ANÁLISIS DE SISTEMA Controlabilidad: La matriz de controlabilidad es: Wc = B AB A2 B 0 0 A3 B = Jt /µ lm/µ Jt /µ 0 lm/µ 0 0 gl3 m3 g/µ2 2 2 2 0 g l m (M + m)/µ2 El determinante de la matriz es: det(Wc ) = gl3 m3 /µ2 gl2 m2 (M + m)/µ2 . 0 0 g 2 l 4 m4 6= 0, µ4 y concluimos que el sistema es controlable. Esto significa que podemos mover el sistema desde una condición inicial hasta un estado fina y, en particular, que siempre podemos encontrar una entrada que lleve el sistema desde una condición inicial hasta el punto de equilibrio. Clase05-02, pág. 15 CONTROL POR REALIMENTACIÓN DE ESTADOS/DISEÑO DE CONTROLADORES m θ l F M p (a) Segway (b) Cart-pendulum system Figura 5: Sistema de balance. Polos en lazo abierto: Usando los siguiente parámetos para el sistema (correspondiente, a groso modo, a un humano siendo balanceado por un carro de estabilización): M = 10 kg, m = 80kg, c = 0,1N/m/s, γ = 0,01N/rad/sec, l = 1m y J = 100kgm2 , g = 9,8m/m2 . Los autovalores de la dinámica del sistema en lazo abierto están dados por λ={0, 2.6842, 2.6851,-0.0011}. DISEÑO DEL CONTROL Polos en lazo cerrado: Para decidir donde ubicar los autovalores del sistema en lazo cerrado, primero notamos que, a groso modo, la dinámica del sistema en lazo cerrado tendrá dos componentes: la dinámica rápida que estabiliza el péndulo en la posición invertida y la dinámica lenta que controla la posición del carrito.pPara la dinámica rápida, la dinámica natural del péndulo (cuando cuelga hacia abajo) esta dada por ωo = mgl/(J + ml2 ) ∼ 2,1rad/s. Para proveer una respuesta rápida escogemos un factor de amortiguamiento de ζ = 0,5, luego tratamos de ubicar el primer par de autovalores en λ1,2 ∼ −ζωo ± ωo ∼ −1 ± 2i, donde hemos usado la aproximación p ζ 2 − 1 ∼ 1. Para la dinámica lenta, escogemos una factor de amortiguamiento igual a 0.5 para obtener un tiempo de subida de aproximadamente 5s. Esto resulta en autovalores λ3,4 = −0,35 ± 0,35i. Luego el polinomio caracterı́stico del sistema en lazo cerrado serı́a: αc (s) = (s + 1 − 2i)(s + 1 + 2i)(s + 0,35 − 0,35i)(s + 0,35 + 0,35i) Estabilización por realimentación de estados: Cálculando la inversa de la matriz de controlabilidad para encontrar q1 . Luego, usando la fórmula de Ackerman: K = q1 αc (A), obtenemos: K= −15,3 1731,3 −49,9 422,8 . Esta matriz de ganancias K también se puede obtener usando la función place en MATLAB. Controlador por alimentación directa: La ganancia por alimentación directa kr es: kr = −1/(C(A − BK)−1 B) = Clase05-02, pág. 16 −15,29 0 CONTROL POR REALIMENTACIÓN DE ESTADOS/DISEÑO DE CONTROLADORES SIMULACIONES La respuesta a una entrada escalón para el controlador aplicado en el sistema linealizado está dado en la Fig. 6 (parte izquierda). Observamos que la fuerza de entrada es excesivamente grande, casi tres veces la fuerza de gravedad en su pico. Para proveer una fuerza más realista rediseñamos el controlador para que presenta una dinámica controlada un poco más lenta. Para la dinámica del péndulo variamos la frecuencia natural por un factor de tres y mantenemos el factor de amortiguamiento. La dinámica del carrito también la desaceleramos, el factor de amortiguamiento permanece en 0.7 pero la frecuencia natural cambia a 1 (correspondiente a un tiempo de subida de 10s). Luego, los polos deseados resultan: λ = {−0,33 ± 0,66i, −0,18 ± 0,18i}. El desempeño del controlador es mostrado en la Fig. 6. 2 Position p [m] 1 0 0 5 10 15 30 Input force F [N] Input force F [N] Position p [m] 2 20 10 0 −10 0 5 10 Time t [s] 15 1 0 0 10 20 30 40 10 20 Time t [s] 30 40 30 20 10 0 −10 0 (a) λ1,2 = −1 ± 2i (b) λ1,2 = −0.33 ± 0.66i Figura 6: Control por realimentación de estados para un sistema de balance. Fuente: Capı́tulo 3 del libro Systems and Control de Stanislaw H. Zak (2002). Fuente: Capı́tulo 6 del libro Feedback Systems: An Introduction for Scientists and Engineers, de Karl J. Åström y Richard M. Murray. Clase05-02, pág. 17