Proyecto de Grado Presentado ante la ilustre Universidad de Los Andes como requisito final para obtener el Tı́tulo de Ingeniero de Sistemas La linealización basada en la velocidad: Un análisis comparativo Por Br. John Harold Rodrı́guez Castaño Tutor: Dr. Addison Rı́os Bolı́var Octubre 2016 c 2016 Universidad de Los Andes Mérida, Venezuela La linealización basada en la velocidad: Un análisis comparativo Br. John Harold Rodrı́guez Castaño Proyecto de Grado — Control y Automatización, 112 páginas Resumen: En el presente trabajo de grado se realiza un análisis comparativo de los diferentes métodos de linealización (aproximada, extendida, exacta y basada en la velocidad), donde se establecen las condiciones, los requerimientos y las caracterı́sticas para cada método, ası́ como el desempeño del sistema. La linealización es una herramienta que permite analizar caracterı́sticas del sistema no lineal, en una región, también permite realizar el diseño de controladores. Esto debido a que la teorı́a de los sistemas lineales está muy bien desarrollada, en comparación a la de los sistemas no lineales, donde aún existen carencias. La linealización aproximada está fundamentada en la serie Taylor, truncada en los términos de primer orden y evaluada alrededor de un punto de equilibrio. La linealización extendida está basada en la aproximada, con la diferencia que se diseña para un conjunto de puntos de equilibrio parametrizados por la señal de entrada, de manera que el controlador lineal coincida con el controlador no lineal. La linealización exacta es una técnica basada en la geometrı́a diferencial, donde se realiza la transformación del sistema no lineal, con la finalidad de obtener la forma canónica controlable, donde el controlador sea capaz de ”cancelar las no linealidades del sistema”. La linealización basada en la velocidad (LBV), está basada en la aproximada, pero el sistema adopta la estructura de los sistemas lineales a parámetros variantes (LPV), donde los parámetros variantes determinan las trayectorias del sistema, además la LBV no se limita a la región de los puntos de equilibrio solamente, sino que puede operar en cualquier punto que no sea de equilibrio, debe señalarse, que los puntos fuera del equilibrio, carecen de significado fundamental para el sistema, esto porque son puntos transitorios. Una de las limitaciones es la clase de sistemas no lineales que soportan, para la linealización exacta, el sistema no lineal debe ser afines a la entrada, para las demás linealizaciones (aproximada, extendida y basada en la velocidad), el sistema no lineal es general. También se tiene que el error de la LBV, la extendida y la exacta es pequeño en comparación a la aproximada, esto porque sus regiones de operación son más amplias con respecto a la aproximada, asegurando un buen seguimiento de referencia, incluso cuando el parámetro variante va cambiando. Palabras clave: Sistemas no lineales, Linealización, Linealización basada en la velocidad, Sistemas lineales, Sistemas LPV. A Dios por todas las bendiciones recibidas y a todos los seres amados que con su cariño hacen que todo sea posible. Índice Índice de Tablas viii Índice de Figuras ix 1 Introducción 1 1.1 Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Planteamiento del problema . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 Justificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.4 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.4.1 Objetivos generales . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.4.2 Objetivos especı́ficos . . . . . . . . . . . . . . . . . . . . . . . . 4 1.5 Metodologı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.6 Estructura del Documento . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.7 Fundamentos Teóricos . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.7.1 Sistema No Lineal (SNL) . . . . . . . . . . . . . . . . . . . . . . 6 1.7.2 Campo Vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.7.3 Derivada de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.7.4 Corchete de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.7.5 Estabilidad en el sentido Lyapunov . . . . . . . . . . . . . . . . 8 1.7.6 Controlabilidad y Observabilidad de Sistemas No Lineales . . . 10 1.7.7 Linealización . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.7.8 Sistemas Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.7.9 Sistemas Lineales a Parámetros Variantes (SLPV) . . . . . . . . 16 1.7.10 Controlabilidad de Sistemas Lineales . . . . . . . . . . . . . . . 20 v 1.7.11 Observabilidad de Sistemas Lineales . . . . . . . . . . . . . . . . 21 1.7.12 Control por Realimentación del Vector Estados (RVE) . . . . . 21 1.7.13 Observador de Estados 22 . . . . . . . . . . . . . . . . . . . . . . 2 Linealización Aproximada 25 2.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.2 Punto de equilibrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.3 Linealización de Sistemas No Lineales . . . . . . . . . . . . . . . . . . . 26 2.4 Requerimientos y Condiciones de la linealización Aproximada . . . . . 29 2.5 Ejemplo de un tanque cónico por linealización aproximada . . . . . . . 30 3 Linealización Extendida 33 3.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 3.2 Control por Realimentación de Estados por linealización Extendida . . 34 3.3 Requerimientos y Condiciones de la linealización Extendida . . . . . . . 36 3.4 Ejemplo de un péndulo simple por linealización extendida . . . . . . . . 38 4 Linealización Exacta 4.1 42 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 4.1.1 Difeomorfismo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 4.2 Linealización Exacta . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 4.3 Requerimientos y Condiciones de la linealización Exacta . . . . . . . . 49 4.4 Ejemplo de un sistema de tanques interconectados . . . . . . . . . . . . 50 5 Linealización Basada en la Velocidad 55 5.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 5.2 Linealización Fuera del Equilibrio . . . . . . . . . . . . . . . . . . . . . 56 5.3 Linealización Basada en la Velocidad (LBV) . . . . . . . . . . . . . . . 58 5.4 Requerimientos y Condiciones de la LVB . . . . . . . . . . . . . . . . . 59 5.5 Ejemplo de un manipulador robótico . . . . . . . . . . . . . . . . . . . 60 6 Análisis Comparativo 6.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 66 6.2 Requerimientos y Condiciones de las linealizaciones . . . . . . . . . . . 66 6.3 Linealización de un Sistema no lineal . . . . . . . . . . . . . . . . . . . 75 6.4 Desempeño del sistema controlado . . . . . . . . . . . . . . . . . . . . . 85 6.4.1 86 6.4.2 Respuesta del sistema ante variación del parámetro V (t) . . . Respuesta del sistema para V(t) constante con valor nominal cuando la referencia cambia . . . . . . . . . . . . . . . . . . . . 6.4.3 6.4.4 Respuesta del sistema ante variación del parámetro V (t) cuando la referencia cambia . . . . . . . . . . . . . . . . . . . . . . . . . 88 Desempeño del sistema ante criterios de error . . . . . . . . . . 89 7 Conclusiones y recomendaciones 7.1 86 93 Recomendaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bibliografı́a 94 95 A Criterios de Desempeño para cada método de linealización 100 B Fundamentos de Control Robusto 105 B.1 Normas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 B.1.1 Calculo de la norma H2 . . . . . . . . . . . . . . . . . . . . . . 106 B.2 LMI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 B.3 Control por Realimentación de Estados por H2 . . . . . . . . . . . . . . 107 C Algunas Definiciones 109 C.0.1 Función Implı́cita . . . . . . . . . . . . . . . . . . . . . . . . . . 109 C.0.2 Función definida positiva . . . . . . . . . . . . . . . . . . . . . . 110 C.1 Representación de los Sistemas LPV . . . . . . . . . . . . . . . . . . . 111 Índice de Tablas 1.1 Análisis comparativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 6.1 Tipos de sistemas no lineales . . . . . . . . . . . . . . . . . . . . . . . . 67 6.2 Condiciones y requerimientos para la linealización . . . . . . . . . . . . 71 6.3 Caracterı́sticas para la linealización . . . . . . . . . . . . . . . . . . . . 75 6.4 Combinación de los parámetros . . . . . . . . . . . . . . . . . . . . . . 83 6.5 Criterios de desempeño . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 viii Índice de Figuras 1.1 Tipos de sistemas lineales . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Diagrama de Bloque de un sistema LPV (u entradas, y salidas y ρ el 15 parámetro variante). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 1.3 Esquema del controlador por RVE . . . . . . . . . . . . . . . . . . . . . 22 1.4 Observador de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 2.1 Recta tangente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 2.2 Plano tangente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 2.3 Tanque cónico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.4 Respuesta del tanque cónico no lineal . . . . . . . . . . . . . . . . . . . 31 2.5 Tanque cónico por lin. Aproximada . . . . . . . . . . . . . . . . . . . . 32 2.6 Comparación del sistema no lineal con el linealizado . . . . . . . . . . . 32 3.1 Péndulo simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.2 Péndulo no lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 3.3 Péndulo por linealización Extendida . . . . . . . . . . . . . . . . . . . . 41 4.1 Tanques interconectados . . . . . . . . . . . . . . . . . . . . . . . . . . 51 4.2 Tanques interconectados no lineal . . . . . . . . . . . . . . . . . . . . . 54 4.3 Tanque interconectados por linealización exacta . . . . . . . . . . . . . 54 5.1 Puntos de validez de la linealización aproximada y fuera del equilibrio 58 5.2 Manipulador Robótico . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 5.3 Sistema no lineal del brazo robótico . . . . . . . . . . . . . . . . . . . . 62 5.4 Manipulador Robótico . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 ix 6.1 Respuesta del sistema no lineal . . . . . . . . . . . . . . . . . . . . . . 76 6.2 Respuesta del sistema linealizado de manera aproximada . . . . . . . . 78 6.3 Respuesta del sistema por linealización extendida . . . . . . . . . . . . 80 6.4 Respuesta del sistema por linealización exacta . . . . . . . . . . . . . . 82 6.5 Controlador robusto mediante H2 para el sistema en estudio . . . . . . 85 6.6 Respuesta del sistema con V (t) variante, para una referencia de 6.7 Respuesta del sistema con V (to ) nominal ante cambios en la referencia π 4 . . . del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.8 86 87 Respuesta del sistema con V (t) variante ante cambios en la referencia del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 Error del sistema ante cambios en la referencia cuando V (t) es variante 89 6.10 Desempeño del sistema con criterio ISE . . . . . . . . . . . . . . . . . . 90 6.11 Desempeño del sistema con criterio IAE . . . . . . . . . . . . . . . . . 90 6.9 A.1 Desempeño de la lin. Aproximada con el criterio IAE . . . . . . . . . . 101 A.2 Desempeño de la lin. Aproximada con el criterio ISE . . . . . . . . . . 101 A.3 Desempeño de la lin. Extendida con el criterio IAE . . . . . . . . . . . 102 A.4 Desempeño de la lin. Extendida con el criterio ISE . . . . . . . . . . . 102 A.5 Desempeño de la lin. Exacta con el criterio IAE . . . . . . . . . . . . . 103 A.6 Desempeño de la lin. Exacta con el criterio ISE . . . . . . . . . . . . . 103 A.7 Desempeño de la lin. B. Velocidad con el criterio IAE . . . . . . . . . . 104 A.8 Desempeño de la lin. B. Velocidad con el criterio IAE . . . . . . . . . . 104 C.1 Bloque para LFT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 Capı́tulo 1 Introducción 1.1 Antecedentes Una de las primeras referencias que se encuentra sobre la linealización basada en la velocidad es la de Leith y Leithead (1998a), donde un miembro de la familia de esta linealización es válida alrededor de cualquier punto de operación, inclusive, fuera del equilibrio. Por lo tanto, permite que el comportamiento transitorio del sistema no lineal sea investigado, además si cada uno de los modelos obtenidos debido a la variación de los parámetros actúan como una sola pieza en conjunto, se aproxima a la solución de un sistema no lineal (dado que la linealización Jacobiana está confinada a un análisis para una trayectoria), que depende de que tan distantes están los puntos de operación uno del otro. En Leith (1999) la linealización basada en la velocidad es una descripción alternativa de un sistema no lineal, en términos de una familia de sistemas lineales, permite aplicar la estrategia divide y vencerás, donde el diseño del controlador para el sistema por asignación de ganancia, para cada miembro de la familia actuando en conjunto, permite incorporar los puntos de operación fuera del equilibrio, ası́ como la dinámica transitoria entre los puntos de operación y los que se encuentra fuera del equilibrio. Esta metodologı́a de linealización basada en la velocidad requiere de la medida de los parámetros variantes o estimación de los mismos, donde el parámetro variante depende de algunos estados y/o el vector de entradas del sistema. Además, se hace 1.1 Antecedentes 2 énfasis en que la metodologı́a basada en la velocidad no requiere de una variación lenta (cambio mı́nimo entre valores del parámetro variante). Finalmente, la dinámica de la linealización basada en la velocidad y la linealización exacta, son complementarias en ciertos aspectos. En particular, la primera es dinámica y se reduce a la inversión del lazo abierto, en el caso lineal, mientras que la segunda es estática y utiliza la realimentación de estados completo. Como se dice en Leith y Leithead (1999a), el estudio de los métodos por asignación de ganancia para sistemas LPV es una tema de gran interés, estos métodos están relacionados con varios tipos de representaciones LPV / causi-LPV, sin embargo, algunos sistemas no lineales requieren de esa representación; ası́ como hay bastantes métodos de aproximaciones para alcanzar la representación de sistemas a parámetros variantes, como lo son; la familia de linealización aproximada, las aproximaciones basadas en el teorema del valor medio y la reformulación dependiente de la salida para sistemas cuasi-LPV. Sin embargo, es notable la existencia de restricciones en la clase de sistemas no lineales que soportan esta representación y/o permiten una región de operación. Es por ello, que la linealización basada en la velocidad para sistemas no lineales, permite una representación bastante amplia de sistemas cuasi-LPV, además esta representación LPV no tiene restricciones en la vecindad de los puntos de equilibrio. Al lograr la transformación cuasi-LPV del sistema no lineal, es posible aplicar los métodos para el diseño de controladores LPV por asignación de ganancia. De esta manera, la representación cuasi-LPV obtenida a través de la linealización basada en la velocidad (utilizando los métodos de diseño de controladores por asignación de ganancia), tiene una relación entre, el sistema cuasi-LPV no lineal y el sistema lineal obtenido para un valor particular del parámetro. Esta relación es válida para los puntos de equilibrio, incluyendo aquellos que están fuera de él. Tomando Reberga y Vary (2005) donde se realiza la representación lineal del motor de un turbo ventilador, utilizando dos metodologı́as diferentes, la representación basada en la velocidad y la linealización aproximada, donde la linealización basada en la velocidad tiene como caracterı́stica general, que produce una representación de sistemas cuasi-LPV, por lo cual, una familia de él aproxima la dinámica de todo el sistema no lineal; además amplı́a el grado del sistema gracias al integrador que aparece a la salida, 1.2 Planteamiento del problema 3 que elimina el error en estado estable, donde se enfatizan las ventajas y desventajas que presentan cada método. En Gao y Coyle (2004) se muestra la metodologı́a para diseñar un controlador por realimentación de estados utilizando la linealización basada en la velocidad. Esta representación, genera una acción integral al sistema, presentando un excelente desempeño en el seguimiento de trayectoria y una fuerte robustez al sistema. En Cai y Hu (2011) el diseño de controladores para sistemas LPV, se realiza utilizando la metodologı́a de la linealización basada en la velocidad, donde se lleva a cabo el diseño de un controlador de vuelo para un vehı́culo hipersónico, el cual, debido a la ventaja que ofrece la linealización basada en la velocidad (es válida fuera de los puntos de equilibrio), permite obtener un seguimiento asintótico de los estados del sistema, se resumen los pasos para obtener un modelo por linealización basada en la velocidad, ası́ como el diseño del controlador por medio de una LMI (desigualdades matriciales lineales), que garantiza la zona de operación del sistema. 1.2 Planteamiento del problema Dadas las técnicas de linealización de sistemas no lineales, se desea realizar un análisis comparativo de la linealización basada en la velocidad con los métodos de linealización; aproximada, extendida y exacta, que permita establecer las diferencias de cada una de las técnicas, en cuanto a implementación, requerimientos, caracterı́sticas y desempe?o. 1.3 Justificación Representar la complejidad de los sistemas no lineales, mediante equivalentes lineales alrededor de una región, donde se puedan estudiar las caracterı́sticas del sistema no lineal, o llevar acciones de control, han llevado al desarrollo de técnicas de linealización tales como: la aproximada, la extendida, la exacta y la basada en la velocidad. Es por esta razón que es necesario conocer las caracterı́sticas y limitaciones, de cada una de las técnicas de linealización, con el fin de observar las ventajas y desventajas de cada método. 1.4 Objetivos 1.4 4 Objetivos 1.4.1 Objetivos generales Realizar un análisis comparativo de la linealización basada en la velocidad con los métodos de linealización aproximada, exacta y extendida, para sistemas no lineales utilizando como criterios las caracterı́sticas del sistema linealizado, los requerimientos y condiciones para la linealización, el tipo del sistema a linealizar y el desempeño del sistema bajo un criterio de sı́ntesis (ver Tabla de comparación 1.1). Tipo de Tipo linealización sistema Linealizar a Requerimientos Caracterı́sticas Criterio de Desempeño y del sı́ntesis de del sistema control controlado Condiciones para la sistema Linealizado linealización Tabla 1.1: Análisis comparativo 1.4.2 Objetivos especı́ficos • Estudiar los métodos de linealización aproximada, exacta y extendida. • Estudiar la linealización basada en la velocidad. • Realizar la linealización aproximada, exacta y extendida del sistema no lineal en estudio. • Realizar la linealización basada en la velocidad del sistema en estudio. • Investigar el comportamiento de los sistemas LPV. • Realizar un análisis comparativo de los métodos de linealización, utilizando como criterios las caracterı́sticas del sistema linealizado, los requerimientos y condiciones para la linealización, el tipo del sistema a linealizar y el desempeño del sistema bajo un criterio de sı́ntesis. • Analizar los resultados obtenidos mediante el análisis comparativo. 1.5 Metodologı́a 1.5 5 Metodologı́a Se desea realizar un análisis comparativo entre los diferentes métodos de linealización (aproximada, exacta y extendida), con el método de linealización basada en la velocidad. Se parte de un sistema no lineal, donde se revisan las caracterı́sticas de Controlabilidad y Observabilidad para aplicar cada método al sistema no lineal. Como la linealización basada en la velocidad es la principal técnica en el trabajo a desarrollar, se estudian todos los pormenores para aplicarla a un sistema no lineal, al igual que con las demás técnicas de linealización. Dado que, la representación basada en la velocidad tiene parámetros variantes, es por ello, que se estudian los sistemas lineales a parámetros variantes (LPV). Teniendo el sistema linealizado, se realiza la comparación de cada método de linealización, con el objeto de realizar un análisis de los resultados obtenidos, producto de las comparaciones realizadas, con la finalidad de observar las carácterı́sticas, condiciones y requerimientos del sistema, ası́ como el desempeño que tiene. 1.6 Estructura del Documento El documento se divide en 7 capı́tulos que se estructuran de la siguiente manera: En el Capt́ulo 1: se hace una descripción sobre el trabajo a realizar a lo largo del documento, ası́ como también se dan los fundamentos teóricos. En el Capı́tulo 2: se estudia el método de linealización Aproximada, donde se dan las pautas para su realización, ası́ como se muestra un ejemplo de la misma. En el Capı́tulo 3: se realiza el estudio para la linealización Extendida, al igual que el caso anterior, se realiza un ejemplo de esta implementación. En el Capı́tulo 4: se hace un estudio de la linealización Exacta, método basado en la geometrı́a diferencial, se da un ejemplo donde se expone la implementación del mismo. En el Capı́tulo 5: se realiza el estudio de la linealización basada en la Velocidad, método que genera una representación cuasi-LPV del sistema no lineal, se expone un ejemplo de esta implementación. 1.7 Fundamentos Teóricos 6 En el Capı́tulo 6: se hace el análisis comparativo de todos los métodos de linealización anteriormente mencionados. Finalmente en el Capı́tulo 7: se realiza las conclusiones de todo el trabajo realizado y se hacen recomendaciones para futuros trabajos. 1.7 Fundamentos Teóricos En esta sección se desarrollan los conceptos teóricos fundamentales, que son necesarios para el desarrollo de todo el trabajo grado. 1.7.1 Sistema No Lineal (SNL) Dada la gran complejidad que representan los sistemas no lineales, debido a sus comportamientos y caracterı́sticas, y lo difı́cil de trabajar con ellos, es por tanto, que se recurre a las representaciones lineales en una región (linealización), con el propósito de estudiar su comportamiento y realizar acciones de control. Sea el sistema dado en la Ec. (1.1) como ẋ = f (t, x, u), (1.1) y = h(t, x, u), donde t el tiempo, x ∈ Rn estados, u ∈ Rm , entradas, y ∈ Rp salidas y f, h son funciones suaves. Se suele utilizar la notación de vectores para escribir (1.1) en una forma más compacta, como ecuaciones diferenciales n-dimensionales de primer orden (Khalil y Grizzle, 2000). La representación (1.1) describe de manera general, a los sistemas no lineales. Hay otras representaciones, pero no son tan generales, tales como la de Ec. (1.2). ẋ = f (x) + g(x)u . (1.2) y = h(x) La representación (1.2) es un sistema no lineal afines a la entrada caracterizado por ser lineal en la función de entrada u y las funciones f, g son funciones suaves, h : Rn → Rp es una transformación suave. 1.7 Fundamentos Teóricos 7 El sistema (1.1) se dice que es forzado o tiene una entrada en contraste al sistema descrito en la Ec. (1.3) de la forma ẋ = f (t, x), (1.3) para este caso, el sistema es no forzado (Vidyasagar, 2002). Un caso especial, ocurre cuando la función no depende explı́citamente del tiempo, ẋ = f (x), (1.4) en este caso, se dice que el sistema (1.4) es autónomo o invariante en el tiempo, es decir, que la variable t no afecta el lado derecho de la ecuación de estados, en caso contrario el sistema es no autónomo o variante en el tiempo (Khalil y Grizzle, 2000). 1.7.2 Campo Vectorial Definición 1.1. Un campo vectorial en Rn es una función F : D ⊆ Rn → Rn , que asigna a cada punto X = (x1 , x2 , · · · , xn ) de su dominio D un vector F (X) = (F1 (X), F2 (X), · · · , Fn (X)). Definición 1.2. Sea un conjunto abierto en R y una función f definida en ese conjunto y sea i ∈ Z + un entero no negativo, la función es de clase C ∞ o función suave si sus derivadas f 0 , f 00 . . . , f i existen y son continuas. 1.7.3 Derivada de Lie Sea h : Rn → Rn una función escalar suave y f : Rn → Rn un campo vectorial suave en Rn , entonces, la derivada de Lie (Lf h)de h con respecto de f es una función escalar definida como la derivada direccional de h en la dirección de f , dada como esta en la Ec. (1.5). Lf h = ∇ h f = ∂h f (x) ∂x De manera recursiva se expresa como la Ec. (1.6), (1.5) 1.7 Fundamentos Teóricos 8 L0f h = h, L1f h = .. . ∇h f, (1.6) Lif h = Lf Lfi−1 h = ∇hi−1 f, Para i = 0, 1, · · · , n. Además si g es otro campo vectorial entonces se tiene la Ec. (1.7), Lg Lf h = Lg (Lf h) = ∇(Lf h)g. 1.7.4 (1.7) Corchete de Lie Sea f y g campos vectoriales suaves en Rn , se define el corchete de Lie [f, g] de f y g, como un tercer campo vectorial dado por Ec. (1.8), [f, g] = ∇f g − ∇g f, ∂g ∂f g− f. = ∂x ∂x (1.8) Otra notación para el corchete de Lie es [f, g] = adf g. Al igual que la derivada de Lie, también se tiene de manera recursiva como en la Ec. (1.9). ad0f g = g, ad1f g = .. . ∇f g − ∇g f, (1.9) adif g = [f, adi−1 f g], Para i = 0, 1, · · · , n. 1.7.5 Estabilidad en el sentido Lyapunov Sea BR una región esférica (o bola), definida por kxk < R en el espacio de estados y SR la esfera misma, definida por kxk = R. Donde kxk es la norma del vector (Slotine et al., 1991). 1.7 Fundamentos Teóricos 9 Definición 1.3. El equilibrio de los estados x = 0 se dice que es estable si para cualquier R > 0 existe un r > 0, tal que, si kx(0)k < r, entonces kxk < R para todo t ≥ 0, de lo contrario, el punto de equilibrio es inestable. R el radio de la esfera SR y r es el radio de la esfera Sr . Este concepto de estabilidad en el sentido Lyapunov está definido para sistemas autónomos dado en la Ec. (1.4), donde el punto de equilibrio es el origen x(0) = 0. En este sentido, la estabilidad según Lyapunov, significa que la trayectoria del sistema se puede mantener arbitrariamente cerca del origen, para cualquier condición inicial lo suficientemente cerca del origen. Definición 1.4. Un punto de equilibrio es asintóticamente estable si es estable y si existe un r > 0 tal que, kx(0)k < r implica que, x(t) → 0, cuando t → ∞. Definición 1.5. Un punto de equilibrio es exponencialmente estable si existe α ∈ R+ y β ∈ R+ , tal que kx(t)k ≤ αkx(0)ke−βt , (1.10) x(0) ∈ Br , alrededor del origen, β es la tasa de convergencia exponencial. Esto puede entenderse, como que el vector de estados de un sistema exponencialmente estable, converge al origen tan rápido como una función exponencial (Slotine et al., 1991). Se dice que un sistema es estable si la energı́a total es continuamente decreciente, hasta que alcanza un estado de equilibrio. Por lo tanto, la función de energı́a debe ser definida positiva y su derivada definida negativa. No existe una manera sencilla de definir una función de energı́a para un sistema puramente matemático, Lyapunov, propuso una función de energı́a ficticia, llamada función de Lyapunov (Ogata, 1998). Definición 1.6. Sea V (x) una función escalar donde x es un vector de dimensión n, es definida positiva si los estados x satisfacen: V (x) = c (1.11) 1.7 Fundamentos Teóricos 10 Donde c es una constante positiva y se encuentra en una hipersuperficie cerrada en el espacio de estados de n dimensiones, al menos en la cercanı́a del origen, cuando V (x) → ∞, conforme kxk → ∞, entonces las superficies cerradas se extienden sobre el espacio de estados completo. Por lo tanto, si se encuentra una función escalar V (x) definida positiva, tal que, su derivada con respecto del tiempo, es definida negativa a lo largo de una trayectoria, el sistema es estable en el sentido Lyapunov. Finalmente, se tiene que si V (x) es una función continuamente diferenciable, tal que: 1. V (x) > 0 y V (0) = 0 en un dominio que no contiene al origen. 2. V (x) < 0 en un dominio que contiene al origen Indica que el sistema debe converger al origen. Se entiende, que esto aplica para sistemas autónomos dado en la Ec. (1.4). 1.7.6 Controlabilidad y Observabilidad de Sistemas No Lineales Sea M una variedad suave de dimensión n denotada por u en una vecindad abierta de x ∈ M . Considérese un sistema de control κ, descrito por coordenadas locales como: κ= ( Pm ẋ(t) = f (x(t)) + i=1 gi (x(t))ui (t) y(t) = h(x(t)) x(0) = x0 (1.12) Donde ui es una función de control, con valores en un conjunto convexo ω ⊂ R, con x ∈ M el estado de trayectoria y y(t) ∈ Rp la salida. Dado el sistema κ, inicialmente en x0 , el mapa entrada-salida es Sx0 : {t → u(t), t ∈ [0, T ]} → {t → y(t), t ∈ [0, T ]} . (M.R., 1987; Abderrahman, 2004; Hermann y Krener, 1977). (1.13) 1.7 Fundamentos Teóricos 11 Controlabilidad Definición 1.7. El sistema κ es controlable de xo si para cualquier xf ∈ Rn existe T > 0 y u : [0, T ] → u, tal que, la solución del sistema κ comienza en xo en t = 0, con control u que satisface x(T ) = xf . Si él solo se mantiene para un estado xf , en la vecindad de xo , entonces podemos decir que el sistema es localmente controlable desde xo . Para cada valor de control u ∈ U , sea X u el vector de campo correspondiente al control constante u, entonces si tenemos una familia ε = {X u , u ∈ U } de vectores de campos parametrizados por el valor de control. Tomando el criterio de accesibilidad para el sistema (1.12), se introduce unos nuevos vectores de campo generados por los elementos de M para cualquier vector de funciones X y Y , es posible definir el llamado corchete de Lie, dado como ∂X(x) ∂Y (x) X(x) − Y (x), ∀; x ∈ Rn . (1.14) ∂x ∂x Definición 1.8. Sea A(t, xo ), el conjunto de estados alcanzables a partir de xo en el [X, Y ](x) = tiempo xf , se dice que, el sistema es fuertemente accesible si para todo xo ∈ Rn y para todo tf > 0, el conjunto A(t, xo ) tiene interior no vacı́o. Si la dim(C(xo )) = n. El sistema de control (1.12) y la familia de vectores de funciones ε, asociado al conjunto de funciones, es llamada el algebra de Lie de la accesibilidad del sistema (1.12) y denotada como L (ε). El conjunto L (ε) es el algebra de Lie del vector de funciones, generado por la familia ε, para cada elemento de L (ε), es la combinación del corchete de Lie repetido de la forma k k−1 [X u , [X u 2 1 , · · · , [X u , X u ], · · · ]], i ui ∈ U, X u ∈ ε. (1.15) Teorema 1.7.1. El sistema de control analı́tico (1.12) es accesible del punto xo si y solo si la condición del rango de accesibilidad se mantiene en xo . Sea el sistema dado de la Ec. (1.16) x˙1 = − 21 x2 + u x˙2 = 1 x 2 1 (1.16) 1.7 Fundamentos Teóricos 12 Donde se rescribe el sistema de la forma (1.12). " f= − 12 x2 # g= 1 x 2 1 " # 1 (1.17) 0 Aplicando el corchete de Lie. [f, g] = " # 0 1 2 , (1.18) donde la matriz de Controlabilidad es " C = [g, [f, g]] = 1 0 0 1 . 2 # (1.19) Para que sea controlable el sistema, se tiene que la dim(C) = 2, por lo tanto, el sistema es controlable. Observabilidad Su definicion se basa en la indistinguibilidad de estados. Dos estados x1 , x2 ∈ Rn , se dice que son indistinguibles (x1 Ix2 ) si para cada función de entrada u en lazo abierto admisible, la función de salida t → y(t, x1 , u) del sistema, con estado inicial x(0) = x1 y la función de salida t → y(t, x2 , u) del sistema, con estado inicial x(0) = x2 , son idénticas en su dominio común de definición. El sistema es observable si (x1 Ix2 ), implica que x1 = x2 (M.R., 1987; Abderrahman, 2004; Hermann y Krener, 1977; Rı́os, 2003). Definición 1.9. El sistema κ se dice observable si para todos x1 , x2 ∈ ε, ellos son distinguibles (x1 6= x2 ), o el conjunto de estados indistinguibles O = ∅. Definición 1.10. El sistema κ es localmente observable en xo , si existe una vecindad W de xo tal que, en cualquier vecindad V de xo , contenida en W; la relación x1 Ix2 implica x1 = x2 . Si el sistema es localmente observable a cada xo , entonces el sistema es localmente observable. 1.7 Fundamentos Teóricos 13 Se dice que el sistema (1.12). El espacio de observación O, es el espacio lineal en R de las funciones sobre W, el cual, contiene las h1 , h2 , · · · , hj y todas las derivadas de Lie dadas como; Lx1 Lx2 · · · Lxk hj (1.20) Con j = 1, 2, · · · , p y todo xi que pertenece al conjunto {f, g1 , g2 , · · · , gm } , k = 1, 2, · · · . De forma, que contiene las funciones de salidas y todas sus derivadas a lo largo de las trayectorias del sistema. Teorema 1.7.2. Si las derivadas del conjunto de estados indistinguibles es de dimensión n correspondiente al orden del sistema (si dim(O(x)) = n), se dice que el sistema es localmente observable en to . Sea el sistema x˙1 = x22 u, x˙2 = y (1.21) = x1 aplicando la derivada de Lie a la salida, se tiene ẏ = x˙1 = x22 (1.22) ÿ = 2x2 x˙2 = 2x2 u donde la matriz de Observabilidad O está dada como O= " # y ẏ " = x1 0 0 x22 # (1.23) El sistema es observable, dado que la dimensión es 2, se debe acotar que para x1 , x2 = 0 es indistinguible los estados. 1.7.7 Linealización La linealización es una aproximación alrededor de una vecindad de un punto de operación, por lo cual, solo puede predecir el comportamiento local del sistema no lineal, 1.7 Fundamentos Teóricos 14 en la vecindad de ese punto. De otra manera, no puede predecir el comportamiento no local, lejos de la vecindad de ese punto de operación (Khalil y Grizzle, 2000). Serie de Taylor La serie de Taylor representa una función como una suma infinita de términos, que son calculados con los valores de la función derivada en un solo punto, definida en la Ec. (1.24) como ∞ X 1 dk f (x) f (x) = k! dxk k=0 donde xo corresponde al punto de interés, xo (x − xo )k dk f (x) dxk (1.24) , corresponde a la derivada de xo orden k de la función f (x) evaluada en xo . Linealización Fuera del equilibrio En este contexto, nos referimos a este tipo de linealización para un conjunto de puntos y no sobre una trayectoria, como lo es la linealización por expansión de series de Taylor. Además, el punto de operación necesariamente no es un punto de equilibrio, en tal sentido, esta linealización es una combinación de modelos lineales, evaluados en el conjunto de puntos, parametrizado por una variable, adoptando ası́, un sistema que es variante en el tiempo, el cual se caracteriza por definirse para cualquier trayectoria (Johansen et al., 1998; Johansen y Murray-Smith, 2000; Murray-Smith y Shorten, 1999). La linealización basada en la velocidad es una alternativa a esta tipo de linealización fuera del equilibrio. En el Capitulo 5 se profundiza acerca de este tema. 1.7.8 Sistemas Lineales Sea un sistema de m entradas y p salidas, descrito por un conjunto de ecuaciones diferenciales de primer orden como ẋ = Ax + Bu y = Cx , (1.25) 1.7 Fundamentos Teóricos 15 donde x ∈ Rn son los estados, u ∈ Rm las entradas, y ∈ Rp las salidas, y las matrices A,B,C son matrices de números reales, de dimensiones propias (Isidori, 2000). En la clasificación de sistemas lineales encontramos 3 tipos, donde el LPV es una generalización de un sistema LTI, cuando la trayectoria admisible es constante; y un sistema LTV para una trayectoria dada, dentro de un conjunto ya establecido. En la Figura 1.1 se ilustra la relación de los sistemas lineales Tóth (2008). Figura 1.1: Tipos de sistemas lineales LTI (Linear Time Invariant): sistemas lineales invariantes en el tiempo, caracterizados por su estructura fija (única trayectoria), además, es la clase de sistemas lineales más utilizadas y se define en la Ec. (1.26). ẋ(t) = Ax(t) + Bu(t) (1.26) y(t) = Cx(t) + Du(t) LTV (Linear Time Varying ): sistemas lineales variantes en el tiempo, no tienen asociada una teorı́a de análisis y sı́ntesis como la encontrada en los sistemas LTI, por lo cual, las aplicaciones están restringidas a problemas con una estructura dada. La descripción en variables de estado es completamente dependiente del tiempo, se describe en la Ec. (1.27). ẋ(t) = A(t)x(t) + B(t)u(t) (1.27) y(t) = C(t)x(t) + D(t)u(t) LPV (Linear Parameter Varying ): sistemas lineales a parámetros variantes, 1.7 Fundamentos Teóricos 16 dependen explı́citamente de un parámetro o un de vector de parámetros ρ(t), variables en el tiempo, está descrito en la Ec. (1.28). ẋ(t) = A(ρ(t))x(t) + B(ρ(t))u(t) (1.28) y(t) = C(ρ(t))x(t) + D(ρ(t))u(t) Donde x(t) ∈ Rn los estados, u(t) ∈ Rm las entradas y ρ ∈ R` el parámetro variante, las matrices A, B, C, D son de dimensión conocidas. Estabilidad de Sistemas Lineales Definición 1.11. Sea K ∈ R o K ∈ C un cuerpo y A una matriz cuadrada ndimensional sobre K, también llamada matriz de transición de estados, que define el comportamiento de los estados del sistema lineal, dado en (1.25). El polinomio caracterı́stico de A denotado por Pc A(t), es el polinomio definido como Pc A(λ) = Det(A − λI), (1.29) donde I es la matriz identidad n × n. Si las raı́ces del polinomio caracterı́stico del sistema, se ubican en el semiplano izquierdo complejo (si los polos son negativos), el sistema es estable, si las raı́ces se encuentran en el origen, el sistema es asintóticamente estable y si sus raı́ces están en el semiplano derecho complejo es inestable. 1.7.9 Sistemas Lineales a Parámetros Variantes (SLPV) Introducción a los sistemas LPV Surge de la evolución de la técnica de programación de ganancia, la cual, consiste en obtener modelos lineales invariantes en el tiempo (LTI), partiendo del modelo no lineal del sistema. El número de modelos depende de la cantidad de puntos de operación a trabajar, con la desventaja que no garantiza la estabilidad fuera de los puntos de operación Reyes (2012); González (2012); Osorio G. (2011). La idea básica es linealizar el modelo del sistema no lineal, en diferentes puntos de operación, resultando, en una colección local de sistemas LTI, los controladores 1.7 Fundamentos Teóricos 17 diseñados para cada punto de operación. La función de interpolación es llamada función de programación y es dependiente del punto de operación actual de la planta. Para describir los cambios del punto de operación, una señal es introducida, la cual es llamada; señal de programación y se denota con ρ, de manera que, los parámetros del sistema resultan dependientes de esta señal. En la Figura 1.2 se muestra el esquema de las señales actuantes en un sistema LPV Tóth (2008). r y u LPV Figura 1.2: Diagrama de Bloque de un sistema LPV (u entradas, y salidas y ρ el parámetro variante). Definición 1.12. Los sistemas donde ρ es una variable interna como los estados, las entradas o las salidas, se suelen llamar sistemas quasi-LPV. Ası́ que los sistemas con variable de programación externa son LPV. Sistemas LPV Un sistema LPV es aquel que depende explı́citamente de un vector de parámetros variables medibles y esta descrito como en la Ec. (1.30). ẋ = A(ρ)x + B(ρ)u + E(ρ)w, z = C(ρ)x + D(ρ)u + F (ρ)w, (1.30) y = Cy (ρ)x + Fy (ρ)w, donde A, B, C, D y F son matrices conocidas, x ∈ Rn , u ∈ Rm , w ∈ Rp , z ∈ Rq y y ∈ Rg , son el vector de estados, las entradas de control, las entradas exógenas, las salidas controladas y las salidas medidas. Se asume que ρ pertenece al conjunto convexo Ω Ec. (1.31). Ω = Ω : ρi ≤ ρi (t) ≤ ρi ∀i = 1, 2, · · · .` , (1.31) 1.7 Fundamentos Teóricos 18 donde ρi y ρi son las cota inferior y superior de ρi (t). El modelo evoluciona en función de una trayectoria paramétrica admisible, de manera que los puntos pertenecen al conjunto compacto Ω ∈ R` Corentin (2008); González (2012). Los parámetros ρ son medibles para todo instante de tiempo t ≥ 0 y cada parámetro ρi (t), varı́a en un rango de valores extremos conocidos Reyes (2012). Una manera de obtener un modelo LPV es a través de la linealización de sistemas no lineales, de la forma Ec. (1.1). Trabajando con la linealización basada en la expansión de series de Taylor o linealización aproximada, se obtienen M = 2k modelos locales, siendo k el numero de parámetros variantes, evaluando cada una de las M combinaciones de los lı́mites de los parámetros variantes en el sistema lineal de la forma Ec. (1.28). Se obtienen los M modelos locales, donde se formula el modelo LPV como en la Ec. (1.32): ẋ(t) = y(t) = M X i=1 M X εi (ρ(t))Ai x + εi (ρ(t))Ci x + i=1 M X i=1 M X εi (ρ(t))Bi u − ∆x (ρ(t)), (1.32) εi (ρ(t))Di u − ∆y (ρ(t)), (1.33) i=1 donde εi (ρ(t)) funciones de ponderación para cada uno de los i-modelos locales LTI, debido a la variación de los parámetros, evaluados en el punto de operación Pφ (xφ , uφ ) Osorio G. (2011) y ∆x (ρ(t)) = PM ∆y (ρ(t)) = PM i=1 εi (ρ(t))(Ai xφ + Bi uφ ), (1.34) i=1 εi (ρ(t))(Ci xφ + Di uφ − g(ρiφ )). Formulación Politópica Según Corentin (2008) hay tres formulaciones para los sistemas LPV, solo se aborda la representación politópica, la otras dos representaciones ver C.1. Un sistema politópico variante en el tiempo, es un sistema gobernado por la expresión de la Ec. (1.35) 1.7 Fundamentos Teóricos 19 ẋ(t) = A(ρ(t))x(t) + E(ρ(t))w(t), (1.35) z(t) = C(ρ(t))x(t) + F (ρ(t))w(t) donde (Ec. (1.36)) " A(ρ(t))E(ρ(t)) # = C(ρ(t))F (ρ(t)) N X " ρi (t) i=1 Ai Ei # . (1.36) Ci F i El término politópico (Ec. (1.37)) viene dado por el vector rho(t), correspondiente a la función de ponderación, N = 2k , que es la cantidad de combinaciones de los k parámetros ρi . Corentin (2008); Osorio G. (2011); Reyes (2012). N X ρi (t) ∀ ρi (t) ≥ 0. (1.37) i=1 Un politopo es un polı́gono convexo, por lo cual, la estabilidad del sistema poli tópico está dada por la estabilidad de los valores de los vértices en el sistema. Para obtener las funciones de ponderación se realiza el siguiente procedimiento (Ec. (1.38)) 1 1 1 , ··· , ∗ diag{α(i)} ∗ [f (α(i) , ρi , ρi ) − ρ]}, (1.38) ε(ρ(t)) = ϕ{diag δ1 δ2 δk donde ϕ es el producto de todos los elementos del vector v = [v1 , v2 , · · · , vs ]T . Se tiene que la Ec. (1.39) corresponde a ϕ(v) dado como s ϕ(v) = v1 v2 · · · vs = Π vi . (1.39) i=1 Y δi = ρi − ρi , α(i) es un vector binario auxiliar, que asigna -1 y 1 al lı́mite inferior y superior respectivamente, dado como α(1) = [ −1 −1 −1 · · · −1 −1 ] α(2) = [ α(3) .. . = [ −1 1 = α(2k − 1) = [ −1 k α(2 ) = [ 1 −1 −1 · · · −1 −1 ] 1 .. . −1 · · · −1 −1 ] . .. .. . . 1 1 ··· 1 1 ] 1 1 ··· 1 1 ] (1.40) 1.7 Fundamentos Teóricos 20 Y f (α(i), ρ, ρ) dada como: f (α(i), ρ, ρ) = 1 ρ + ρ + diag{α(i)} ∗ [ρ − ρ] 2 (1.41) Se resume el procedimiento para la obtención del modelo LPV del sistema no lineal: 1. Se definen los k parámetros variantes del sistema, al igual que las entradas. 2. Se definen los vértices del politopo, a partir del número de parámetros variantes del sistema. 3. Se linealiza el sistema de manera aproximada, y se asume que los parámetros varı́an lentamente, por lo tanto, el término ρ − ρo es despreciable. 4. Se evalúa el sistema linealizado en los vértices del politopo. 5. Se proponen 2k funciones de ponderación que cumplan con la restricción de ε(ρ) ≥ Pk 0 ∀t 2i=1 ε(ρ) = 1 6. Se pondera cada modelo obtenido al evaluar el modelo linealizado en cada vértice del politopo por su respectiva función de ponderación, de tal forma que se obtiene un sistema equivalente a (1.32). 1.7.10 Controlabilidad de Sistemas Lineales Se dice que el sistema lineal (1.25) es controlable si es posible llegar a un estado final en un tiempo finito, a partir del conocimiento de la señal de entrada, dado un estado inicial. la matriz de Controlabilidad de un sistema lineal, esta dado en (1.42). h i 2 n−1 C = B AB A B · · · A B (1.42) Se tiene como criterio, la condición del rango de la matriz de Controlabilidad, establecida como dim(C) = n. 1.7 Fundamentos Teóricos 1.7.11 21 Observabilidad de Sistemas Lineales Un sistema lineal dado en (1.25), se dice que es observable si a partir del conocimiento de la salida del sistema y de la entrada, es posible obtener un estado inicial en tiempo finito. La matriz de Observabilidad, está dada en (1.43) como C CA 2 O = CA . .. n−1 CA (1.43) La condición para la observabilidad se establece como el rango de la matriz de observabilidad (dim(O) = n). 1.7.12 Control por Realimentación del Vector Estados (RVE) Se aborda esta estrategia de control para sistemas lineales, para los sistemas no lineales debido a su complejidad, es difı́cil modificar el comportamiento, ası́ como manipular los estados. Por lo tanto, el enfoque solo será tratado en los sistemas lineales. Estrategia de control que se basa en la manipulación de los estados para realizar una modificación del comportamiento del sistema. La idea principal consiste en formular una ley, dada como u = −Kx, (1.44) donde u ∈ R es la entrada de control al sistema, x ∈ Rn los estados del sistema y K las ganancias del sistema, que permiten modificar el sistema a controlar Ogata (1998). Una de las condiciones necesarias para llevar esta estrategia de control, es que el sistema sea controlable y observable, ya que se necesita que los estados del sistema sean medibles (condición de Controlabilidad y Observabilidad). Reemplazando (1.44) en (1.25) se tiene 1.7 Fundamentos Teóricos 22 ẋ = Ax + B(−Kx) = (A − BK)x (1.45) En la Figura 1.3 se muestra el esquema del controlador por RVE Figura 1.3: Esquema del controlador por RVE El polinomio caracterı́stico determina el nuevo comportamiento del sistema en lazo cerrado. Además, este nuevo polinomio caracterı́stico, está conformado por el polinomio del sistema en lazo abierto y las ganancias, que permiten ubicar el polinomio caracterı́stico en la posición deseada. Cuando todos los estados del sistema no son medibles (observables), es necesario construir un observador, para los estados no medibles del sistema. 1.7.13 Observador de Estados Tomando el sistema en espacio de estados descrito en (1.25) y sea el sistema x˙e = F xe + Gu + Hy, (1.46) donde xe ∈ Rn describe los estados del sistema estimado, y ∈ Rp salidas y u ∈ Rm la entrada del sistema de la Ec. (1.25). La Ec. (1.46) describe un estimador (observador) del sistema 1.25 y además de cumplir con las siguientes condiciones. 1. Los estados de ambos sistemas coinciden en un instante de tiempo t0 , tal que xe (t0 ) = x(t0 ), de manera que, los estados coinciden para cualquier instante de tiempo y para cualquier entrada u(t) suministrada al sistema. 1.7 Fundamentos Teóricos 23 2. xe (t) debe converger asintóticamente al estado x(t) para cualquier entrada u(t) y para cualquiera de los estados inı́ciales xe (t0 ) y x(t0 ) lim (xe (t) − x(t)) = 0 t→∞ (1.47) que corresponde al error de estimación de los estados del sistema de la Ec. (1.25). Sea x̃ = xe − x el error que se incurre al estimar los estados, se tiene que x˙e (t) − ẋ(t) = F xe − Ax + (G − B)u + HCx. (1.48) Como la entrada no debe influir en los estados, se tiene que G = B, el sistema queda x˙e (t) − ẋ(t) = F xe − Ax + HCx. (1.49) Y además F = A − HC, quedando ˙ = (A − HC)(xe − x), xe˙(t) − x(t) (1.50) representa el observador de estados del sistema, donde H es la ganancia del sistema. Para que estime los estados rápidamente, la dinámica del observador debe ser más rápida en comparación a la del controlador Domı́nguez (2002). En la Figura 1.4 se muestra el esquema del observador de estados. 1.7 Fundamentos Teóricos Figura 1.4: Observador de estados 24 Capı́tulo 2 Linealización Aproximada 2.1 Introducción La mayorı́a de sistemas en la naturaleza tienen dinámicas no lineales, cuyo estudio podrı́a ser de una complejidad muy alta. Por lo tanto, reducir la complejidad permite estudiar de manera más sencilla los sistemas dinámicos no lineales, por la cual, se aproxima el sistema no lineal (linealización), por medio de la recta tangente o plano tangente (dependiendo de la dimensión del sistema), a un sistema lineal alrededor de un punto de equilibrio. 2.2 Punto de equilibrio Un punto de equilibrio representa las condiciones de las variables del sistema, en donde este se encuentra en estado estacionario. Definición 2.1. Sea x = x∗ un punto en el espacio de estados, se dice que es un punto de equilibrio del sistema (1.3), si para cualquier estado del sistema que empieza en x∗, permanece en x∗ para todo tiempo futuro. Para un sistema autónomo (1.4), los puntos de equilibrio son las raı́ces reales de f (x) = 0. Un sistema lineal puede tener sólo un punto de equilibrio, por lo tanto, puede tener un punto de funcionamiento en estado estacionario que atrae el estado del sistema, independientemente del estado inicial, mientras que un sistema no lineal, puede tener 2.3 Linealización de Sistemas No Lineales 26 más de un punto de equilibrio. El estado puede converger a uno de los varios puntos de funcionamiento en estado estacionario, dependiendo del estado inicial del sistema (Khalil y Grizzle, 2000). si aplicamos cierto control al que llamaremos control nominal, el sistema dinámico se moverá y generará una trayectoria de estado Xn . El funcionamiento para este control Un , será un llamado punto nominal, el cual también se conoce como su punto de operación. 2.3 Linealización de Sistemas No Lineales Sea la función no lineal de la Ec. (2.1). y = f (x), (2.1) función dependiente de los estados, tal que f : R → R y tomando la serie de Taylor (1.24), truncada en los términos de primer orden, y = f (x) = f (xo ) + donde y = y − yo dk f (xo ) df (xo ) (x − xo ) + · · · + (x − xo )k , dx dxko (2.2) x = x − xo . Reescribiendo el sistema como y − y0 = y = df (xo ) (x − xo ), dx df (xo ) x. dx (2.3) Definición 2.2. Se define a la derivada como la pendiente de la función que pasa en un punto, como observa claramente en la Figura 2.1 que el sistema resultante obedece a la función de una recta. 2.3 Linealización de Sistemas No Lineales 27 y= f’(x) (x- xe) y = f(x) xe Figura 2.1: Recta tangente Si la función depende de un vector de estados, entonces f : Rn → R, esta extensión se entiende como el plano tangente sobre una superficie no lineal (ver Figura 2.2). Figura 2.2: Plano tangente Por lo que, el sistema se escribe como y = f (xo ) + ∇f (x)T (x − xo ) + · · · + dk f (xo ) (x − xo )k , dxko (2.4) donde ∇f (x) corresponde al gradiente de la función f (x), y está definido como, ∇f (x) = h ∂f ∂x1 ··· ∂f ∂xn i . (2.5) Para mostrar el proceso de linealización de sistemas no lineales, hacemos uso de la matriz Jacobiana Jf (x1 , · · · , xn ) definida como, 2.3 Linealización de Sistemas No Lineales 28 ∂f1 ∂x1 . . Jf (x1 , · · · , xn ) = . ∂fn ∂x1 ··· ··· ··· ∂f1 ∂xn .. . , (2.6) ∂fn ∂xn donde f ∈ Rn funciones de derivadas de primer orden, x ∈ Rm variables independientes, por lo tanto, el jacobiano está conformado por la derivadas parciales de primer orden de una función multivariable. El Jacobiano permite representar de manera más general el proceso de linealización. Aplicando el Jacobiano para cada función y cada variable independiente, se tiene ∂f1 ∂x1 . ∂f (xo , uo ) . = . ∂x ∂fn ∂x1 ··· ··· ∂f1 ∂xn .. . ··· ∂fn ∂xn ··· ∂hp ∂xn ; ∂f1 ∂u1 . ∂f (xo , uo ) . = . ∂u ∂fn ∂x1 (xo ,uo ) ··· ··· ∂f1 ∂um .. . ··· ∂fn ∂un ··· ∂hp ∂um ; (xo ,uo ) (2.7) ∂h1 ∂x1 . ∂h(xo , uo ) . = . ∂x ∂h1 ∂x1 ··· ··· .. . ∂hp ∂xn ; ∂h1 ∂u1 . ∂h(xo , uo ) . = . ∂u (xo ,uo ) ∂hp ∂u1 ··· ··· .. . ∂hp ∂um , (xo ,uo ) (2.8) donde el sistema linealizado queda ∂f (xo , uo ) ∂f (xo , uo ) x+ u, ∂x ∂u ∂h(xo , uo ) ∂h(xo , uo ) y= x+ u, ∂x ∂u ẋ = (2.9) (2.10) Reescribiendo el sistema en forma matricial para A, B, C y D, que representan el Jacobiano para cada función respecto de los estados y las entradas, el sistema linealizado de manera aproximada es: ẋ = Ax + Bu, y = Cx + Du, correspondiente a la estructura de un sistema lineal, donde (2.11) 2.4 Requerimientos y Condiciones de la linealización Aproximada ∂f (xo , uo ) ; ∂x ∂h(xo , uo ) C= ; ∂x A= tal que x = x − xo , 2.4 u = u − uo , Requerimientos 29 ∂f (xo , uo ) ; ∂u ∂h(xo , uo ) D= , ∂u B= y = y − yo . y Condiciones de la linealización Aproximada En esta sección se describe las condiciones, caracterı́sticas y requerimientos necesarios para realizar la linealización. Caracterı́sticas • Soporta cualquier tipo de sistema no lineal (Ec. 1.1) que tenga primera derivada continúa. • Se aproxima al sistema no lineal en cercanı́as del punto de equilibrio. • La representación es lineal en el punto de equilibrio. • Facilita el análisis del sistema no lineal, mediante el modelo lineal aproximado alrededor de un punto de equilibrio. • El sistema no lineal puede tener múltiples entradas y múltiples salidas (MIMO). • El diseño del controlador se realiza solo para la vecindad de un punto de equilibrio. Requerimientos y Condiciones • El sistema no lineal debe ser diferenciable con primera derivada continua de Lipschitz. • Si el sistema tiene punto de equilibrio diferente de cero, el sistema debe ser trasladado mediante variables incrementales. 2.5 Ejemplo de un tanque cónico por linealización aproximada 30 • Al trabajar lejos del punto de equilibrio la aproximación no representa al sistema no lineal. • No es aplicable a sistemas que exhiban no linealidades carentes de derivadas. 2.5 Ejemplo de un tanque cónico por linealización aproximada Sea un tanque cónico como se muestra en la Figura 2.3. Figura 2.3: Tanque cónico Donde la ecuación que representa la dinámica está dada como, ḣ = − 0.05 u √ + √ , 2 π tan (θ) h3 π tan (θ) h 2 (2.12) donde h : Altura del Tanque, θ : ángulo del cono con un valor de 20 grados. En la Figura 2.4 se observa la respuesta del tanque cónico para un caudal qi = 0.0707, correspondiente a una altura de h = 2m, donde la condición inicial es para una altura de ho = 0.01m. 2.5 Ejemplo de un tanque cónico por linealización aproximada 31 tanque no lineal tanque no lineal 2 Altura del Tanque (m) X: 771.4 Y: 2 1.5 1 0.5 0 0 100 200 300 400 500 Tiempo (s) 600 700 800 Figura 2.4: Respuesta del tanque cónico no lineal El punto de equilibrio del sistema está dado como 0=− 0.05 u √ + √ , 2 π tan2 (θ) h3 π tan (θ) h h = H, (2.13) √ U = 0.05 H, (2.14) linealizando el sistema se tiene h˙ = 2U 0.075 √ − 2 5 π tan2 (θ)H 3 π tan (θ) H ! h+ U √ u. π tan (θ) H 2 (2.15) Evaluando el sistema linealizado en el punto de equilibrio, obtenemos h˙ = ! √ √ 0.075 2(0.05 H) 0.05 H √ √ (u − U ). − (h − H) + π tan2 (θ) H π tan2 (θ) H 5 π tan2 (θ)H 3 (2.16) Se evalúa H = 2m como punto de operación del sistema, por lo tanto, la respuesta del sistema se muestra en la Figura 2.5. 2.5 Ejemplo de un tanque cónico por linealización aproximada 32 tanque por linealizacion aproximada tanque lin. aprox. 2 Altura del Tanque (m) X: 789.8 Y: 2 1.5 1 0.5 0 0 100 200 300 400 500 Tiempo (s) 600 700 800 Figura 2.5: Tanque cónico por lin. Aproximada Finalmente, se realiza la comparación del sistema no lineal con el aproximado, para observar cuánto se aproxima el sistema linealizado al no lineal (ver Figura 2.6). comparacion del sistema no lineal con la lin. aprox X: 129 Y: 1.882 2 Altura del Tanque (m) X: 784.4 Y: 2 X: 129.2 Y: 1.495 tanque no lineal tanque lin. aprox. 1.5 1 0.5 0 0 100 200 300 400 500 Tiempo (s) 600 700 800 Figura 2.6: Comparación del sistema no lineal con el linealizado Capı́tulo 3 Linealización Extendida 3.1 Introducción La linealización extendida es un método propuesto Baumann y Rugh (1986), para el control de sistemás dinámicos no lineales. Está basado en la linealización aproximada alrededor de un punto de equilibrio, pero en este caso, el punto de equilibrio es implı́cito, lo cual permite la obtención de un modelo parametrizado de carácter lineal. Dicho punto de equilibrio, puede considerarse que es correspondiente a cada valor del punto de referencia constante del sistema en lazo cerrado. Esta aproximación está basada en la obtención de una familia de modelos lineales, parametrizado por puntos de equilibrios constantes. Las ganancias de realimentación de estados no lineales, están calculadas para que los autovalores del sistema linealizado en lazo cerrado, se localicen en valores especı́ficos, los cuales son invariantes para todos los puntos de operación, en una vecindad del punto de operación constante nominal. La principal caracterı́stica del método, es la propuesta de un controlador no lineal, cuya linealización alrededor del punto de equilibrio coincide con el controlador lineal, que se ha diseñado para la familia de modelos lineales parametrizados por el punto de equilibrio. Las soluciones del controlador no lineal, son infinitas, por lo cual, la solución que se adopta será aquella que produzca un efecto linealizante sobre el sistema en lazo cerrado Sira Ramirez (1994b). 3.2 Control por Realimentación de Estados por linealización Extendida 3.2 34 Control por Realimentación de Estados por linealización Extendida Sea el sistema no lineal definido como ẋ = f (x, u), (3.1) donde x ∈ Rn estados y u ∈ Rm las entradas, f : Rn × Rm → Rn , es una función analı́tica en una vecindad del origen con f (0, 0) = 0. Los puntos de operación constantes corresponden a entradas constantes diferentes de cero, u(t) = U . Se asume que la linealización de (3.1) alrededor de cero, tiene autovalores diferentes de cero, esto es D1 f (0, 0) es invertible. Entonces por el teorema de la función implı́cita ẋ = f (x, U ) = 0. (3.2) Tiene solución única para x como una función analı́tica de U . Si la ley de realimentación de estados se escribe de la forma: u = −k(x), (3.3) donde k : Rn → Rm es analı́tica, k(0) = 0. Esto produce la ecuación de estado ẋ = f (x, −k(x)). (3.4) Además si el sistema en lazo cerrado tiene el mismo punto de operación que el sistema (3.1) debe cumplirse que f (X(U ), −k(X(U ))) = 0. (3.5) En virtud del teorema de la función implı́cita, si existe la solución X(U ) de (3.5) la misma es única, si y solamente si, el sistema linealizado en lazo cerrado en el punto de operación constante, es invertible. La linealización del sistema en lazo cerrado alrededor de un punto de operación, produce la ecuación de estado lineal dada por 3.2 Control por Realimentación de Estados por linealización Extendida ∂f (X(U ), −k(X(U ))) ∂f (X(U ), U ) ∂f (X(U ), U ) ∂k(X(U )) = − , ∂X(U ) ∂X(U ) ∂U ∂X(U ) donde X(U ) y U corresponde al punto de operación constante. 35 (3.6) Se cumple que −k(X(U )) = U y la solución de X(U ) obtenida en (3.5) coincida con la que se obtiene en (3.2). La cual conduce a que la linealización del sistema en lazo cerrado alrededor de su punto de operación, tenga autovalores en el semiplano izquierdo complejo diferentes de cero. Además se asume que el sistema linealizado es completamente controlable. Reescribiendo el sistema mediante A(U ), B(U ) y K(U ) como los Jacobianos de: A(U ) = ∂f (X(U ), U ) ∂k(X(U )) ∂f (X(U ), U ) ; B(U ) = ; K(U ) = . ∂X(U ) ∂U ∂X(U ) (3.7) Teorema 3.2.1. Supóngase que el sistema analı́tico (3.1), tal que, el par (A, B) es controlable. Entonces, existe una ganancia de realimentación k(· ) : Rn → Rm con k(0) = 0 tal que, los autovalores del sistema linealizado en lazo cerrado [A(U ) − B(U )K(U )] tienen valores pre-especı́ficados y son localmente invariantes con respecto de U , en el entorno de operación implı́cito. Prueba 1. Primero demostraremos que x satisface a ẋ(0) 6= 0. Se supone que f˙(0, 0) es invertible y si no lo es, mediante la realimentación previa del vector de estados podemos hacer todos los autovalores de ∂f ∂x = ∂f (x,u) ∂x − ∂f ∂k ∂x ∂x distintos de cero, por lo tanto, la matriz es invertible. Considérese f (X(U ), U ) = 0, (3.8) entonces df (X(U ), U ) ∂f (X(U ), U ) dX(U ) ∂f (X(U ), U ) = + = 0, dU ∂X(U ) dU ∂U por lo tanto, dX(U ), U ) ∂f (X(U ), U ) −1 dX(U ) = 6= 0. dU ∂X(U ) dU (3.9) (3.10) 3.3 Requerimientos y Condiciones de la linealización Extendida 36 Por conveniencia se asume que la primera componente de x1 , de x satisface dX1 dU 6= 0. Entonces, por el teorema de la función inversa hay una función inversa analı́tica X1−1 (x1 ) = U . Haciendo k̃(U ) = k(X(U )) y usando k(X(U )) dX(U ) = K(U ), diferenciando tenemos que k̃(U ) satisface dX(U ) ∂ k̃(X(U )) = K(U ) . ∂X(U ) dU (3.11) Utilizando el método de separación de variables, para ecuaciones diferenciales parciales, tenemos Z Z X1−1 (x1 ) dk(X(U )) = K(U ) U dX(U ) dX(U ) + µ(xi ). dU (3.12) Como son Ki variables, repetimos el proceso, tal que, µ(xi ) es una función dependiente de los estados xi asociada a ki y a la condición de contorno, dada como −k(X(U ), U ) = U . Donde requerimos que k(0) = 0. Ası́ que el lado derecho es conocido, k(U ) está dado por la integración. La prueba se completa verificando que Z X1−1 (x1 ) k(x) = n K(σ) U X dX(σ) dσ + Kj (X1−1 (x1 ))[xj − Xj (X1−1 (x1 )), dσ j=2 (3.13) donde Kj (U ) es la j-ésima componente de K(U ). Para j = 2, ..., n. 3.3 Requerimientos y Condiciones de la linealización Extendida En esta sección se dan las bases para poder realizar la linealización extendida, ası́ como las caracterı́sticas que posee. Caracterı́sticas • Soporta cualquier tipo de sistema no lineal, como el de la Ec. 1.1, con primera derivada continúa. 3.3 Requerimientos y Condiciones de la linealización Extendida 37 • Basada en la linealización aproximada en un punto de equilibrio parametrizado (genérico), para el cual, se le diseña un controlador por realimentación de estados que estabiliza el sistema en el punto de equilibrio. • El sistema soporta múltiples entradas y múltiples salidas. • Las soluciones del controlador no lineal son múltiples. • Las variables del sistema retienen el significado fı́sico ya que no hay transformaciones de dichas variables. • La solución del controlador no lineal es obtenida por la solución de ecuaciones diferenciales parciales. • El método propone un compensador de carácter no lineal, cuya linealización alrededor del punto de equilibrio, coincide con el compensador lineal que se ha diseñado para la familia de modelos lineales parametrizado por el punto de operación. Requerimientos y Condiciones • El sistema no lineal debe ser diferenciable con primera derivada continua de Lipschitz. • El controlador no lineal debe coincidir con el controlador lineal obtenido mediante la linealización del sistema en el punto de operación. • Las ganancias de realimentación de estados se colocan en valores especı́ficos del semi-plano izquierdo complejo, tales que, al mismo tiempo sean invariantes para todos los puntos de operación constantes en lazo cerrado, en una vecindad del punto de operación constante nominal en lazo cerrado. • El sistema linealizado en lazo cerrado no debe tener auto-valores en el origen. 3.4 Ejemplo de un péndulo simple por linealización extendida 3.4 38 Ejemplo de un péndulo simple por linealización extendida Sea el sistema no lineal de un péndulo simple, que se muestra en la Figura 3.1. Figura 3.1: Péndulo simple Donde la ecuaciones dinámicas que rigen el movimiento están dadas como x˙1 = x2 , 1) + x˙2 = − mgl cos(x J y = u , J (3.14) x1 . El punto de equilibrio del sistema está dado como U x2 = 0, u = U, x1 = cos mgl Linealizando el sistema de manera aproximada se tiene −1 . (3.15) " # " #" # " # x˜˙1 0 1 x˜1 0 = mgl + ũ. 1 x˜˙2 sin(X ) 0 x ˜ 1 2 J J (3.16) Utilizando una ley de control por realimentación de estados, dada como u = −k1 x˜1 − k2 x˜2 . (3.17) Realimentando el sistema con el controlador, se tiene " # " x˜˙1 0 = mgl x˜˙2 sin(X1 ) − J 1 k1 J − kJ2 #" # x˜1 x˜2 . (3.18) 3.4 Ejemplo de un péndulo simple por linealización extendida 39 Se obtiene el polinomio caracterı́stico del sistema, dado por P c = det(sI − A), que resulta como P c = s2 + k1 mgl sin(X1 ) k2 s+ − . J J J (3.19) Tomando un polinomio deseado de segundo orden como P d = s2 + 2ωnζs + ωn2 . (3.20) Igualando y hallando las ganancias para k1 y k2 se tiene : k1 = Jωn2 + mgl sin(x1 ), k2 = 2Jωnζ. (3.21) Para hallar el controlador no lineal, se integran ambas ecuaciones. Para k2 se tiene Z k2 = x2 2Jωnζdσ = 2Jωnζx2 + µ(x1 ). (3.22) 0 Y para k1 Z x1 (Jωn2 + mgl sin(σ))dσ = Jωn2 x1 − mgl cos(x1 ) + K. (3.23) 0 Finalmente, el controlador está dado como u = −k(x), u = −Jωn2 x1 + mgl cos(x1 ) − 2Jωnζx2 − K. (3.24) Para hallar K se utiliza la condición de contorno U = K(X1 , 0, U ), entonces K es K = −Jωn2 X1 . (3.25) El controlador no lineal queda como u = −Jωn2 (x1 − X1 ) + mgl cos(x1 ) − 2Jωnζx2 . (3.26) Reemplazando el controlador en el sistema no lineal, se tiene x˙1 = x2 , x˙2 = −ωn2 (x1 − X1 ) − 2ωnζx2 . (3.27) 3.4 Ejemplo de un péndulo simple por linealización extendida 40 Se observa que el controlador tiene un efecto linealizante sobre el sistema. En la Figura 3.2 se muestra la respuesta del sistema no lineal. sistema no lineal de un pendulo 0.5 Angulo (rad) 0 −0.5 −1 −1.5 −2 0 200 400 600 800 1000 Tiempo (s) Figura 3.2: Péndulo no lineal Para realizar la simulación se utilizaron los siguientes valores de los parámetros del sistema m = 0.16, g = 9.8, l = 0.5, J = 0.0043, ωn = 0.04, ζ = 0.3, con un valor de la entrada u = 0.4 alrededor del punto X1 = 1.035. Como se observa, la respuesta es bastante oscilatoria debido a la localización de los polos del sistema en el origen. Realizando la linealización extendida del sistema, la respuesta está dada como se muestra en la Figura 3.3. 3.4 Ejemplo de un péndulo simple por linealización extendida lin. extendida de un pendulo controlador por linealizacion extendida 0.8 1.5 error 0.6 X: 676.6 Y: 1.035 X: 513.8 Y: 0.4013 0.4 0.2 Angulo (rad) 1 Velocidad Angular (rad) 0 0.5 0 41 0 500 Tiempo (s) 1000 0 500 1000 Tiempo (s) lin. extendida de un pendulo 0.04 0.02 0 X: 632.2 Y: −1.685e−05 −0.02 0 500 Tiempo (s) 1000 Figura 3.3: Péndulo por linealización Extendida Se observa que el sistema cumple con las condiciones y caracterı́sticas descritas para llevar acabo la linealización extendida, el controlador no lineal tiene un efecto linealizante sobre el sistema. Al realizar la linealización extendida al sistema, se consigue cambiar la respuesta oscilatoria y además se logra obtener un seguimiento de la trayectoria y una estabilización del sistema rápida. Esto es posible, debido a que los polos del sistema en lazo cerrado, se ubican en el semiplano izquierdo y son diferentes de cero. Capı́tulo 4 Linealización Exacta 4.1 Introducción La linealización exacta es un método propuesto por Isidori (2000), basado en la geometrı́a diferencial. Consiste en realizar una transformación de coordenadas del sistema, de manera que éste pueda escribirse en la forma canónica controlable. Luego se diseña un controlador por realimentación de estados, que linealiza el sistema en un entorno. El controlador debe tener la capacidad de ubicar los polos del sistema en el semiplano izquierdo (el controlador por realimentación es estable) Khalil y Grizzle (2000). El diseño de la ley de control por realimentación de estados no lineal, se hace para obtener un entorno lineal y sobre este se diseña el control, por lo tanto, la validez del método es local; es decir que solo se puede garantizar la estabilidad asintótica, de ninguna manera global. La zona de atracción es determinada por las caracterı́sticas del sistema no lineal, resaltando que el sistema en lazo cerrado debe estabilizarse en el punto de operación deseado. Sin embargo, en la definición de la ley de control linealizante, pueden aparecer valores para los cuales no están definidos los estados (singularidades), que limitan el entorno de operación, lo que trae como consecuencia que para dichos valores donde ocurren las singularidades, el sistema no puede realizar una acción de control. Además resulta difı́cil saber si para ciertas condiciones inı́ciales dadas, la trayectoria del sistema 4.1 Introducción 43 se acerca a tales singularidades, lo que conlleva a ciertas restricciones en la ley de control linealizante Sira Ramirez (1994a). 4.1.1 Difeomorfismo Definición 4.1. Una función φ : Rn → Rn definida en una región Ω de Rn se llama Difeomorfismo, si es suave y su inversa Ω−1 , existe y es suave. Sea una función suave φ definida en una región Ω de Rn . Si el Jacobiano de la matriz φ dado como Jφ (x), es no singular en un punto x0 de Ω, entonces φ(x) es un difeomorfismo local en una subregión de Ω. Definición 4.2. El grado relativo r se define como el número de veces que se debe derivar la salida y(t) en t = t0 para que el valor u(t0 ) de la entrada explı́cita aparezca. Teorema 4.1.1. El sistema (1.2) tiene grado relativo r en un punto x0 , si: 1. Lg Lkf h(x) = 0 para todo x en una vecindad de x0 y todo k < r − 1. 2. Lg Lk−1 f h(x) 6= 0. Existen puntos donde el grado relativo no puede ser definido, esto ocurre cuando la primera función de la secuencia Lg h(x), Lg Lf h(x), · · · , Lg Lkf h(x), . . . , (4.1) no es idénticamente a cero (en una vecindad de x0 ), pero tiene un cero exactamente en x = x0 . Sin embargo, el conjunto de puntos donde el grado relativo puede ser definido, es un abierto y un subconjunto denso del conjunto U , donde el sistema (1.2) es definido. Nótese que si la condición de: Lg Lk−1 f h(x) = 0. (4.2) Para todo x en una vecindad de x0 y todo k > 0. En este caso, el grado relativo no puede ser definido en ningún punto alrededor de x0 , entonces la salida del sistema no es afectada por la entrada para todo t cerca de t0 . 4.2 Linealización Exacta 4.2 44 Linealización Exacta La linealización por realimentación, es una aproximación al diseño del control no lineal, cuya idea principal es transformar algebraicamente el sistema no lineal en uno lineal, alrededor de un entorno de operación, para luego aplicarle las técnicas de control lineal Slotine et al. (1991). Esta linealización es completamente diferente a la linealización Jacobiana, dado que en la linealización por realimentación se logra por una transformación exacta de los estados y un controlador por realimentación de estados. El objetivo principal es cancelar las no linealidades del sistema, imponiendo una dinámica lineal deseada, la cual se limita a una clase especı́fica de sistemas no lineales, descritos por la llamada forma canónica controlable. Tomando el sistema no lineal a fines al control en (1.2). Si ẏ se define como ẏ = = ∂h ẋ, ∂x ∂h f (x) ∂x + ∂h g(x)u, ∂x (4.3) = Lf h(x) + Lg h(x)u, donde Lf h(x) = ∂h f (x) ∂x es la derivada de Lie de h con respecto a f , esta notación es conveniente cuando se repite el cálculo de la derivada con respecto a la misma dirección del campo, o en uno nuevo. Repitiendo el proceso hasta la n-ésima derivada de y se tiene la Ec. (4.4), y = h(x), ẏ = Lf h(x) + Lg h(x)u, ÿ = L2f h(x) + Lg Lf h(x)u, para n = 1, 2, · · · , k. (4.4) : : h(x)u, y (n) = Lnf h(x) + Lg Ln−1 f Tomando z como los nuevos estados en la nueva coordenada, se tiene la Ec. (4.5). 4.2 Linealización Exacta 45 z0 = h(x), z1 = Lf h(x), z2 = L2f h(x), (4.5) : : zn = Lnf h(x). El estado z se denomina el estado linealizante. Definición 4.3. Un conjunto de vectores de campo linealmente independientes f1 , f2 , · · · , fm ∈ Rn , se dice que es completamente integrable si y solo si existe n − m funciones escalares h1 (x), h2 (x), · · · , hn−m (x), que satisfacen el sistema de ecuaciones diferenciales parciales ∇hi fj = 0, (4.6) donde 1 ≤ i ≤ n − m, 1 ≤ j ≤ m, y el gradiente ∇hi es linealmente independiente. Definición 4.4. Un conjunto de vectores de campo linealmente independientes f1 , f2 , · · · , fm , se dice que es involutivo si y solo si, hay αijk : Rn → R funciones escalares tal que [fi , fj ](x) = m X ∀i, j. αijk (x)fk (x), (4.7) k=1 Involutividad, significa que si se forma el Corchete de Lie de un par de vectores de campo del conjunto f1 , f2 , · · · , fm , entonces el vector de campo resultante puede expresarse como una combinación lineal del conjunto de vectores de campo original. Vectores de campo constantes, siempre son involutivos, dado que el Corchete de Lie de dos vectores constantes es cero (Slotine et al., 1991). Teorema 4.2.1. El sistema (1.2) para que sea linealizable de manera exacta en una región Ω debe cumplir con las siguientes condiciones: 1. Los campos vectoriales (Controlabilidad). g, adf g, . . . , adfn−1 g son linealmente independientes 4.2 Linealización Exacta 46 2. El conjunto g, adf g, . . . , adn−2 g es involutivo. f Para que el sistema sea lineal, se toma una ley de control no lineal, como la Ec. (4.8), u= 1 (v Lg Lfn−1 h(x) − Lnf h(x)). (4.8) Reemplazando la Ec. (4.8) en y n , el mapa entrada-salida se reduce a la Ec. (4.9) y n = v. (4.9) Logrando ası́ una relación lineal donde n es la cadena de integradores. Finalmente, dado que el nuevo sistema transformado incluye polos en el origen, se debe diseñar una ley de control v, para que el sistema tenga autovalores en el semiplano izquierdo, además debe seguir la trayectoria del sistema, por lo tanto, la nueva ley de control está dada como: v = −k1 x1 − k2 x2 − · · · − kn xn , (4.10) donde el estado de la salida del sistema original para esta ley de control, se da como x = x − Xo . El controlador no lineal del sistema es el de la Ec. (4.11): u= 1 ((−k1 x1 Lg Ln−1 h(x) f − k2 x2 + · · · − kn xn ) − Lnf h(x)). (4.11) Grado Relativo definido Cuando el grado relativo es igual al grado del sistema, se puede linealizar el sistema en la región Ω, por lo tanto, la elección de la variable de salida h(x) determina si el grado relativo es menor o igual al grado del sistema. Tal que, se cumple la condición Lg Lfk−1 h(x) 6= 0, la cual refleja que la entrada u, aparece en la última ecuación, quedando en la forma canónica controlable. Entonces la ley de control linealizante del sistema queda como: u= v − Lrf h Lg Lr−1 f h . (4.12) 4.2 Linealización Exacta 47 Grado Relativo no definido En este caso, la salida h(x) no cumple con la condición del grado relativo, ocasionando que el sistema sea parcialmente linealizable en la región Ω, apareciendo la dinámica de los ceros o la dinámica interna, por lo cual, se estudia la estabilidad de los puntos que quedan libres dentro del sistema y que dependen de la ubicación de los ceros de la función de transferencia. Donde el número de ceros es igual al orden del sistema (n) menos el grado relativo del sistema (r). Tomando de nuevo a la Ec. (4.13): u= u − b(z) . a(z) (4.13) La forma normal de las ecuaciones se obtiene si r < n, un sistema como el de la Ec. (4.14) z˙1 = z2 , z˙2 .. . = z3 , zr−1 ˙ = zr z˙r = (4.14) v, zr+1 ˙ = qr+1 (z), .. . z˙n = qn (z), y = z1. Es descompuesto en un subsistema lineal de dimensión r y un posible subsistema no lineal de dimensión n − r, pero éste no afecta la salida. Considerando un sistema no lineal que tiene grado relativo r en un punto x0 . La realimentación de estados Ec. (4.15). u= v − Lrf h(x) Lg Lr−1 f h(x) . (4.15) Transforma al sistema en un sistema lineal, que tiene función de transferencia H(s) = 1 . sr Cuando r < n, el sistema tiene ceros en la función de transferencia. 4.2 Linealización Exacta 48 Considerando un sistema no lineal con r < n, podemos representar todo el conjunto como en la Ec. (4.16) zr+1 . . η= . , zn z1 . . ξ= . . zr (4.16) Con lo anterior, reescribimos el sistema no lineal como en la Ec. (4.17) z˙1 = z2 , z˙2 .. . = z3 , zr−1 ˙ = zr , (4.17) z˙r = b(ξ, η) + a(ξ, η)u, η̇ = q(ξ, η). Si x0 , tal que f (x0 ) = 0 y h(x0 ) = 0, entonces necesariamente la primera rcoordenada nueva zi , es 0 en x0 . Se puede asumir que η = 0 y ξ = 0 en x0 . Si x0 era un equilibrio del sistema en las coordenadas originales, el correspondiente (ξ, η) = (0, 0), es un equilibrio para el sistema en las nuevas coordenadas y se establece que b(ξ, η) = q(ξ, η) = 0, en (ξ, η) = (0, 0). Si cualquier par consiste de un estado inicial t0 y de una función de entrada u0 , definida para todo t en una vecindad de t = 0, tal que, la correspondiente salida y(t) del sistema es idénticamente a cero, para todo t en una vecindad de t = 0 (no solamente se considera al sistema en el reposo, si no todos los pares (x, u) que hacen y = 0). Por lo tanto Ec. (4.18) y(t) = z1 (t). (4.18) Esta restricción y(t) = 0 para todo t implica Ec. (4.19). z˙1 (t) = z˙2 (t) = · · · = z˙r (t) = 0. (4.19) Esto es, ξ(t) = 0 para todo t. Por lo tanto, la entrada u necesariamente debe ser la única solución de la ecuación (4.20) 4.3 Requerimientos y Condiciones de la linealización Exacta 49 0 = b(0, η(t)) + a(0, η(t))u(t). (4.20) Nótese que a(0, η(t)) 6= 0 si η → 0. Por lo tanto, ξ(t) comienza en cero, el comportamiento se rige por la ecuación diferencial (4.21) ˙ = q(0, η(t)). η(t) (4.21) Si la salida y(t) tiene que ser cero, entonces necesariamente el estado inicial del sistema debe ser ξ(0) = 0, donde η(0) = η0 pueda ser elegido arbitrariamente de acuerdo al valor de η0 , la entrada debe ser puesta como en la Ec. (4.22) −b(0, η(t)) , a(0, η(t)) donde η(t) denota la solución de la ecuación diferencial (4.23) (4.22) u(t) = η̇ = q(0, η(t)) para η(0) = η0 . (4.23) Para cada conjunto de datos inı́ciales ξ = 0 y η = η0 , la entrada es la única capaz de mantener y(t) idénticamente en cero, para todo instante de tiempo. La dinámica de (4.23), corresponde a la dinámica interna del comportamiento del sistema, cuando la entrada y las condiciones inı́ciales han sido elegidas de manera que la restricción de la salida, permanezca idénticamente a cero. Esa dinámica es la llamada dinámica cero del sistema. 4.3 Requerimientos y Condiciones de la linealización Exacta En esta sección se describen la condiciones y caracterı́sticas para realizar la linealización exacta. Caracterı́sticas • Soporta solamente sistemas no lineales que sean afines a la entrada u (lineales en la entrada) y además que tengan una sola salida, Ec. (1.2). 4.4 Ejemplo de un sistema de tanques interconectados 50 • Está basado en la geometrı́a diferencial (derivada de Lie, Corchete de Lie, gradiente, derivada direccional, Jacobiano). • El sistema admite múltiples entradas, pero solo debe haber una salida. • Se puede perder el significado de las variables de estado debido a la transformación del sistema para obtener la forma canónica controlable. • Es válida en un entorno determinado por las caracterı́sticas del sistema no lineal. Requerimientos y Condiciones • El sistema debe ser continuamente diferenciable. • El sistema se debe poder transformar a la forma canónica controlable. • Se debe poder hallar una función de salida de las variables de estado, cuyas n1 derivadas respecto del tiempo, sean funcionalmente independientes entre sı́, e independientes de la variable de control u. • El sistema linealizado en lazo cerrado, debe ser asintóticamente estable a cero. • La linealización es local. Determinada por la dirección de los campos vectoriales. • La n-ésima derivada de la función de salida respecto del tiempo, debe depender únicamente de la función del controlador. • Se debe estudiar la estabilidad de la dinámica remanente o dinámica de los ceros si el grado relativo (r) es menor al grado del sistema (n), por lo cual hay n-r ceros. 4.4 Ejemplo de un sistema de tanques interconectados Sea el sistema de tanques interconectados, que se muestra en la Figura 4.1 4.4 Ejemplo de un sistema de tanques interconectados 51 Figura 4.1: Tanques interconectados x˙1 = √ − c2 x 1 − x 2 , √ − c2 x 2 , c1 u √ x˙2 = c2 x1 − x2 y = (4.24) x2 . Reescribiendo el sistema de la forma ẋ = f (x) + g(x)u y para la salida y = h(x), se tiene (4.25) # √ −c2 x1 − x2 ; f (x) = √ √ c2 x 1 − x 2 − c2 x 2 " g(x) = " # c1 0 ; h(x) = x2 . Para verificar que el sistema cumple con las condiciones dadas, g, adf g, . . . , adn−1 g f (4.25) para tal que, el sistema sea linealmente independiente e involutivo. Utilizando el corchete de Lie para (4.26). adf g = √c2 c1 2 x1 −x2 . 1 − 2√cx21c−x 2 La matriz de Controlabilidad es la de (4.27) (4.26) 4.4 Ejemplo de un sistema de tanques interconectados 52 c c 2 1 √ c 1 2 x1 −x2 . 1 0 − 2√cx21c−x 2 (4.27) Como se observa, el determinante de la matriz es diferente de cero, por lo tanto, es linealmente independiente. Para la transformación de coordenadas Ec. (4.28) " ϕ= h # , (4.28) Lf h asignando z como la nueva variable, se tiene la Ec. (4.29). z1 = z2 x2 , √ √ = c2 x 1 − x 2 − c2 x 2 . (4.29) Como se observa al hacer la transformación de coordenadas, las variables no pierden su sentido fı́sico, El sistema en las nuevas coordenadas es el de la Ec. (4.30) √ z˙1 = c2 x1 − x2 − z˙2 = √ c2 x˙ 2 x1 −x2 1 + √ c2 x 2 − 2√xc12−x2 − c2 √ 4 x2 x˙2 (4.30) Sustituyendo y acomodando para que todo quede en función de z, el sistema en las nuevas coordenadas es el de la Ec. (4.31): z˙1 = z˙2 = z2 , c2 c1 √2 c2 z1 +z2 u + √ c2 (−3 z1 c2 z2 −c22 z1 −z22 ) √ √ . (c2 z1 +z2 ) z1 (4.31) Para calcular la ley de control, se utiliza la derivada de Lie en otro campo vectorial, de manera que se tiene la Ec. (4.32) c2 c1 Lg Lf h = √ , 2 x1 − x2 (4.32) donde la ley de control está dada por (4.8), teniendo la Ec. (4.33). L2f h √ √ c2 1 2 c2 = − c2 + − √ − √ c2 x 1 − x 2 − c2 x 2 . 2 2 x 1 − x2 2 x2 Por lo tanto, el controlador es (4.33) 4.4 Ejemplo de un sistema de tanques interconectados 53 √ √ √ c2 x1 − x2 2c2 x2 c2 x 1 2 x1 − x2 u= − + √ + v. c1 c1 c1 x 2 c1 c2 (4.34) Utilizando (4.29) obtenemos el controlador en función de z √ √ 3z2 z1 c22 + c32 z1 + z22 c2 2 z1 z2 + 2c2 z1 v+ . u= √ √ z1 c1 c22 z1 c1 c22 (4.35) Utilizando una ley de control por realimentación de estados, dada como la Ec. (4.36). v = −k1 z1 − k2 z2 . (4.36) Reemplazando el controlador en (4.31), para comprobar que el sistema queda en la forma canónica controlable, se tiene la Ec. (4.37) z˙1 = z2 , (4.37) z˙2 = −k1 z1 − k2 z2 , por lo tanto, es claro decir que; el sistema cumple con las condiciones para realizar la linealización exacta. Utilizando los valores de los parámetros c1 = 7.957, 0.6, c2 = 0.01, u = 0.0002, para un valor de referencia del estado X2 = 0.24. La respuesta del sistema no lineal se observa en la Figura 4.2. k1 = 1, k2 = 4.4 Ejemplo de un sistema de tanques interconectados 54 Sistema no lineal 0.03 altura tanque h2 0.025 altura (m) 0.02 0.015 0.01 0.005 0 0 500 1000 tiempo (s) 1500 2000 Figura 4.2: Tanques interconectados no lineal Aplicando el controlador obtenido por linealización exacta, se tiene la respuesta que se muestra en la Figura 4.3. sistema por linealizacion Exacta 0.03 altura del tanque h2 0.025 altura (m) 0.02 0.015 0.01 0.005 0 0 500 1000 tiempo (s) 1500 2000 Figura 4.3: Tanque interconectados por linealización exacta Capı́tulo 5 Linealización Basada en la Velocidad 5.1 Introducción Leith y Leithead propusieron una representación llamada linealización basada en la velocidad, la cual consiste en la extensión de la linealización por expansión de series de Taylor, donde la representación es válida alrededor de cualquier punto de operación, incluso los que no son de equilibrio Leith y Leithead (1998a); Leith (1999); Leith y Leithead (1999b), para ello, la representación se compone de una familia de sistemas lineales, una variable que contiene la variación de los parámetros del sistema (estados y entradas); por lo cual, solo con variar los estados y entradas se obtiene una representación cuasi-LPV del sistema, que permite obtener una zona de operación amplia del sistema Leith y Leithead (1998a); Leith (1999); Dı́ez Ruano (2003). La selección de una representación apropiada para el análisis y diseño de sistemas integrados, basados en la linealización, muestra que en contraste a la linealización convencional, la representación basada en la velocidad, soporta el análisis y diseño modular. Tradicionalmente, la representación por linealización es empleada para el análisis y diseño de sistemas no lineales. Por lo general, la representación basada en la linealización aproximada (series de Taylor), aproxima al sistema no lineal en la vecindad del punto de equilibrio, por lo que, el análisis es válido solo localmente Leith 5.2 Linealización Fuera del Equilibrio 56 y Leithead (1999b, 2001, 1999b). 5.2 Linealización Fuera del Equilibrio Un modelo local fuera del equilibrio tiene por definición, un punto que no es de equilibrio en su región de validez, a pesar de que tienen puntos de equilibrio, pero estos no son validos, dado que este tipo de modelos fuera del equilibrio no tiene significado fundamental para el sistema no lineal Johansen et al. (1998). En el diseño convencional de controladores, por asignación de ganancia, la linealización de un sistema LTI y el diseño del controlador local, para un conjunto resultante de sistemas LTI, es desarrollado en un conjunto de puntos de equilibrios. Hecho que es válido solo en cercanı́as del equilibrio, tal que el diseño resulta en un pobre desempeño en el transitorio. Para resolver este problema se realiza el diseño del controlador en base a una linealización dinámica, sobre alguna trayectoria nominal, sin embargo, una desventaja con esta aproximación, es que el diseño del control para sistemas LTV, es por lo general, un problema difı́cil de resolver Johansen et al. (1998). Supongamos, que la dinámica del sistema no lineal se aproxima en el entorno de un punto de operación (x0 , uo ) ∈ Rn+m , el cual no necesariamente es un punto de equilibrio, estos puntos de operación están dados por la Ec. (5.1): ψ = {(x , u) ∈ Rn+m }. (5.1) Con lo cual el sistema linealizado alrededor del punto (x0 , uo ), es Ec. (5.2) y Ec. (5.3): ẋ = ∇x f (xo , uo )xδ + ∇u f (xo , uo )uδ + df (xo , uo ), (5.2) y = ∇x g(xo , uo )xδ + ∇u g(xo , uo )uδ + dg(xo , uo ), (5.3) df (xo , uo ) = f (xo , uo ) − ∇x f (xo , uo )xo − ∇u f (xo , uo )uo , (5.4) dg(xo , uo ) = g(xo , uo ) − ∇x g(xo , uo )xo − ∇u g(xo , uo )uo . (5.5) donde 5.2 Linealización Fuera del Equilibrio 57 Como se observa en la Ec. (5.4) y Ec. (5.5),corresponde a la aproximación de la función f por el plano tangente en el punto (xo , uo ). Sin embargo, la interpretación es diferente, debido a que (xo , uo ) no es punto de equilibrio. La interpretación del sistema (5.2) y (5.3), correspondiente a (xo , uo ), solo puede ser un estado transitorio y nunca un punto de equilibrio, se puede extender a un conjunto de puntos ψ del tipo (5.1), donde estos puntos de operación se pueden parametrizar en función de una variable de planificación φ, que incluye todas las variables medibles del sistema (internas o externas estén en ψ o no), siempre que φ(t) esté disponible, obteniendo ası́, un sistema LTV que forma una familia de linealizaciones en el entorno de los puntos de operación Dı́ez Ruano (2003), como en la Ec. (5.6) y Ec. (5.7). ẋ = ∇x f (xo (φ), uo (φ)xδ + ∇u f (xo (φ), uo (φ)uδ + df (xo (φ), uo (φ), (5.6) y = ∇x g(xo (φ), uo (φ)xδ + ∇u g(xo (φ), uo (φ)uδ + dg(xo (φ), uo (φ). (5.7) La diferencia entre la linealización dinámica (sobre una trayectoria) y la linealización fuera del equilibrio (sobre un conjunto de puntos), se observa en la dependencia de la especificación del conjunto de puntos (ver Figura 5.1). La razón para esto, es que el sistema LTV resultante de la linealización dinámica, depende solo del punto de la trayectoria que pasa a través de un tiempo dado. Por lo tanto, la linealización fuera del equilibrio conduce a una aproximación arbitrariamente cerrada de un sistema LTV, en términos de un conjunto de sistemas LTI, dado que existe un sistema LTI cerrado, para cualquier punto de la trayectoria nominal del sistema LTV y el sistema LTI es interpolado utilizando un esquema de interpolación sensible. 5.3 Linealización Basada en la Velocidad (LBV) 58 Figura 5.1: Puntos de validez de la linealización aproximada y fuera del equilibrio Una posible desventaja de la linealización fuera del equilibrio es que la variable de planificación, deberı́a ser de dimensión superior respecto a la linealización aproximada, esto presenta dificultades adicionales cuando el estado completo no es medible; lo que conduce al diseño de un observador Johansen y Murray-Smith (2000). 5.3 Linealización Basada en la Velocidad (LBV) El método se basa en derivar el sistema no lineal, o derivar nuevamente el modelo de linealización fuera del equilibrio dado en (5.6) y (5.7). Entonces el modelo obtenido es cuasi-LPV, por lo tanto, la variable de programación (función), es dependiente de los estados y las entradas. Sea el sistema no lineal dado (1.1). Reformulando el sistema como ẋ = Ax + Bu + f (ρ), (5.8) y = Cx + Du + g(ρ), tal que, A, B, C y D son matrices constantes con dimensiones apropiadas, f y g son funciones no lineales y ρ una función de x y u tal que, ρ(x, u) ∈ Rq , donde q ≤ m + n. Derivando el sistema de la Ec. (5.8) se tiene ẍ = Aẋ + B u̇ + ∇f (ρ)∇x (ρ)ẋ + ∇f (ρ)∇u (ρ)u̇, ẏ = C ẋ + Du̇ + ∇g(ρ)∇x (ρ)ẋ + ∇g(ρ)∇u (ρ)u̇, (5.9) 5.4 Requerimientos y Condiciones de la LVB 59 que envuelve la dependencia no lineal de la dinámica de los estados y la entrada, con ∇x ρ, ∇u ρ constantes. Agrupando y haciendo el cambio de variable ẋ = w para la Ec. (5.9),por lo que el sistema queda como ẋ = w, ẇ = (A + ∇f (ρ)∇x (ρ))w + (B + ∇f (ρ)∇u (ρ))u̇, (5.10) ẏ = (C + ∇g(ρ)∇x (ρ))w + (D + ∇g(ρ)∇u (ρ))u̇. Por conveniencia se realizan los siguientes cambios v = u̇ z = ẏ para la Ec. (5.10). Se tiene An = A + ∇f (ρ)∇x (ρ), Bn = B + ∇f (ρ)∇u (ρ), (5.11) Cn = C + ∇g(ρ)∇x (ρ), Dn = D + ∇g(ρ)∇u (ρ). Finalmente, el sistema queda como ẇ = An (xo , uo , ρ)w + Bn (xo , uo , ρ)v, (5.12) z = Cn (xo , uo , ρ)w + Dn (xo , uo , ρ)v. Como se observa el sistema depende de xo , uo (punto de operación) y ρ. Por lo tanto, la representación obtenida es LPV. Dado que es un conjunto y no un solo valor el modelo, por la variación del parámetro ρ, el sistema queda como. ẇ = Pm Pm z = Pm Pm n=1 An (xo , uo , ρ)w + n=1 Bn (xo , uo , ρ)v, (5.13) n=1 Cn (xo , uo , ρ)w + n=1 Dn (xo , uo , ρ)v. Donde m corresponde a la cantidad de combinaciones del parámetro variante. 5.4 Requerimientos y Condiciones de la LVB En esta sección se describen las condiciones, caracterı́sticas y requerimientos 5.5 Ejemplo de un manipulador robótico 60 Caracterı́sticas • El sistema no lineal es general Ec. (1.1) y debe tener primera derivada continua. • La linealización es válida en cualquier punto de operación (incluyendo los que no son de equilibrio). • Adopta la forma de los sistemas LPV o cuasi LPV (los parámetros variantes son función de los estados y las entradas). • El sistema puede tener múltiples entradas y múltiples salidas. Requerimientos y Condiciones la linealización • El sistema no lineal debe ser diferenciable con primera derivada continua de Lipschitz. • La linealización basada en la velocidad aproxima localmente al sistema no lineal en un punto de operación genérico (cualquier punto, incluso los que no son equilibrios). • La no linealidad del sistema es absorbida por el parámetro variante del sistema, por lo que, su rango dependerá de la estabilidad del sistema para el nuevo sistema resultante. 5.5 Ejemplo de un manipulador robótico En esta sección se desarrolla un ejemplo donde se utilice la linealización basada en la velocidad. Sea el sistema de un manipulador robótico dado como se muestra en la Figura 5.2: 5.5 Ejemplo de un manipulador robótico 61 Figura 5.2: Manipulador Robótico Las ecuaciones dinámicas del sistema están dadas como en la Ec. (5.14): x˙1 = x2 , x˙2 = − BJ x2 − y = M gl sin J x1 N + 1 u, J (5.14) x1 . donde x1 y x2 corresponden a los estados, u a la entrada, B coeficiente de fricción viscosa, J momento de inercia, M masa del brazo, g la gravedad, l distancia del eje del centro de masa del manipulador y N es el factor de reducción del juego de engranajes. Los valores de los parámetros para efectos de simulación son M = 0.24, N = 1, J = 4e − 2, B = 0.01, l = 0.25, g = 9.8, con condiciones inı́cialesx10 = 0.01, x20 = 0.01, para una entrada de u = 0.42, en el punto de operación x1eq = 0.7956. Los puntos de equilibrio del sistema están dados por x2 = 0, −1 x1 = X1 = N sin U M gl , u = U. (5.15) En la Figura 5.3 se muestra la respuesta del sistema no lineal del brazo robótico. 5.5 Ejemplo de un manipulador robótico 62 Sistema no lineal de un brazo robotico 0.9 sistema no lineal brazo robotico Angulo de giro del brazo (rad) 0.8 0.7 0.6 X: 236.1 Y: 0.4391 0.5 0.4 0.3 0.2 0.1 0 0 50 100 150 tiempo (s) 200 250 300 Figura 5.3: Sistema no lineal del brazo robótico Reescribiendo el sistema, de manera que se encuentra la dependencia no lineal, para establecer el parámetro variante del sistema, se tiene " # x˙1 x˙2 " = #" # 1 x1 0 0 − BJ x2 0 + M gl sin( x1 ) + N − J " # 0 1 J u. (5.16) Como se observa la dependencia no lineal, es debida a x1 de forma que el parámetro variante es ρ = sin XN1 . Correspondiente a una familia de puntos de equilibrio. Ahora linealizando el sistema basado en la velocidad se tiene " # x¨1 x¨2 " = 0 #" # x˙1 1 − MJglρ̇ − BJ x˙2 + " # 0 1 J u̇, ẏ = x˙1 . ρ̇ = 1 cos N X1 N (5.17) (5.18) . Reescribiendo el sistema, tal que, todo quede en función de las derivadas de primer orden, por lo cual, se hacen los cambios de variable v = u̇, " # x˙1 x˙2 " = w1 w2 z = ẏ. # , (5.19) 5.5 Ejemplo de un manipulador robótico " ẇ1 # " = 63 0 #" # w1 1 − MJglρ̇ − BJ ẇ2 + w2 " # 0 1 J v, (5.20) z = w1 . (5.21) Como la representación que se obtiene es cuasi-LPV, que es dependiente del parámetro ρ, que es función de los estados del sistema. Se debe determinar el rango de variación del parámetro; para este caso, es de − N1 < ρ̇ < 1 . N El sistema se evalúa en los extremos del rango de variación. Finalmente, se realiza la representación politópica del sistema, dado que solo hay un parámetro dependiente, el número de combinaciones es 2 y corresponden a " A1 = 0 # ; 14.7 −0.25 " A2 = 1 0 1 B1 = " # 0 # −14.7 −0.25 ; B2 = h i C1 = 1 0 ; ; 25 " # 0 25 ; h i C2 = 1 0 , (5.22) (5.23) donde las funciones de ponderación son ε1 (ρ) = ρ + 0.5, π ε2 (ρ) = 0.5 − ρ . π (5.24) Realizando la formulación politópica dada en (1.36), las nuevas matrices A, B, C quedan intactas debido a que la evaluación en los extremos del rango del parámetro variante, es igual (solo para este caso), por lo cual, se continua en el diseño del controlador del sistema. Dado que aparece la derivada de la salida realizamos una extensión del sistema, ampliándolo un grado más y obteniendo un sistema de orden 3 : ẇ1 0 1 0 0 w1 M glρ̇ ẇ2 = − 1 − BJ 0 w2 + J v, J ẏ 1 0 0 y 0 (5.25) donde la nueva salida del sistema extendido es: z = y. (5.26) 5.5 Ejemplo de un manipulador robótico 64 Hasta aquı́ se cumple con las condiciones de la linealización basada en la velocidad, para el diseño del controlador depende de la estrategia de control a utilizar, donde el diseño se basa en los sistemas LPV. Se diseña un controlador por realimentación de estados, para ello, se resuelve la LMI (desigualdades matriciales lineales),que se encargue de estabilizar el sistema en todo el rango de variación para métrica, consultar Anexo B.2 para más información. Tomando el criterio de estabilidad de Lyapunov para el sistema (1.25) dado como ATi P + P Ai < 0 P = P T > 0, (5.27) donde P es una matriz simétrica definida positiva y Ai es la matriz de transición de estados del sistema para cada modelo i, entonces se cierra el lazo del sistema, utilizando un control por realimentación de estados, obteniendo (Ai − Bj K)T P + P (Ai − Bj K) < 0. (5.28) Para que sea una LMI cada uno de los términos debe tener solo una incógnita, por lo tanto, reescribiendo y haciendo el cambio Q = P −1 , G = KP −1 = KQ, se obtiene la LMI siguiente. QATi + Ai Q − GT BjT − GBj < 0, (5.29) La ganancia K del sistema está dada como K = GQ−1 . Para sistemas LPV la LMI se resuelve para cada modelo generado por la variación de los parámetros. Finalmente, resolviendo la LMI se encuentran los valores de G y Q, que permiten obtener la ganancia del sistema. −0.0285 −0.0053 ; Q= −0.0285 0.5873 −0.0002 −0.0053 −0.0002 0.5865 0.0026 h i G = 0.0228 0.0186 0.0009 . (5.30) El vector de ganancias K, esta dado como h i K = 21.2563 1.0648 0.1952 . (5.31) 5.5 Ejemplo de un manipulador robótico 65 En la Figura (5.4) se muestra la respuesta del sistema en lazo cerrado. linealizacion basada en la velocidad de un brazo robotico 0.8 X: 929.6 Y: 0.7954 Angulo de giro del brazo (rad) 0.7 0.6 0.5 0.4 lin. basada en la velocidad del brazo robotico 0.3 0.2 0.1 0 0 200 400 600 800 tiempo (s) Figura 5.4: Manipulador Robótico 1000 Capı́tulo 6 Análisis Comparativo 6.1 Introducción Para comenzar, hasta este punto ya se han dados todas las bases teóricas de cada uno de los métodos de linealización que se expusieron en los capı́tulos anteriores, ası́ como, se han dado los requerimientos y condiciones de cada linealización. Empezaremos el análisis comparativo, señalando los tipos de sistemas no lineales que se aplican para cada método, luego seguiremos con las condiciones y requerimientos. Y por último, se realizara el análisis del desempeño de cada linealización, se toma como base un sistema no lineal, al cual, se le aplicara cada uno de los métodos presentados a lo largo del documento. Las diferentes caracterı́sticas se analizan asumiendo que las condiciones para cada método son cumplidas. 6.2 Requerimientos y Condiciones de las linealizaciones Tomando como referencia todos lo expuesto en los capı́tulos anteriores y las condiciones de cada linealización, se tiene en la Tabla 6.1, los tipos de sistemas no lineales, para los cuales se aplica cada técnica : 6.2 Requerimientos y Condiciones de las linealizaciones Tipo de Tipo de Sistema Linealización No lineal Linealización ẋ = f (x, u) . y = h(x, u) Aproximada Caracterı́sticas El sistema debe ser continuamente diferenciable, por lo menos con primera derivada continua de Lipschtiz,f, h son funciones suaves. ẋ = f (x, u) . y = h(x, u) Linealización Extendida El sistema debe ser continuamente diferenciable, por lo menos con primera derivada continua de Lipschitz, f, h son funciones suaves, pero adicionalmente f determina la complejidad a la hora de obtener el controlador, dado que se debe resolver la ecuación diferencial en derivadas parciales. ẋ = f (x) + g(x)u . Se debe cumplir con que cada una de las y = h(x) funciones f, g y h sean continuamente Linealización Exacta diferenciables y la entrada u es una función lineal. De acuerdo a la función que se encuentre en h, puede aparecer la dinámica de los ceros y la función g, puede ocasionar que el sistema en lazo cerrado, no este definido para algunos valores de estados. Linealización Basada Velocidad en la ẋ = f (x, u) . y = h(x, u) El sistema debe ser continuamente diferenciable, por lo menos con primera derivada continua de Lipschitz, f, h son funciones suaves. No tiene restricciones con el punto de operación, ya que puede tomar puntos que no sean de equilibrio. Tabla 6.1: Tipos de sistemas no lineales 67 6.2 Requerimientos y Condiciones de las linealizaciones 68 Hasta este punto se puede decir que, para la linealización aproximada, extendida y basada en la velocidad, el tipo de sistema no lineal es general, caso contrario para la exacta donde el sistema no lineal es afines a la entrada. En la Tabla 6.2 se muestran las condiciones y requerimientos de cada tipo de linealización. Tipo de Requerimientos y Condiciones linealización Linealización Aproximada • El sistema no lineal debe ser diferenciable con primera derivada continua. • La aproximación solo es válida en cercanı́as del punto de equilibrio. • Si el punto de equilibrio es diferente de cero el sistema linealizado debe ser trasladado al origen. 6.2 Requerimientos y Condiciones de las linealizaciones Tipo de 69 Requerimientos y Condiciones linealización Linealización Extendida • El sistema no lineal debe ser diferenciable con primera derivada continua. • El controlador no lineal, debe coincidir con el controlador lineal obtenido mediante la linealización del sistema en el punto de equilibrio. • El sistema no lineal en lazo cerrado debe tener el mismo punto de equilibrio del sistema no lineal. • Los autovalores del sistema linealizado se ubican en el semiplano izquierdo complejo y deben ser diferentes a cero. • La linealización se realiza sobre el punto de equilibrio parametrizado en función de la entrada. • Las ganancias de realimentación de estados no lineales, están calculadas para que el sistema linealizado en lazo cerrado se localicen en valores especı́ficos, los cuales son invariantes para todos los puntos de operación constantes. 6.2 Requerimientos y Condiciones de las linealizaciones Tipo de Requerimientos y Condiciones linealización Linealización Exacta • El sistema no lineal debe ser continuamente diferenciable. • El sistema debe poderse transformar a la forma canónica controlable. • El grado relativo del sistema debe ser igual al grado del sistema para que sea completamente linealizable de forma exacta. • Se debe hallar una función de salida y, de las variables de estado cuyas n − 1 derivadas, sean funcionalmente independientes entre sı́, e independientes de la variable de control u. • La n-ésima derivada de la función de salida y debe depender únicamente de la función del controlador. • El sistema linealizado en lazo cerrado debe tener los autovalores ubicados en el semiplano izquierdo complejo, diferentes de cero. • Pueden aparecer valores para los que no está definido el controlador, reduciendo la zona de operación del sistema linealizado. • El sistema únicamente debe poseer una salida. Aunque puede tener múltiples entradas. • El sistema linealizado debe ser asintóticamente estable en cero. 70 6.2 Requerimientos y Condiciones de las linealizaciones Tipo de 71 Requerimientos y Condiciones linealización Linealización Basada en la Velocidad • El sistema debe tener primera derivada continua. • La variación de los parámetros del sistema son funciones acotadas en un rango, que pueden depender de los estados, las entradas o el tiempo. • La linealización puede tomar cualquier punto de operación, incluyendo los que no son de equilibrio. • El sistema linealizado está compuesto de una familia de sistemas LTI, formada por cada uno de los modelos obtenidos debido a la variación de los parámetros. Tabla 6.2: Condiciones y requerimientos para la linealización Con esta comparación, es evidente que la aproximada tiene menos restricciones, pero su mayor limitación, es que solo es válida alrededor del punto de equilibrio. Para la extendida la región es ampliada gracias al controlador y que el sistema esta parametrizado para el punto de equilibrio (continuos puntos de equilibrio). En la exacta, la limitación es impuesta por el tipo de sistema no lineal y adicionalmente a la estructura del controlador, que puede no estar definido para algunos valores de operación de los estados, también se debe tener cuidado con la selección de la salida y, ya que esta, también limita la región de validez de la linealización. Sin dejar de lado, el sistema debe transformarse a la forma canónica controlable y su transformación inversa debe existir. Finalmente, la basada en la velocidad, es una alternativa que ofrece una mayor región de validez, al no estar limitada por los puntos de equilibrio (puede tomar 6.2 Requerimientos y Condiciones de las linealizaciones 72 cualquier punto que no sea de equilibrio), la región es ampliada debido a que está conformada por una familia de modelos LTI, para cada valor de los parámetros variantes, además las no linealidades del sistema se trasladan a los parámetros variantes. Se resaltan las caracterı́sticas de cada uno de los métodos en la Tabla 6.3). Tipo de Caracterı́sticas para la linealización linealización Linealización Aproximada • Se aproxima al sistema no lineal alrededor del punto de equilibrio. • La linealización se puede utilizar para sistemas de múltiples entradas y múltiples salidas. • Ayuda al análisis del comportamiento y diseño de controladores para el sistema no lineal alrededor de un punto de equilibrio. 6.2 Requerimientos y Condiciones de las linealizaciones Tipo de Caracterı́sticas para la linealización linealización Linealización Extendida • Tiene múltiples soluciones para el controlador. • El punto de equilibrio esta parametrizado en función de la señal de entrada (es genérico). • Soporta sistemas de múltiples entradas y múltiples salidas, añadiendo complejidad al método. • Está basado en la linealización aproximada, con la diferencia de que es para continuos puntos de equilibrio y no para un solo punto de equilibrio como en la aproximada. • Permite que el sistema en lazo cerrado pueda seguir la referencia del sistema. 73 6.2 Requerimientos y Condiciones de las linealizaciones Tipo de Caracterı́sticas para la linealización linealización Linealización Exacta • Está basado en la geometrı́a diferencial (derivada de Lie, corchete de Lie, gradiente, Jacobiano, campos vectoriales, etc.. . ). • Cuando el grado relativo del sistema no está definido, aparece la dinámica de los ceros, por lo cual, se debe estudiar la estabilidad de esta dinámica. • El significado fisico de las variables de estados se pueden perder, debido a la transformación del sistema. • Permite que el sistema en lazo cerrado pueda seguir la referencia del sistema. 74 6.3 Linealización de un Sistema no lineal Tipo de 75 Caracterı́sticas para la linealización linealización Linealización Basada en la Velocidad • La linealización es válida en cualquier punto de operación (incluyendo los que no son de equilibrio). • Adopta la forma de los sistemas LPV o cuasi LPV. • El sistema puede tener múltiples entradas y múltiples salidas. • Le añade robustez al sistema en lazo cerrado. • La región de operación es ampliada debido a la variación de los parámetros • Permite que el sistema en lazo cerrado pueda seguir la referencia del sistema. • Único control para una familia de puntos de operación. Tabla 6.3: Caracterı́sticas para la linealización 6.3 Linealización de un Sistema no lineal Sea el sistema no lineal de la Ec. (6.1), descrito como x˙1 = x2 , x˙2 = − `g2 sin(x1 ) − y donde = x1 , V (t) cos(x1 ) ` + u (6.1) 6.3 Linealización de un Sistema no lineal x1 : ángulo alcanzado. x2 : Velocidad angular. g : Fuerza de gravedad. ` : Longitud de la barra. 76 V (t) : Función variante con respecto al tiempo. Los valores de los parámetros para efectos de simulación, están dados como: g = 9.8 sm2 , ` = 0.5m, el parámetro variante esta acotado en V (t) = [−5, 15]. Por conveniencia se asume que todos los estados son medibles. En la Figura 6.1 se muestra la respuesta del sistema no lineal con condiciones inı́ciales nulas. sistema 1 1.5 sistema no lineal Angulo alcanzado (rad) 1 0.5 0 −0.5 −1 −1.5 0 1000 2000 3000 4000 5000 Tiempo (s) 6000 7000 8000 9000 Figura 6.1: Respuesta del sistema no lineal Controlabilidad y Observabilidad Basándonos en el Algebra de Lie, se tiene que el sistema escrito como un sistema no lineal afines al control, en la Ec. (6.2). " f (x) = # x2 − `g2 sin(x1 ) − V (t) cos(x1 ) ` ; g(x) = " # 0 1 ; h(x) = x1 . (6.2) 6.3 Linealización de un Sistema no lineal 77 La controlabilidad (accesibilidad) del sistema, está dada usando los corchetes de ∂g Lie, como g, ad1f g ,donde ad1f g = ∂f g − ∂x f , por lo cual, la matriz de controlabilidad ∂x del sistema es la de (6.3). " 0 1 # . (6.3) 1 0 Como se observa el rango de la matriz es 2, que es el mismo grado del sistema por lo tanto el sistema es accesible. Y para lo observabilidad utilizando la derivada de Lie se obtiene (6.4). " x1 0 0 x2 # . (6.4) Lo cual indica que el sistema también es observable, pero solo está definido para valores de x1 y x2 diferentes de cero. Linealización Aproximada de un sistema no lineal Primero se debe aclarar que en este caso el parámetro variante V (t) es constante, con valor nominal Vn = 0.5. Sea el punto de equilibrio del sistema (6.1) dado como: x1 = X1, x2 = 0, u= Vn g sin X1 + cos X1. 2 ` ` (6.5) Linealizando el sistema de manera aproximada se tiene " # " x˙1 0 = −g x˙2 2 cos(X1) + ` #" # 1 x1 Vn sin(X1) ` 0 x2 + " # 0 u. (6.6) 1 Se elije un controlador por realimentación de estados, dado por u = k1 x1 − k2 x2 , (6.7) donde el polinomio deseado es: s2 + 2ωn ζs + ωn2 , para wn = 5.5 ζ = 0.3. Las ganancias del sistema en lazo cerrado están dadas como 6.3 Linealización de un Sistema no lineal k1 = ωn2 78 −g V (t) sin(X1 ), cos(X1 ) + 2 ` ` k2 = 2ωn ζ. (6.8) Tomando en cuenta que el valor de Vn = 0.5, correspondiente al sistema nominal, se escoge como punto de equilibrio Pe (X1 , X2 , U ) = ( π4 , 0, 9). La respuesta del sistema se muestra en la Figura 6.2. sistema por lin. Aproximada sistema por lin. Aprox velocidad Angular (rad/s) 1 0.9 Angulo alcanzado (rad) 0.8 X: 7.139 Y: 0.7044 0.7 0.6 3 2 1 X: 7.58 Y: −7.577e−06 0 −1 5 10 Tiempo (s) controlador por linealizacion aprox 40 0.5 0 0.4 error 30 0.3 0.1 X: 7.473 Y: 26.17 20 0.2 0 5 Tiempo (s) 10 10 0 5 Tiempo (s) 10 Figura 6.2: Respuesta del sistema linealizado de manera aproximada Linealización Extendida de un sistema no lineal Para este caso nuevamente el valor del parámetro V (t) es un valor nominal constante (Vn = 0.5). Aplicando una ley de control por realimentación de estados, dada como u = −K1 x1 − K2 x2 . (6.9) Donde las constantes K1 y K2 , son funciones que permiten obtener el controlador no lineal. Aplicando la ley de control (6.9) al sistema (6.6), obteniendo 6.3 Linealización de un Sistema no lineal " # x˙1 x˙2 " = 79 0 −g cos(X1) `2 + Vn sin(X1) ` 1 − K1 −K2 #" # x1 . (6.10) x2 Su polinomio caracterı́stico está dado como P c = s2 + K2 s + g Vn cos(X1) − sin(X1) + K1 . 2 ` ` (6.11) El polinomio deseado para el sistema, se escoge como P d = s2 + 2ωn ζs + ωn2 . (6.12) Igualando (6.11) y (6.12), se tiene que las ganancias K1 y K2 , son K1 = −ωn2 Vn g cos(x1 ) + sin(x1 ), 2 ` ` K2 = 2ωn ζ. (6.13) Integrando, para obtener el controlador no lineal, para K2 Z x2 K2 = 2ωn ζdx2 = 2ωn ζx2 + φ(x1 ). (6.14) 0 Se integra para K1 , y obtenemos Z x1 V (t) g cos(x1 ) + sin(x1 ))dx1 , 2 ` ` X1 g Vn = ωn2 (x1 − X1 ) − 2 (sin(x1 ) − sin(X1 )) − (cos(x1 ) − cos(X1 )). ` ` φ(x1 ) = K1 = (ωn2 − (6.15) (6.16) Evaluando en la condición de contorno U = −K(X), se tiene que el controlador del sistema es u = −ωn2 (x1 − X1 ) + g Vn sin(x1 ) + cos(x1 ) − 2ωn ζx2 . 2 ` ` (6.17) Aplicando la ley de control no lineal, obtenido en (6.17), al sistema (6.1), el nuevo sistema queda como x˙1 = x2 , x˙2 = −ωn2 (x1 − X1 ) − 2ωn ζx2 . (6.18) 6.3 Linealización de un Sistema no lineal 80 Como se puede observar el controlador produce un efecto linealizante sobre el sistema. Ahora, para observar la respuesta del sistema se toman los siguientes valores de ζ = 0.3, para una referencia X1 = π4 , con condiciones inı́ciales parámetros ωn = 5.5, x10 = 0.001, x20 = 0.001, en la Figura 6.3 se muestra la respuesta obtenida por linealización extendida. sistema por lin. Extendida sistema por lin. Extendida velocidad Angular (rad/s) 1.1 1 X: 7.245 Y: 0.7854 0.8 0.7 2 1 X: 7.101 Y: −1.252e−05 0 −1 5 10 Tiempo (s) controlador por linealizacion extendida 40 0.6 0.5 0.4 0 30 error Angulo alcanzado (rad) 0.9 3 0.3 X: 7.367 Y: 28.45 20 0.2 0.1 0 5 Tiempo (s) 10 10 0 5 Tiempo (s) 10 Figura 6.3: Respuesta del sistema por linealización extendida Linealización Exacta de un sistema no lineal Se toma el valor V (t) como constante, con valor nominal de Vn = 0.5 Reescribiendo el sistema de la forma dada en (1.2), por lo tanto, cada función está dada como en la Ec. (6.19) " f (x) = x2 − `g2 sin(x1 ) − # Vn cos(x1 ) ` ; g(x) = " # 0 1 ; h(x) = x1 . (6.19) Aplicando la transformación del sistema por medio del Difeomorfismo, se obtiene que las derivadas de Lie hasta el orden n del sistema, son (Ec. (6.20)) 6.3 Linealización de un Sistema no lineal 81 L1f h = x2 , L2f h = − `g2 sin(x1 ) − V (t) cos(x1 ). ` (6.20) Para verificar que el sistema cumple con las condiciones dadas para g, adf g, . . . , adn−1 g f tal que el sistema sea linealmente independiente e involutivo. Condición que se estableció en (6.3), donde el sistema es controlable, por lo tanto, es linealmente independiente. " Det # 0 −1 1 = 1. (6.21) 0 El controlador del sistema, está dado como (Ec. (6.22)) u= 1 (v Lg Lfn−1 h(x) − Lnf h(x)), (6.22) por lo cual, se calcula la derivada de Lie en otro campo adicional, obteniendo (Ec. (6.23)) Lg Lf h = 1, (6.23) de manera que el controlador del sistema por linealización exacta, es (Ec. (6.24)) Vn g sin(x1 ) + cos(x1 ). (6.24) 2 ` ` Tomando la misma ley de control por realimentación de estados de (6.9), pero, en u=v+ este caso para v, se tiene que el controlador por linealización exacta es (Ec. (6.25)) Vn g sin(x1 ) + cos(x1 ). (6.25) 2 ` ` Finalmente, el sistema con el controlador por linealización exacta, queda como u = −K1 (x1 − X1) − K2 x2 + x˙1 = x2 , x˙2 = −K1 (x1 − X1) − K2 x2 . (6.26) La respuesta del sistema por linealización exacta, se muestra en la Figura 6.4, donde el valor de las ganancias K1 = 3.2385, K2 = 3.3, para una referencia de X1 = π4 , con las condiciones inı́ciales dadas en la linealización extendida. 6.3 Linealización de un Sistema no lineal 82 sistema por lin. Exacta velocidad Angular (rad/s) 0.8 X: 8.208 Y: 0.7854 0.6 0.5 0.4 0.2 X: 8.082 Y: −1.951e−06 0 −0.2 5 10 Tiempo (s) controlador por linealizacion exacta 30 0.4 0 X: 7.974 Y: 28.45 0.3 20 error Angulo alcanzado (rad) 0.7 Velocidad Angular alcanzado del sistema 0.6 0.2 0.1 10 0 5 Tiempo (s) 0 10 0 5 Tiempo (s) 10 Figura 6.4: Respuesta del sistema por linealización exacta Linealización Basada en la Velocidad de un sistema no lineal Uno de los primeros pasos es reescribir el sistema no lineal (6.1), de manera que se obtengan los parámetros variantes, dado que están relacionados con la parte no lineal del sistema (esto debido a que la representación es cuasi-LPV). El sistema se reescribe como se dio en (5.8). También, se aclara que para este caso el parámetro V (t) es variante. Reescribiendo el sistema se tiene " # x˙1 = " #" # 0 0 x1 x˙2 0 0 + x2 " # 0 " u+ − `g2 sin(x1 ) − 1 # 0 V (t) cos(x1 ) ` . (6.27) Diferenciando el sistema a ambos lados x¨1 = x¨2 = ẏ = x˙2 , − `g2 cos(x1 ) + V (t) sin(x1 ) ` x˙1 − V̇ (t) cos(x1 ) ` + u̇, (6.28) x˙1 . Haciendo el cambio de variable ẋ = w y v = u̇, donde el parámetro ρ = sin(x1 ) y ρ̇ = cos(x1 ),antes de continuar por conveniencia, los parámetros variantes se asignan de 6.3 Linealización de un Sistema no lineal 83 ˙ se asume como una perturbación la siguiente manera, ρ1 = ρ, ρ2 = ρ̇, ρ3 = V (t), V (t) acotada del sistema dado como d = − V̇ `(t) cos(x1 ), el sistema queda como ẇ1 = ẇ2 = ẏ w2 , 2 ( gρ `2 ρ1 ρ3 )w1 ` + = (6.29) + v + d, w1 . Claramente se observa que el sistema resultante es un sistema LPV, de manera que el rango de variación de los parámetros es −1 < ρ1 < 1, para ρ2 = [−1; 1] y para ρ3 = [−5; 15]. Para evaluar el sistema en el rango deseado del parámetro, se utiliza la representación politópica, para sistemas LPV, por lo cual, se evalúa el sistema en los extremos del rango. Dado que aparece ρ1 , ρ2 y ρ3 , el numero de combinaciones para el politopo es de 8, dadas como (ρ1 , ρ2 , ρ3 ) en la Tabla 6.4 se muestra las combinaciones. ρ1 ρ2 ρ3 -1 -1 -5 -1 -1 15 -1 1 -5 -1 1 15 1 -1 -5 1 -1 15 1 1 -5 1 1 15 Tabla 6.4: Combinación de los parámetros Por lo tanto, los 8 sistemas están dados como " A1 = # 1 49.2 0 " A5 = 0 0 # 1 29.2 0 " ; A2 = # 1 " ; 9.2 0 " ; A6 = 0 0 # 1 69.2 0 A3 = # 1 −29.2 0 " ; A7 = 0 0 # 1 −49.2 0 " ; A4 = ; A8 = 0 # 1 −69.2 0 " # 0 1 −9.2 0 ; (6.30) . 6.3 Linealización de un Sistema no lineal 84 Diseño del controlador Robusto por H2 Para mayor información acerca de la metodologı́a, para el diseño del controlador robusto, consultar el Anexo B.3. Esta estrategia de control, nos permite, que el sistema sea capaz de rechazar perturbaciones. El sistema se modifica de tal manera que se agrega unas entradas y salidas exógenas, donde se pueda medir las variables que afecta la perturbación, el diseño del controlador se basa en minimizar justamente ese valor de perturbación en el sistema, se considera la LMI que se observa en el anexo B.2,para el diseño del controlador. La estructura del sistema es modificada para ver el efecto de la perturbación. " A B # A B1 B2 ⇒ C D D 11 12 . 1 C D C2 D21 D22 (6.31) Como la matriz D = 0, no se incluye. El sistema está descrito por (1.30), donde se acomoda para ver el efecto de la perturbación sobre la salida del sistema. La ley de control, está dada como u = Kw. Por lo tanto, las ecuaciones del sistema son " A= 0 # 1 −39.2ρ2 + 2ρ1 ρ3 0 " # 1 0 C1 = ; 0 0 ; B1 = " # 0 ; 1 B2 = " # 0 ; 1 (6.32) h i C2 = 1 0 . Para evaluar la LMI, se deben utilizar todos las 8 combinaciones. Para hallar la ganancia del controlador K = Y Q−1 , utilizamos la LMI definida en (B.9) del Anexo B,se tiene que Y y Q, son " Y = 0.0936 # −0.8546 −0.8546 72.0587 , h i Q = −34.2049 −34.8204 . (6.33) Finalmente, la ganancia del controlador es h i K = −414.8191 −5.4027 . (6.34) 6.4 Desempeño del sistema controlado 85 Para implementar el controlador en el sistema no lineal, se integra el controlador a ambos lados, obteniendo u = k1 (x1 − yref ) + k2 x2 + ueq . (6.35) La respuesta del sistema se muestra en la Figura 6.5. sistema por lin. b. velocidad sistema por lin. b. velocidad velocidad Angular (rad/s) 1.4 1.2 X: 6.657 Y: 0.7854 0.8 10 X: 7.994 Y: −3.033e−06 0 −10 0.6 400 0.4 200 0 5 10 Tiempo (s) controlador por lin. b. velocidad error angulo (rad) 1 20 0.2 0 0 0 5 tiempo (s) 10 −200 X: 7.994 Y: 28.45 0 5 Tiempo (s) 10 Figura 6.5: Controlador robusto mediante H2 para el sistema en estudio 6.4 Desempeño del sistema controlado En esta sección, se trabajaran distintas comparaciones que se le realizan a cada una de las linealizaciones, de manera que se puedan ver ventajas, desventajas o caracterı́sticas de cada una de ellas. Se debe aclarar que las linealizaciones se utilizan para el diseño de controladores, donde se evalúa el desempeño del sistema en lazo cerrado para cada uno de los controladores obtenidos por cada método de linealización, debido a la variaci?n del parámetro V (t). La simulación se lleva cabo utilizando MATLAB, utilizando la función ode para realizar la formulación de cada uno de los métodos de linealización. 6.4 Desempeño del sistema controlado 6.4.1 86 Respuesta del sistema ante variación del parámetro V (t) Para empezar se toma como valor de referencia del sistema en π4 . Donde la respuesta que se obtiene para las linealizaciones es como se muestra en la Figura 6.6. Respuesta del sistema 1.4 Lin. Aproximada Lin Extendida Lin Exacta Lin. B. Velocidad 1.2 X: 23.65 Y: 0.937 1 X: 23.56 Y: 0.8028 X: 26.57 Y: 0.7854 Angulo (rad) 0.8 0.6 0.4 0.2 0 −0.2 0 5 10 15 20 tiempo(s) 25 30 35 Figura 6.6: Respuesta del sistema con V (t) variante, para una referencia de 40 π 4 Se observa que la linealización aproximada se ve fuertemente afectada por la variación del parámetro, oscilando en una banda entre [−0.05, 0.937], por lo cual, no es capaz de seguir a la referencia, mientras que para la LBV esta banda es peque?a alrededor de la referencia [0.768, 0.8028], donde los mejores resultados los presenta la linelización exacta y la extendida. 6.4.2 Respuesta del sistema para V(t) constante con valor nominal cuando la referencia cambia Para ver la respuesta ideal, se mantendrá V (t) en su valor nominal V (to ) = 0.5, de forma que se pueda ver si llega a la referencia cuando esta se cambia, la respuesta se 6.4 Desempeño del sistema controlado 87 muestra en la Figura 6.7. Respuesta del sistema 10 lin.aprox lin. exacta lin. extendida lin. b. vel. 8 X: 30.2 Y: 6.72 X: 38.68 Y: 5.736 6 X: 39.04 Y: 3.142 4 Angulo (rad) 2 X: 8.01 Y: 0.7325 X: 31.54 Y: 1.571 0 X: 23.41 Y: −1.088e−07 −2 X: 15.56 Y: −1.571 −4 −6 X: 21.72 Y: −5.782 X: 14.35 Y: −6.766 −8 −10 0 5 10 15 20 Tiempo (s) 25 30 35 40 Figura 6.7: Respuesta del sistema con V (to ) nominal ante cambios en la referencia del sistema Claramente se observa en la Figura 6.7 como la aproximada no es capaz de alcanzar los demás valores de referencia, esto debido en gran parte a que el controlador se diseño alrededor un punto de operación, por lo cual, al salirse de esa vecindad el sistema no es capaz de llegar al valor deseado de la referencia. Para las demás linealizaciones el cambio de referencia no influye en el sistema ya que sigue a la referencia, por lo cual sus regiones de operación, es más amplia que la de la linealización aproximada. 6.4 Desempeño del sistema controlado 6.4.3 88 Respuesta del sistema ante variación del parámetro V (t) cuando la referencia cambia Este análisis tiene como caracterı́stica ver como actúa el sistema cuando el parámetro variante V (t) cambia con el tiempo y cómo influye este parámetro en el cambio de la referencia del sistema. La respuesta se muestra en la Figura 6.8. Respuesta del sistema 5 lin.aprox lin. exacta lin. extendida lin. b. vel. 4 X: 39.66 Y: 3.215 3 Angulo (rad) 2 X: 31.85 Y: 1.571 X: 7.818 Y: 0.7368 1 0 X: 23.77 Y: 0.02344 −1 X: 15.9 Y: −1.571 −2 −3 −4 0 5 10 15 20 Tiempo (s) 25 30 35 40 Figura 6.8: Respuesta del sistema con V (t) variante ante cambios en la referencia del sistema Como se observa en la Figura 6.8, la linealización aproximada, se ve afectada por la variación de V (t), por lo cual, no es capaz de seguir la referencia del sistema, para las demás linealizaciones, la variación de V (t), no desvı́a tanto al sistema del valor de referencia deseado, en la LBV hay ligeras desviaciones, pero esta es capaz de seguir la referencia. 6.4 Desempeño del sistema controlado 6.4.4 89 Desempeño del sistema ante criterios de error Finalmente, se aplican los criterios ISE y IAE (ver Anexo C), para ver el desempeño del sistema, para cada uno de los controladores obtenidos por los métodos de linealización. Para empezar en la Figura 6.9 se muestra el error del sistema. eror del sistema 4 lin.aprox lin. exacta lin. extendida lin. b. vel. 3 X: 15.91 Y: 2.356 2 X: 23.85 Y: 0.7628 error 1 0 X: 7.682 Y: 0.04801 X: 31.84 Y: −0.7854 −1 X: 39.78 Y: −2.356 −2 −3 −4 0 5 10 15 20 tiempo (s) 25 30 35 40 Figura 6.9: Error del sistema ante cambios en la referencia cuando V (t) es variante Como se observa en la Figura 6.9, el error producido por la aproximada varı́a mucho, inclusive se va incrementando para aquellos valores de referencia que no es capaz de alcanzar tales como π , − π2 , π 2 y 0, que son justamente los valores que están fuera de la región de equilibrio del sistema aproximado, ya que su región de equilibrio es alrededor de π4 . Esta oscilación en el comportamiento de la aproximada es causada por la variación del parámetro variante, que la afecta en gran medida, para las otras linealizaciones el error que se tiene no es producido en gran proporción por el parámetro variante, sino por la respuesta que se necesita para alcanzar la referencia del sistema. En la Figura 6.10 se muestra la respuesta para ISE. 6.4 Desempeño del sistema controlado 90 Desempeño para criterio ISE 120 lin.aprox lin. exacta lin. extendida lin. b. vel. 100 error 80 60 40 20 0 0 5 10 15 20 tiempo (s) 25 30 35 40 Figura 6.10: Desempeño del sistema con criterio ISE En la Figura 6.11 se muestra la respuesta para IAE. Desempeño para criterio IAE 45 lin.aprox lin. exacta lin. extendida lin. b. vel. 40 35 30 error 25 20 15 10 5 0 0 5 10 15 20 tiempo (s) 25 30 35 40 Figura 6.11: Desempeño del sistema con criterio IAE 6.4 Desempeño del sistema controlado 91 Una obervación de los criterios de desempeño ISE y IAE, es que la linealización aproximada y la exacta son las que más errores tienen, con la diferencia que la exacta compensa al sistema para alcanzar la referencia, no siendo ası́ con la aproximada, que solo reduce el error para su valor de equilibrio. En el Anexo A se muestran figuras del desempeño de los controladores obtenidos por cada uno de los métodos de linealización, para diferentes valores de V (t). Los valores para V (t) son al azar, lo importante es resaltar como afecta el parámetro en el desempeńo del sistema, no se trata de buscar el valor optimo de desempeño, esto debido a que el parámetro no es fijo y está en cambio permanente. Tipo de linealización V(t) -5 0 Linealización Aproximada 5 10 15 -5 0 Linealización Extendida 5 10 15 Criterio Valor IAE 0.89862 ISE 0.1532 IAE 1.02 ISE 0.1733 IAE 1.188 ISE 0.2078 IAE 1.458 ISE 0.2736 IAE 1.848 ISE 0.4141 IAE 0.3829 ISE 0.1293 IAE 0.3829 ISE 0.1293 IAE 0.3829 ISE 0.1293 IAE 0.3829 ISE 0.1293 IAE 0.3829 ISE 0.1293 6.4 Desempeño del sistema controlado Tipo de linealización 92 V(t) -5 0 Linealización Exacta 5 10 15 -5 0 Linealización B. Velocidad 5 10 15 Criterio Valor IAE 0.9344 ISE 0.4179 IAE 0.9344 ISE 0.4179 IAE 0.9344 ISE 0.4179 IAE 0.9344 ISE 0.4179 IAE 0.9344 ISE 0.4179 IAE 0.2134 ISE 0.0627 IAE 0.2146 ISE 0.06231 IAE 0.2148 ISE 0.06257 IAE 0.215 ISE 0.06281 IAE 0.2159 ISE 0.06308 Tabla 6.5: Criterios de desempeño Como se observa en la Tabla 6.5, el mejor desempe?o del sistema lo presenta la linealización basada en la velocidad, que ante cambios en el parámetro su error varia muy poco, luego le sigue la extendida que su error es constante, sin importar la variación del parámetro V (t), este mismo comportamiento se observa en la exacta, y finalmente, esta la aproximada donde su error va en crecimiento a medida que el valor del parámetro cambia. Capı́tulo 7 Conclusiones y recomendaciones Se realizo un análisis comparativo de los diferentes métodos de linealización, donde se realizo comparaciones en cuanto a los requerimientos, caracterı́sticas y el desempeño del sistema, se observo que el sistema no lineal es general, para la linealización aproximada, extendida y la LBV, mientras que para la linealización exacta el sistema no lineal es afines a la entrada. Además de que el sistema no lineal debe tener primera derivada continúa para la aproximada, la extendida y la LBV. Las funciones del sistema no lineal afines a la entrada deben ser continuamente diferenciables para la linealización exacta. En cuanto a requerimientos, la aproximada se limita a una región alrededor del punto de equilibrio, en la extendida la región es para continuos puntos de equilibrio parametrizados en función de la entrada, donde el sistema no lineal en lazo cerrado debe tener el mismo punto de operación del sistema no lineal, que a su vez debe coincidir con el sistema linealizado en lazo cerrado. Para la linealización exacta el sistema debe poder transformarse a la forma canónica controlable y debe ser invertible también, la función de salida del sistema no lineal, establece si aparece la dinámica de los ceros o no; el cual tiene como requisito que la derivada de orden n del sistema depende únicamente de la función de entrada del sistema no lineal, debe haber una salida solamente. Para la LVB es válida para cualquier punto de operación, incluso los que no son de equilibrio, está compuesta de una familia de sistemas LTI, para cada valor del rango de los parámetros variantes, que dependen de los estados, entradas o son función del tiempo. 7.1 Recomendaciones 94 Para las caracterı́sticas, la aproximada, permite analizar el comportamiento y diseño de controladores para el sistema no lineal, alrededor del punto de equilibrio. La extendida permite que haya seguimiento de la referencia del sistema en lazo cerrado, donde las soluciones para el controlador son múltiples. En la exacta está basada en la geometrı́a diferencial, es válida en un entorno determinado por las caracterı́sticas del sistema no lineal, se puede perder el significado fı́sico de las variables de estado, debido a la transformación del sistema, permite seguir la referencia del sistema en lazo cerrado. La LBV adopta la forma de los sistemas LPV, le añade robustez al sistema en lazo cerrado, debido a la variación de los parámetros del sistema, el controlador del sistema es único, para la familia de puntos de operación del sistema y permite que el sistema en lazo cerrado siga la referencia. Para terminar, el desempeño de cada linealización ante la variación del parámetro, evidencia que la LBV es la que mejores resultados tiene ya que el error es pequeño en comparación a los demás métodos, para el caso de la aproximada, es la que mas error presenta y se ve fuertemente afectada por la variación del parámetro. La exacta y la extendida al contrarrestar el efecto del parámetro variante, el error es constante. 7.1 Recomendaciones Para futuros trabajos se recomienda emplear diferentes tipos de controladores, ya que en este trabajo, solo se utilizo el controlador por realimentación de estados, además de utilizar la linealización basada en la velocidad para resolver un problema práctico, donde se tenga en cuenta la variación de los parámetros y como afecta al sistema. Bibliografı́a Abderrahman, I. (2004). Controllability, observability, and stability of mathematical models. Encyclopedia of Life Support Systems (EOLSS), Mathematical Models, UNESCO. Baumann, W. T. y Rugh, W. J. (1985). Feedback Control of Nonlinear Systems by Extended Linearization: the multi-input case. Johns Hopkins University. Electrical Engineering and Computer Science Department. Baumann, W. T. y Rugh, W. J. (1986). Feedback control of nonlinear systems by extended linearization. Automatic Control, IEEE Transactions on, 31(1):40–46. Bruzelius, F. (2004). Linear Parameter-Varying Systems an approach to gain scheduling. Doctor of philosophy, Chalmers University of Technology. Cabrera Durán, M. (2009). Control Robusto de sistemas con incertidumbre politópicas. Tesis de grado, Universidad de los Andes. Cai, Guangbin, D. G. y Hu, C. (2011). A velocity-based lpv modeling and control framework for an air-breathing hypersonic vehicle. International Journal of Innovative Computing, Information and Control, 7(5):2269–2281. Cordero G., R. y Ramirez N., J. (2012). Diseño de controladores para sistemas de párametros inciertos basada en LMI. Guzlop-editores. Corentin, B. (2008). Robust Control and Observation of LPV time-delay systems. Tesis de doctorado, Institut National Polytechnique de grenoble - INPG. BIBLIOGRAFÍA 96 Diez, José L, N. J. L. y Sala, A. (2004). Control por planificación de ganancia con modelos borrosos. Revista Iberoamericana de Automática e Informática Industrial, 1(1):32–43. Dı́ez Ruano, J. L. (2003). Técnicas de agrupamiento para identificación y control por modelos locales. Tesis doctoral, Universidad Politécnica de Valencia. Domı́nguez, S. (2002). Control en Espacio de Estados. Prentice Hall Hispanoamericana, 2 edition. Gao, Ran, D. A. M. S. y Coyle, E. (2004). State feedback integral control by velocitybased multiple model networks. 3:2039–2044. Gao, Ruiyao, O. A. M. S. y Coyle, E. (2002). Discrete-time velocity-based multiple model networks. p. 23. Gao, R. y O’Dwyer, A. (2002). Multiple model networks in non-linear system modeling for control-a review. p. 24. Garcı́a V., D. D. y Colmegna, P. H. (2010). Estudio de Técnicas de Conmutación con Aplicación a Control LPV. Tesis de grado, Universidad Nacional de Quilmes. Ghersin, A. S. (2009). Implementation of Advanced Linear Parameter Varying control Techniques. Tesis de doctorado, Universidad de Buenos Aires. González, A. A. (2012). Control tolerante a Fallas de Sistemas Singulares LPV Politópicos Aplicación a una columna de destilación. Tesis de doctorado en ciencias, Centro Nacional de Investigación y Desarrollo Tecnológico (CENIDET). Hermann, R. y Krener, A. (1977). Nonlinear controllability and observability. Automatic Control, IEEE Transactions on, 22(5):728–740. Isidori, A. (2000). Nonlinear control systems. Springer Science & Business Media. Johansen, Tor, S. R. y Murray-Smith, R. (2000). On the interpretation and identification of dynamic takagi-sugeno fuzzy models. Transactions on, 8(3):297–313. Fuzzy Systems, IEEE BIBLIOGRAFÍA 97 Johansen, T., Hunt, K., Gawthrop, P., y Fritz, H. (1998). Off-equilibrium linearisation and design of gain-scheduled control with application to vehicle speed control. Control Engineering Practice, 6(2):167–180. Khalil, H. K. y Grizzle, J. (2000). Nonlinear systems, volumen 3. Prentice hall New Jersey. Kuo, B. (1996). Sistemas de control automático. Prentice Hall Hispanoamericana. Leith, D. (1999). Input-output linearization by velocity-based gain-scheduling. International Journal of Control, 72(3):229–246. Leith, D. y Leithead, W. (1998a). Gain-scheduled and nonlinear systems: dynamic analysis by velocity-based linearization families. International Journal of Control, 70(2):289–317. Leith, D. y Leithead, W. (1998b). Gain-scheduled controller design: an analytic framework directly incorporating non-equilibrium plant dynamics. International Journal of Control, 70(2):249–269. Leith, D. y Leithead, W. (1999a). Comments on the prevalence of linear parameter varying systems. University of Strathclyde, Glasgow. Leith, D. y Leithead, W. (1999b). Modeling of integrated systems for modular linearisation-based analysis and design. p. 2874–2879. Leith, D. J. y Leithead, W. E. (2000a). Gain-scheduled control: relaxing slow variation requirements by velocity-based design. Journal of guidance, control, and dynamics, 23(6):988–1000. Leith, D. J. y Leithead, W. E. (2000b). Survey of gain-scheduling analysis and design. International journal of control, 73(11):1001–1025. Leith, D.J., T. A. W. B. y Leithead, W. (2001). Application of velocity-based gainscheduling to lateral auto-pilot design for an agile missile. Control Engineering Practice, 9(10):1079–1093. BIBLIOGRAFÍA 98 Lohmiller, W. y Slotine, J.-J. E. (1998). On contraction analysis for non-linear systems. Automática, 34(6):683–696. Martı́nez Z., E. (2013). Metodologı́a para la estabilización cuadrática por retroalimentación del estado con dependencia paramétrica para sistemas lineales con parámetros variantes en el tiempo. Tesis de grado, Universidad Autónoma de Nuevo León. Ming, Y. (2005). Linear Parameter-Varying Sliding Mode Control of State Delayed systems with Application to Delta wing Vortex coupled Dynamics. Tesis de maestrı́a de ciencias aplicadas, Concordia University. M.R., J. (1987). Controllability and observability of nonlinear systems. Murray-Smith, Roderick, J. T. A. y Shorten, R. (1999). On transient dynamics, offequilibrium behavior and identification in blended multiple model structures. p. 3569–3574. Ogata, K. (1998). Ingenierı́a de control moderna. Pearson Education. Pearson Education. Osorio G., G. L. (2011). Observadores para sistemas singulares LPV. Tesis de maestrı́a en ciencias, Centro Nacional de Investigación y Desarrollo Tecnológico (CENIDET). Ramón, B. (2012). Acerca de funciones definidas positivas y funciones k-indefinidas. Análisis armonico y teoria de operadores, 1(1):27–32. Reberga, Luc, H. D. B. J. y Vary, F. (2005). Lpv modeling of a turbofan engine. Reyes, Y. P. (2012). Sı́ntesis de observadores para sistemas lineales de parámetros variables (LPV). Estudio orientado hacia la detección y localización de fallas en procesos de tratamiento de aguas residuales. Tesis de maestrı́a en ciencias, Centro Nacional de Investigación y Desarrollo Tecnológico (CENIDET). Rı́os, A. (2003). Metodologı́as para la construcción de sistemas de detección y diagnóstico de fallas. Tesis de grado en doctor de ciencias aplicadas, Universidad de los Andes. BIBLIOGRAFÍA 99 Rosales Sánchez, I. C. (2003). Diseño de Controladores Robustos por asignación de polos vı́a LMI. Tesis de grado, Universidad de los Andes. Shorten, Robert, M.-S. R. B. R. y Gollee, H. (1999). On the interpretation of local models in blended multiple model structures. International Journal of control, 72(78):620–628. Sira H., M. R. (2006). Control de Sistemas No Lineales Linealizacion Aproximada,Extendida y Exacta. Prentice Hall Hispanoamericana. Sira Ramirez, H. (1994a). Control de sistemas no lineales por linealización exacta. Cuadernos de ingenierı́a de control. Publicaciones Universidad de los Andes. Sira Ramirez, H. (1994b). Control de sistemas no lineales por linealización extendida. Cuadernos de ingenierı́a de control. Publicaciones Universidad de los Andes. Slotine, J.-J. E., Li, W., et al. (1991). Applied nonlinear control, volumen 199. PrenticeHall Englewood Cliffs, NJ. Sungyung, L. (1998). Analysis and Control of Linear Parameter-Varying systems. Doctor of philosophy, Stanford university. Tejeda, A. R. (2013). Control tolerante a fallas para sistemas LPV. Tesis de maestrı́a en ciencias, Centro Nacional de Investigación y Desarrollo Tecnológico (CENIDET). Tóth, R. (2008). Modeling and Identification of Linear Parameter-Varying Systems an Orthornormal Basis Function Approach. Tesis de doctorado, Technische Universiteit Delft. Vidyasagar, M. (2002). Nonlinear systems analysis, volumen 42. Siam. Apéndice A Criterios de Desempeño para cada método de linealización Se muestran las respuestas que se obtuvieron para ver el desempeño de cada controlador obtenido por cada método de linealización, donde se va cambiando el valor del parámetro variante V (t), donde se observara como este valor influye en la respuesta del sistema controlado. En la Figuras A.1 y A.2 se muestran las respuestas obtenidos para los criterios IAE y ISE para el controlador por linealización aproximada. A Criterios de Desempeño para cada método de linealización 101 desempeño lin. aproximada V =−5 V=0 V=5 V=10 V=15 X: 19.78 Y: 1.848 1.8 1.6 X: 19.93 Y: 1.458 error IAE 1.4 X: 19.86 Y: 1.188 1.2 X: 19.92 Y: 1.02 1 X: 19.94 Y: 0.8962 0.8 0.6 14 15 16 17 tiempo (s) 18 19 20 Figura A.1: Desempeño de la lin. Aproximada con el criterio IAE desempeño lin. aproximada 0.55 V =−5 V=0 V=5 V=10 V=15 0.5 0.45 X: 19.98 Y: 0.4141 error ISE 0.4 0.35 X: 19.99 Y: 0.2736 0.3 0.25 X: 19.98 Y: 0.2078 X: 19.98 Y: 0.1733 0.2 0.15 X: 19.98 Y: 0.1531 0.1 19.2 19.3 19.4 19.5 19.6 tiempo (s) 19.7 19.8 19.9 20 Figura A.2: Desempeño de la lin. Aproximada con el criterio ISE Para la linealización extendida se tiene las Figuras A.3 y A.4. A Criterios de Desempeño para cada método de linealización 102 desempeño lin. extendida 0.4 X: 19.55 Y: 0.3829 0.35 0.3 V =−5 V=0 V=5 V=10 V=15 error IAE 0.25 0.2 0.15 0.1 0.05 10 11 12 13 14 15 tiempo (s) 16 17 18 19 20 Figura A.3: Desempeño de la lin. Extendida con el criterio IAE desempeño lin. extendida X: 19.07 Y: 0.1293 0.12 V =−5 V=0 V=5 V=10 V=15 0.1 error ISE 0.08 0.06 0.04 0.02 0 10 11 12 13 14 15 tiempo (s) 16 17 18 19 20 Figura A.4: Desempeño de la lin. Extendida con el criterio ISE Para la linealización exacta, la respuesta se muestra en la Figuras A.5 y A.6. A Criterios de Desempeño para cada método de linealización 103 desempeño lin. exacta V =−5 V=0 V=5 V=10 V=15 1.2 1 X: 19.53 Y: 0.9344 error IAE 0.8 0.6 0.4 0.2 10 11 12 13 14 15 tiempo (s) 16 17 18 19 20 Figura A.5: Desempeño de la lin. Exacta con el criterio IAE desempeño lin. exacta 0.45 V =−5 V=0 V=5 V=10 V=15 0.44 0.43 0.42 error ISE X: 18.21 Y: 0.4179 0.41 0.4 0.39 0.38 0.37 0.36 11 12 13 14 15 16 tiempo (s) 17 18 19 20 Figura A.6: Desempeño de la lin. Exacta con el criterio ISE Y finalmente, para la Linealizacion basada en la velocidad se tienen las Figuras A.7 y A.8. A Criterios de Desempeño para cada método de linealización 104 desempeño lin. b. vel. 0.216 V =−5 V=0 V=5 V=10 V=15 0.2155 X: 20 Y: 0.2159 X: 20 Y: 0.215 0.215 error IAE X: 20 Y: 0.2148 X: 20 Y: 0.2146 0.2145 0.214 X: 20 Y: 0.2134 0.2135 19.96 19.965 19.97 19.975 19.98 tiempo (s) 19.985 19.99 19.995 Figura A.7: Desempeño de la lin. B. Velocidad con el criterio IAE desempeño lin. b. vel. 0.0632 0.063 X: 20 Y: 0.06308 V =−5 V=0 V=5 V=10 V=15 X: 20 Y: 0.06281 error ISE 0.0628 X: 20 Y: 0.06257 0.0626 0.0624 X: 20 Y: 0.06231 0.0622 X: 20 Y: 0.06207 19.965 19.97 19.975 19.98 19.985 tiempo (s) 19.99 19.995 20 Figura A.8: Desempeño de la lin. B. Velocidad con el criterio IAE Apéndice B Fundamentos de Control Robusto En este apartado se dan nociones básicas para el diseño de un controlador por H2 . B.1 Normas En este sentido, nos referimos a norma como a una medida del espacio de interés, que cumple con: 1. Si x ∈ E y kxk = 0 entonces x = 0. 2. Si β ∈ R(C), x ∈ E entonces kβxk = |β|kxk. 3. Si x, y ∈ E entonces kx + yk < kxk + kyk Donde E es el espacio vectorial, y una norma sobre este espacio, se conoce como un espacio normado. Generalmente una norma está dada como: kxkp = (|x1 |p + |x2 |p + |x3 |p + · · · + |xn |p )1/p . Donde p ∈ [1, ∞), x ∈ C n , por lo tanto, x = (x1 , x2 , · · · , xn ). Se distinguen 2 normas de interés, como lo son: • kxk2 conocida como la norma euclidiana o longitud euclidiana del vector. (B.1) B.1 Normas 106 • kxk∞ que es el valor máximo de maxi |xi |. De acuerdo al espacio de interés, se tienen normas para: • Normas de Vectores. • Normas de Matrices. • Normas de Señales. • Normas de Sistemas Se profundiza en la norma H2 para sistemas, para mayor información sobre las normas consultar (Rosales Sánchez, 2003; Cabrera Durán, 2009; Rı́os, 2003). B.1.1 Calculo de la norma H2 Tomando el sistema visto en (1.30), que denota el modelo general de una planta, donde Tz w corresponde a la función de transferencia de la perturbación w, a la salida controlada z. Si consideramos solo los estados, las salidas medibles del sistema y como afecta la perturbación al sistema, se tiene el sistema: ẋ = Ax + Bw, (B.2) z = Cx + Dw. Sea G(s) la función de transferencia de (B.2), dada como: " G(s) = A B # . (B.3) C D Y si kG(s)k2 < ∞ se debe cumplir que: 1. D=0. 2. kG(s)k2 = p traza(CQC T ) donde Q es el Grammiano de Observabilidad dado como AT Q + QA + C T C = 0. 3. Una alternativa es utilizar el Grammiano de Controlabilidad, por lo p cualkG(s)k2 = traza(B T QB),se resuelve a Q, como AQ + QAT + BB T = 0 B.2 LMI B.2 107 LMI Las desigualdades matriciales lineales (LMI) están dadas como: F (x) ∼ = Fo + n X xi Fi > 0. (B.4) i=1 Donde x ∈ R m variables, y las matrices simétricas Fi = FiT ∈ Rn×n , i = 0, · · · , m son dadas, y F (x) es definida positiva, es decir, uT F (x)u > 0 para todo u distinto de cero ∈ Rn . Por lo general, una LMI es una restricción convexa en x, para x tal que F (x) > 0 son un conjunto convexo. Cuando las matrices Fi son diagonales, el LMI F (x) > 0 es un conjunto de desigualdades lineales. Las desigualdades convexas no lineales, se convierten a la forma de LMI usando el complemento de Shur. Complemento de Shur Sea: " Q(x) S(x) # S(x)T R(x) > 0. (B.5) Donde Q(x) y R(x) son simétricas y S(x) depende de la afinidad de x, que es equivalente a. R(x) > 0, Q(x) − S(x)R(x)− 1S(x)T > 0. (B.6) El problema correspondiente a un LMI es encontrar un x factible para F (x) > 0 Cabrera Durán (2009); Rosales Sánchez (2003). B.3 Control por Realimentación de Estados por H2 Sea el sistema LTI siguiente: ẋ = Ax + B2 w + B1 u, z = C1 x + D12 w + D11 u. (B.7) B.3 Control por Realimentación de Estados por H2 108 Donde x ∈ Rn estados, w ∈ Rr perturbaciones externas, z ∈ Rq son las salidas manipuladas y u ∈ Rp entradas. Sea K ∈ Rpxn la matriz de ganancias por realimentación de estados, donde u = Kx, que forma el siguiente sistema en lazo cerrado: ẋ = (A + B1 K)x + B2 w, (B.8) z = (C1 + D11 K)x + D12 w. El problema es determinar una ganancia K, que estabiliza el sistema y minimiza la norma H2 del sistema (B.7). Tomando en consideración que D12 = 0 (Cabrera Durán, 2009). El problema consiste en resolver la optimización para el sistema (B.8) como: " AQ + QA + B1 Y + Y B1 B2 B2 −Ir " W # C1 Q QC1 Q Q>0 # ≥ 0; < 0; (B.9) traza(W ) < γ 2 . Donde Q es simétrica y definida positiva, además de que W y Y satisfacen el problema de optimización, por lo tanto las ganancias del controlador se obtienen como: K = Y Q−1 . (B.10) p Y la norma H2 está dada como kGz wk2 < traza(W ). Finalmente el controlador debe satisfacer que la perturbación sea mı́nima para el sistema, considerando la limitación de la perturbación por medio de la norma. En (Rosales Sánchez, 2003) se profundiza acerca de esta metodologı́a de control. Apéndice C Algunas Definiciones Error Estacionario: es la diferencia entre la salida y el valor deseado. Error Dinámico: Representa la variación del error cuando se presenta un cambio en la entrada o cuando se produce una perturbación en el sistema. (se pondera utilizando algún ı́ndice de error integral). Donde la integral del error cuadrático (ISE) está dada por la Ec. (C.1). ∞ Z e(t)2 dt. ISE = (C.1) 0 Para la integral del error absoluto (IAE) dado en la Ec. (C.2). ∞ Z |e(t)|dt. IAE = (C.2) 0 Y la integral del error absoluto por el tiempo (ITAE) que se establece por la Ec. (C.3). Z IT AE = ∞ t|e(t)|dt. (C.3) 0 C.0.1 Función Implı́cita Si en una ecuación del tipo F (x, y, · · · , z) = 0, se dice que esta ecuación define en el entorno de un punto Po (x0 , yo , · · · , zo ) a z = f (x, y, · · · ), como una función de nvariables si para todo punto P del entorno Po se tiene que F (x, y, · · · , f (x, y)) ≡ 0. C Algunas Definiciones 110 En general una representación implı́cita está dada por una sola ecuación en función de la variables (x, y, · · · , z) de la formaF (x, y, · · · , z) = 0. Teorema C.0.1. Sea una ecuación de n + 1 variables F (x, y, · · · , z) = 0 esta ecuación define una función implı́cita z = f (x, y, · · · ) en el entorno de un punto Po (xo , yo , · · · , zo ) si: 1. F (xo , yo , · · · , zo ) = 0 es decir Po satisface la ecuación 2. F (xo , yo , · · · , zo ) : Fx0 , Fy0 , · · · son funciones continuas en el entorno del punto Po 3. Fz0 (xo , yo , · · · , zo ) 6= 0, la derivada respecto de z no se anula. Para obtener una expresión que nos permita obtener las derivadas parciales de la función implı́cita, diferenciamos los dos miembros de la ecuación F (x, y, · · · , z) = 0 ∂F ∂F ∂F dx + dy + · · · + dz = 0, ∂x ∂y ∂z (C.4) despejando dz, dz = − ∂F ∂x ∂F ∂z dx − ∂F ∂y ∂F ∂z dy − · · · . (C.5) De manera que se obtiene la derivada implı́cita de la función z = f (x, y, · · · ). C.0.2 Función definida positiva Se dice que una función f : R → C es definida positiva si n X f (xj − xk )λi λk ≥ 0, j,k para todo n ∈ N, x1 , · · · , xn , ∈ R, x1 , · · · , xn ∈ C. Teorema C.0.2. Sea f : R → C una función definida positiva, entonces 1. f (0) ≥ 0, 2. f (x) = f (−x)∀x ∈ R, 3. | f (x) |≤ f (0)∀x ∈ R. Lo que implica que toda función definida positiva es acotada (Ramón, 2012). (C.6) C.1 Representación de los Sistemas LPV C.1 111 Representación de los Sistemas LPV Aquı́ se describe dos formulaciones. Formulación dependiente de los parámetros Formulación adecuada para sistemas polinomiales, aunque se puede usar para cualquier tipo de sistemas LPV, se representa como (Ec. (C.7)) ẋ(t) = A(ρ)x(t), (C.7) donde Ec. (C.8) es A(ρ) = Ao + ∞ X Ai ραi . (C.8) i α1 α2 αN Con αi = [αi1 , · · · , αiN ] y ραi = ρ1 i ρ2 i · · · ρNi como se observa hay una dependencia polinomial de los parámetros. Formulación por transformación fraccional lineal (LFT) Consiste en dividir el sistema en 2 partes, una donde estén los parámetros variantes del sistema y otra donde estén las constantes; la separación permite que se puedan manipular las ecuaciones del sistema, considerando que solo la función que depende del parámetro es variable Reyes (2012). En la Figura C.1 se ilustra la representación LFT, donde z(t) salidas, w(t) entradas, H(s) la parte constante del sistema y θ(t) los parámetros variantes del sistema. Figura C.1: Bloque para LFT C.1 Representación de los Sistemas LPV 112 Sea Ec. (C.9): ẋ(t) = A(ρ)x(t), y(t) = (C.9) Cx(t). Se reescribe el sistema como en la Ec. (C.10), donde se obtiene: ẋ(t) = Ãx(t) + Bw(t), (C.10) z(t) = Cx(t) + Dw(t), donde (Ec. (C.11)) w(t) = θ(ρ)z(t), (C.11) = θ(ρ)Cx(t) + Dw(t)). Para todo ρ ∈ [−1; 1]. Por lo cual se obtiene Ec. (C.12). w(t) = (I − θ(ρ)D)−1 θ(ρ)x(t). (C.12) Por lo que finalmente se obtiene Ec. (C.13) ṫ = (Ã + B(I − θ(ρ)D)−1 θ(ρ)C)x(t). (C.13) Mostrando que tenemos (Ec. (C.14)) A(ρ) = Ã + B(I − θ(ρ))−1 θ(ρ)C, = Ã + Bθ(ρ)(I − Dθ(ρ))−1 C. (C.14) Finalmente, H(s) corresponde a la función de transferencia del sistema y está dada como H(s) = C(sI − Ã)−1 B + D. (C.15)