1 Álgebra. 2004-2005. Ingenieros Industriales. Departamento de Matemática Aplicada II. Universidad de Sevilla. Tema 11.- Autovalores y Autovectores. Definición, propiedades e interpretación geométrica. La ecuación caracterı́stica. Matrices diagonalizables. Autovalores y autovectores complejos. A lo largo de todo el tema trataremos esencialmente con matrices cuadradas reales (aunque muchos de los resultados que veamos también serán válidos para el caso de matrices cuadradas complejas). De todos modos, aunque se trabaje con matrices reales, será imprescindible hacer referencia a los números complejos puesto que un polinomio con coeficientes reales puede tener raı́ces complejas no reales. Autovalores y Autovectores: Definición y propiedades. Definición. Sea A una matriz cuadrada de orden m. Diremos que un escalar λ ∈ K (= R o C) es un autovalor de A si existe un vector v ∈ Km , v 6= 0 tal que Av = λv, en cuyo caso se dice que v es un autovector de A asociado al autovalor λ. Proposición. Sea λ un autovalor de A y v un autovector asociado, entonces: 1. αλ es un autovalor de αA con autovector v. 2. (λ − µ) es un autovalor de A − µI con autovector v. 3. λk es un autovalor de Ak con autovector v. 4. Si q(·) es un polinomio, entonces q(λ) es un autovalor de q(A) con autovector v. (Ejemplo: 3λ3 + 5λ2 − 7λ + 2 es un autovalor de la matriz 3A3 + 5A2 − 7A + 2I). 5. Si A tiene inversa, entonces λ 6= 0 y λ−1 es un autovalor de A−1 con autovector v. Definición. Sea A una matriz m × m y sea λ0 un autovalor de A. Se llama: (a) Multiplicidad algebraica de λ0 , y se denota por ma (λ0 ), a la multiplicidad de λ0 como raı́z del polinomio caracterı́stico p(λ) = det(A − λI) de A. Es decir, p(λ) puede factorizarse como p(λ) = (λ − λ0 )ma (λ0 ) q(λ), siendo q(λ) un polinomio (de grado m − ma (λ0 )) que no se anula para λ0 , q(λ0 ) 6= 0. (b) Multiplicidad geométrica de λ0 , y se denota por mg (λ0 ), a la dimensión del espacio nulo de A − λ0 I, dim [Nul (A − λ0 I)] = m − rango [(A − λ0 I)] . Es decir, la multiplicidad geométrica coincide con el número (máximo) de autovectores linealmente independientes asociados al autovalor. Lo único que se puede afirmar en general sobre la relación entre las multiplicidades algebraica y geométrica de un autovalor de una matriz viene dado por el siguiente resultado. Lema. Sea λ0 un autovalor de una matriz A, entonces 1 ≤ mg (λ0 ) ≤ ma (λ0 ). Proposición. Sea A una matriz m × m y sean λ1 , λ2 , . . . , λm sus m autovalores (cada uno aparece tantas veces como indique su multiplicidad algebraica) entonces: su polinomio caracterı́stico es p(λ) = (−1)m (λ − λ1 )(λ − λ2 ) · · · (λ − λm ). el determinante de A coincide con el producto de los autovalores: det(A) = λ1 λ2 · · · λm . la traza de A coincide con la suma de los autovalores: tr(A) := a11 + . . . + amm = λ1 + λ2 + · · · + λm . Proposición. Sea A una matriz m × m, entonces: 2 1. At tiene los mismos autovalores que A (en general los autovectores asociados serán distintos). 2. Si A es real y v es un autovector de A asociado a λ, entonces v̄ también es autovector de A asociado al autovalor λ. Además, las multiplicidades algebraicas y geométricas respectivas de λ y λ̄ coinciden. Matrices diagonalizables. Definición. Se dice que una matriz A m × m es diagonalizable es una matriz diagonal. Notemos que si d1 0 0 d2 P −1 AP = D = 0 0 .. .. . . 0 si existe alguna matriz P no singular tal que P −1 AP 0 0 d3 .. . ... ... ... .. . 0 . . . dm 0 0 0 0 .. . entonces cada columna de P es un autovector de P asociado al correspondiente elemento diagonal de D que será un autovalor de A. Además, puesto que existe la matriz inversa de P , las m columnas de P son linealmente independientes. Teorema. Sea A una matriz m × m. Se verifica: (1) A es diagonalizable si y sólo si tiene m autovectores linealmente independientes. (2) A autovalores distintos de A le corresponden autovectores linealmente independientes, es decir, si v1 , · · · , vk son autovectores de A asociados respectivamente a los autovalores λ1 , · · · , λk y estos son distintos dos a dos, entonces v1 , · · · , vk son linealmente independientes. (3) Si A tiene todos sus autovalores simples, entonces es diagonalizable. (4) A es diagonalizable si y sólo si para cada autovalor λ se verifica que ma (λ) = mg (λ). Matrices semejantes y aplicaciones lineales. Consideremos una aplicación lineal T : Rm → Rm . Fijada la base canónica Bc = {e1 , . . . , em } de Rm , esta aplicación lineal tiene asociada una matriz A, cuyas columnas son los vectores T (e1 ), T (e2 ), . . . T (em ). Si fijamos otra base B = {v1 , . . . , vm } de Rm , la aplicación lineal T tiene asociada una matriz B respecto a dicha base, la matriz cuyas columnas son las coordenadas de los vectores T (v1 ), T (v2 ), . . . T (vm ) respecto a la base B, es decir, [T (v1 )]B , . . . , [T (vm )]B . Las matrices A y B verifican que B = P −1 AP siendo P = v1 ... vm . En general, dicha relación se formaliza mediante la siguiente definición. Definición. Se dice que dos matrices m × m A y B son semejantes si existe alguna matriz no singular P tal que B = P −1 AP. La matriz P se suele denominar matriz de paso. A la vista de la definición es obvio que una matriz es diagonalizable si es semejante a una matriz diagonal. Proposición. Si A y B son semejantes, entonces: A y B tienen el mismo polinomio caracterı́stico y, por tanto, los mismos autovalores con las mismas multiplicidades algebraicas. Si v es un autovector de A asociado a un autovalor λ, entonces P −1 v es un autovector de B asociado al mismo autovalor λ (siendo P la matriz no singular tal que B = P −1 AP ). det(A) = det(B) y tr(A)=tr(B). Cada autovalor (de A y B) tiene la misma multiplicidad geométrica para ambas matrices, es decir, dim [Nul (A − λI)] = dim [Nul (B − λI)] . 3 Para cada exponente k = 1, 2, . . . se verifica que £ ¡ ¢¤ £ ¡ ¢¤ dim Nul (A − λI)k = dim Nul (B − λI)k . Notemos por otra parte que el que dos matrices tengan los mismos autovalores no conlleva, en general, el que sean semejantes; por ejemplo, las matrices ¸ ¸ · · 0 1 0 0 A= y B= 0 0 0 0 tienen como único autovector a λ = 0 pero no son semejantes. Si V es un espacio vectorial, B = {v1 , . . . , vm } una base del mismo, y f : V → V una aplicación lineal, nótese entonces que la matriz de f en B es semejante a la matriz de f 0 } de V . Por lo tanto, a la vista de los resultados anteriores, se pueden definir, en cualquier otra base B0 = {v10 , . . . , vm los autovalores, la traza y el determinante de f como los autovalores, traza y determinante de f en cualquier base. Lo mismo ocurre con el polinomio caracterı́stico. Autovalores y autovectores complejos. Ampliamos en estas lı́neas lo tratado en la sección 5.5 del libro (Lay). En dicha sección se muestra cómo una matriz real 2 × 2 diagonalizable en C (es decir, con un par de autovalores complejos conjugados, a ± bi) se puede escribir en una forma no diagonal, pero con una estructura muy sencilla (ver teorema 9 de la página 334) ¸ · a b . −b a En el caso de tener una matriz real diagonalizable de mayor dimensión con autovalores complejos podemos proceder de un modo similar para obtener una matriz real no diagonal, pero sı́ diagonal por bloques, con una estructura similar a la anterior. Ası́, una matriz diagonalizable pero con algún autovalor complejo no real (con lo cual la matriz de paso tendrá algunos elementos no reales) será semejante, a través de una matriz de paso real, a una matriz diagonal por bloques C1 0 0 ... 0 0 C2 0 . . . 0 0 C3 . . . 0 C= 0 .. .. .. . . .. . . . . . 0 0 0 . . . Ck · donde cada Cj es o bien un autovalor real o bien una submatriz 2 × 2 de la forma a b −b a ¸ , donde a y b son respectivamente la parte real e imaginaria de un autovalor complejo (no real) de A. Si λ = a + bi, a, b ∈ R es un autovalor de A (matriz cuadrada real) y v = u1 + iu2 (u1 , u2 ∈ Rm ) es un autovector de A asociado a λ, entonces v̄ = u1 − iu2 es autovector de A asociado a λ̄ = a − bi y, por tanto, tenemos las igualdades Av = λv = (a + bi) (u1 + iu2 ) ⇒ Au1 + iAu2 = (au1 − bu2 ) + i (bu1 + au2 ) Av̄ = λ̄v̄ = (a − bi) (u1 − iu2 ) ⇒ Au1 − iAu2 = (au1 − bu2 ) − i (bu1 + au2 ) y por tanto, identificando las partes real e imaginaria en cualquiera de las dos igualdades anteriores tenemos, ¾ Au1 = au1 − bu2 . Au2 = bu1 + au2 Expresando estas igualdades de forma matricial tenemos A u1 u2 = u1 u2 · a b −b a ¸ . Ası́, si multiplicamos A por una matriz en la que los autovectores complejos v y v̄ sean dos vectores columna tenemos .. . λ 0 = · · · v v̄ · · · · · · v v̄ · · · A 0 λ̄ .. . 4 mientras que si sustituimos dichas columnas por la parte real y la parte imaginaria de v tendremos .. . 0 . . . a b A · · · u1 u2 · · · = · · · u1 u2 · · · . . . ... −b a .. . ... 0 con lo cual, si multiplicamos A por una matriz real P cuyas columnas forman una base de Rn y en la que u1 y u2 sean dos vectores columna y los restantes vectores columna sean autovectores reales o vectores obtenidos a partir de la parte real y de la parte imaginaria (por parejas) de un autovector complejo, tendremos .. . 0 0 a b AP = 0 · · · u1 u2 · · · = · · · u1 u2 · · · 0 = PC −b a .. . 0 0 · ¸ a b y por tanto P AP = C, donde la diagonal de la submatriz está sobre la de la matriz C que será una −b a matriz real casi-diagonal (diagonal por cajas). Veámoslo con ejemplos. Ejemplo. Obtener una matriz casi-diagonal real (y la correspondiente matriz de paso) semejante a la matriz −2 −1 1 3 −4 −1 0 4 A= −3 −1 2 3 . −5 −3 1 6 −1 Su ecuación caracterı́stica es λ4 − 5λ3 + 13λ2 − 19λ + 10 = 0. Sus autovalores y sus autovectores asociados son 1 1 1+i 0 0 2 λ1 = 1, v1 = 0 ; λ2 = 2, v2 = 1 ; λ3 = 1 − 2i, v3 = 1 + i 1 1 2 1−i ; λ4 = 1 + 2i, v4 = 2 . 1−i 2 Al ser la matriz diagonalizable, si construimos Q = [v1 , v2 , v3 , v4 ], obtenemos: 1 0 0 0 0 2 0 0 , Q−1 AQ = D = 0 0 1 − 2i 0 0 0 0 1 + 2i donde los autovalores aparecen en la matriz diagonal D en el orden en que se coloquen los autovectores correspondientes en la matriz Q. El inconveniente de esa expresión es que tanto D como Q son matrices complejas aunque A es real. Para evitar trabajar con matrices complejas se procede como sigue (aunque, en este caso, ya no se va a obtener una matriz diagonal sino diagonal por bloques). Por tanto, construyendo la matriz P = [v1 , v2 , Re (v3 ), Im (v3 )], obtenemos: 1 0 0 0 0 2 0 0 C = P −1 AP = 0 0 1 −2 . 0 0 2 1 Ejemplo. Obtener una matriz casi-diagonal real (y la correspondiente matriz de paso) semejante a la matriz 2 2 1 1 −3 −1 −1 0 . A= 0 2 1 3 1 −1 −1 −2 5 Su ecuación caracterı́stica es λ4 + 5λ2 + 4 = 0. Sus autovalores y sus autovectores asociados son 1−i −2 λ1 = −i, v1 = −1 + i ; 2 −i −1 + i λ3 = −2i, v3 = −1 ; 1 1+i −2 ; λ2 = i, v2 = −1 − i 2 i −1 − i λ4 = 2i, v4 = −1 . 1 Al ser la matriz diagonalizable, si construimos Q = [v1 , v2 , v3 , v4 ], −i 0 0 i −1 Q AQ = D = 0 0 0 0 obtenemos: 0 0 0 0 , −2i 0 0 2i donde los autovalores aparecen en la matriz diagonal D en el orden en que se coloquen los autovectores correspondientes en la matriz Q. El inconveniente de esa expresión es que tanto D como Q son matrices complejas aunque A es real. Para evitar trabajar con matrices complejas se procede como sigue (aunque, en este caso, ya no se va a obtener una matriz diagonal sino diagonal por bloques). Por tanto, construyendo la matriz P = [Re (v1 ), Im (v1 ), Re (v3 ), Im (v3 )], obtenemos: 0 −1 0 0 1 0 0 0 C = P −1 AP = 0 0 0 −2 . 0 0 2 0 Ejemplo. Obtener una matriz casi-diagonal real (y la correspondiente matriz de paso) semejante a la matriz 0 −2 5 A = 2 −7 8 . 5 −8 6 Su ecuación caracterı́stica es λ3 + λ2 + λ − 39 = 0. Sus autovalores y sus autovectores asociados son i −i 1 λ1 = −2 − 3i, v1 = 1 + i , λ2 = −2 + 3i, v2 = 1 − i ; λ3 = 3, v3 = 1 . 1 1 1 Al ser la matriz diagonalizable, si construimos Q = [v1 , v2 , v3 ], obtenemos: −2 − 3i 0 0 0 −2 + 3i 0 , Q−1 AQ = D = 0 0 3 donde los autovalores aparecen en la matriz diagonal D en el orden en que se coloquen los autovectores correspondientes en la matriz Q. El inconveniente de esa expresión es que tanto D como Q son matrices complejas aunque A es real. Para evitar trabajar con matrices complejas se procede como sigue (aunque, en este caso, ya no se va a obtener una matriz diagonal sino diagonal por bloques). Por tanto, construyendo la matriz P = [Re (v1 ), Im (v1 ), v3 ], obtenemos: −2 −3 0 −1 C = P AP = 3 −2 0 . 0 0 3 6 Aplicación a recurrencias vectoriales. Definición. Sea A una matriz cuadrada de orden m y sea u1 , u2 , . . . , un , . . . una sucesión de vectores en Rm definidos de manera recurrente por un = Aun−1 , n = 1, 2, . . . a partir de un vector inicial u0 ∈ Rm . Una relación de recurrencia vectorial de esta forma se llama sistema de ecuaciones en diferencias lineal homogéneo de primer orden con coeficientes constantes. Si un = Aun−1 es un sistema de ecuaciones en diferencias, se tiene, razonando por inducción, que un = An u0 . Con esta expresión podemos hallar un para cualquier valor de n. Si A diagonaliza, podemos dar una expresión más simple para un que nos permitirá ahorrar tiempo de cálculo y también estudiar el comportamiento a largo plazo de la sucesión un . Proposición. Sea A una matriz cuadrada de orden m diagonalizable y u0 ∈ Rm . Entonces la solución del sistema de ecuaciones en diferencias un = Aun−1 con vector inicial u0 es un = An u0 = P Dn P −1 u0 , n = 1, 2, . . . siendo P la matriz cuyas columnas forman una base de autovectores de A y D la matriz diagonal cuyos elementos diagonales son los autovalores correspondientes. Observaciones. Nótese que si A no es diagonalizable no es posible, en general, aplicar la técnica anterior para calcular la solución del sistema de ecuaciones en diferencias asociado. Sin embargo, hay un caso especialmente fácil de resolver; si u0 es combinación lineal de autovectores de A, podemos calcular un = An u0 aunque no sepamos calcular An : Siu0 = α1 v1 + · · · + αk vk y Avj = λj vj para cada j = 1, . . . , k, entonces An u0 = α1 λn1 v1 + · · · αk λnk vk . Ejercicios propuestos Se sugieren los siguientes ejercicios del capı́tulo 5 del texto (Lay): - Sección 5.1: todos los impares hasta el 27, 16, 18, 20, 22, 24. - Sección 5.2: todos los impares hasta el 27, 20, 22, 24. - Sección 5.3: todos los impares hasta el 27, 22, 24, 26. - Sección 5.4: todos los ejercicios hasta el 24. - Sección 5.5: todos los impares hasta el 21. - Sección 5.6: 1, 2, 17. - Ejercicios suplementarios (pág. 364): del 1 al 13. Ejercicio 1 Dada la matriz 3 A= 3 −2 0 −1 0 a b . c 1. Calcular A de forma que (2, 0, −1)t sea un autovector cuyo autovalor correspondiente es λ = −1. 2. Hallar los demás autovalores y autovectores. Ejercicio 2 Sabiendo que la matriz: 0 1 1 c a 0 b 1 0 es diagonalizable y tiene un autovalor doble, calcular a, b y c. 7 Ejercicio 3 ¿Para qué valores de a ∈ R tiene la siguiente decir, estudiar cuándo A es diagonalizable) 1 A= a 1 matriz A tres autovectores linealmente independientes? (es Ejercicio 4 Dada la matriz 1 2 , −1 1 A= a 3 0 −2 0 0 0 1 0 . 1 2 a ∈ R. 1. Calcular los valores de a para los que A es diagonalizable. 2. Para dichos valores de a, calcular los autovalores y los autovectores de A−1 . 3. Para dichos valores de a, calcular An . Ejercicio 5 Estudiar la diagonalizabilidad de las siguientes matrices en función de los parámetros que aparecen. −1 0 0 0 a+3 b 1 5 0 0 a −1 0 0 . 0 a 0 , B = 0 −1 b , C = A= b d 1 0 3 0 a a2 − 1 c a + 1 c e f 1 Ejercicio 6 Sea f : R4 → R4 la aplicación lineal dada por f (x) = Ax, donde a 1 −1 −1 0 b 0 −3 . A= −1 2 c 1 0 1 0 d 1. Hallar A sabiendo que f (S1 ) = S2 , donde ½ x1 − x2 = 0 S1 ≡ x3 + x4 = 0 S2 = Gen{(1, −2, 1, 1)t , (0, 3, −1, −2)t }. y 2. Probar que A no es diagonalizable. Ejercicio 7 Consideremos la matriz a1 A= 1 0 b1 b2 b3 c1 c2 . c3 (a) Determinar los elementos de A sabiendo que sus autovalores son λ1 = 2 y λ2 = 3 (doble), que v1 = (1, 2, 1)t es un autovector asociado a λ2 = 3 y v2 = (2, 1, 0)t satisface que Av2 = 3v2 + v1 . (b) Estudiar si A es diagonalizable. (c) Calcular las soluciones del sistema de ecuaciones en diferencias un = Aun−1 para los vectores iniciales u0 = (1, 2, 1)t y u0 = (1, 3, 2)t . Ejercicio 8 Dado el sistema de ecuaciones en diferencias un = Aun−1 , siendo 0 α 0 0 α 0 0 0 A= 0 0 0 α , 0 0 α 0 1. Obtener la expresión general de un , según los valores de α ∈ R. 2. Calcular u10 , dado el vector inicial u0 = (0, 2, 0, 2)t .