Determinación Numérica de Eigenvalores y Eigenvectores.

Anuncio
Determinación Numérica de Eigenvalores y Eigenvectores.
José Marı́a Rico Martı́nez
Departamento de Ingenierı́a Mecánica.
Universidad de Guanajuato, F. I. M. E. E.
Calle Tampico No. 912, Col. Bellavista.
CP 36730, Salamanca, Gto., México
Tel. +52-464-6480911, Fax: +52-464-6472400.
E-mail: jrico@salamanca.ugto.mx
1
Introducción
Estas notas tienen como objetivo presentar los conceptos fundamentales de la teorı́a de Eigenvalores y Eigenvectores, también conocidos como valores y vectores caraterı́sticos o como valores y vectores propios, de una
matriz cuadrada, ası́ como una revisión somera de los métodos numéricos empleados para su determinación.
2
Establecimiento del problema y definiciones.
Considere una matriz A ∈ n×n dada por
⎡
⎢
⎢
⎢
A=⎢
⎢
⎣
a11
a21
a31
..
.
a12
a22
a32
..
.
a13
a23
a33
..
.
...
...
...
..
.
a1n
a2n
a3n
..
.
an1
an2
an3
. . . ann
⎤
⎥
⎥
⎥
⎥
⎥
⎦
(1)
Definición: Eigenvalor y Eigenvector. Un vector b ∈ n , tal que b = 0, se dice que es un eigenvector,
vector propio o vector caracterı́stico, de la matriz A si y sólo si1
Ab = λb,
donde
λ ∈ C.
(2)
Además, se dice que el escalar λ es el eigenvalor, valor propio o valor characteristico de la matriz A
asociado al eigenvector b; de manera recı́proca, se dice que b es un eigenvector de A asociado al eigenvalor λ.
Debe notarse que, aún cuando la matriz A es real, los eigenvalores asociados a la matriz pueden ser números
complejos.
Teorema I. El conjunto de todos los eigenvectores b asociados al eigenvalor λ constituyen un subespacio
vectorial de n , concido como el eigenespacio asociado al eigenvalor λ.
Prueba: Es suficiente mostrar que el conjunto de vectores
E = {b ∈ n | Ab = λ b}
está cerrado respecto a la adición de vectores y la multiplicación por escalar.
1 Debe
notarse que la ecuación (2) requiere necesariamente que la matriz deba ser cuadrada.
1
1. Sean b1 , b2 ∈ E, por lo tanto
Ab1 = λ b1
y
Ab2 = λ b2
Puesto que la multiplicación de matrices es una operación lineal, se tiene que
A b1 + b2 = Ab1 + Ab2 = λb1 + λb2 = λ b1 + b2
por lo tanto, el conjunto está cerrado respecto de la adición.
2. Sea b1 ∈ E y μ ∈ , por lo tanto
Ab1 = λ b1 .
Puesto que la multiplicación de matrices es una operación lineal, se tiene que
A μ b1 = μAb1 = μλb1 = λμb1 = λ μb1 .
por lo tanto, el conjunto está cerrado respecto a la multiplicación por escalar.
Estas dos pruebas parciales verifican que el conjunto de todos los eigenvectores b asociados al eigenvalor λ
constituyen un subespacio vectorial de n
Considere ahora la ecuación (2), que puede reescribirse de la siguiente forma
Ab = λb,
o
Ab = In λb,
o
[A − λIn ] b = 0
(3)
donde In es la matriz identidad de orden n. Puesto que, por definición, b = 0, la única posibilidad para que
la ecuación (3) se satisfaga es que, la matriz [A − λIn ] sea singular y que b sea un elemento del espacio nulo o
kernel de la matriz. Una condición necesaria y suficiente para que la matriz [A − λIn ] sea singular es que su
determinante sea cero; es decir
p(λ) =| A − λIn |= 0.
(4)
Expandiendo el determinante de la ecuación (4), se obtiene una ecuación polinomial real de n-ésimo orden en λ.
Esta ecuación se denomina la ecuación caracterı́stica de la matriz A. Las raices de la ecuación caracterı́stica
son los eigenvalores de la matriz y los vectores que satisfacen la ecuación (3) son los eigenvectores asociados a
los eigenvalores respectivos.
Es importante señalar que si la matriz A es real, la ecuación caracterı́stica de orden n es real. Del teorema
fundamental del algebra, se sabe que la ecuación (4) tiene n raices cuando se analiza en el campo de los números
complejos, tomando en cuenta la multiplicidad de una raiz; es decir, cuantas veces aparece como repetida una
raiz. Además, si la ecuación (4) tiene una raiz compleja o imaginaria, el complejo conjugado de esa raiz, también
es raiz de la ecuación. En otras palabras, las raices complejas o imaginarias de una ecuación polinomial real
siempre aparecen como pares conjugados.
3
Método directo de determinación de los eigenvalores y eigenvectores de una matriz.
Las observaciones indicadas al término de la sección 2, constituyen las bases de la determinación de eigenvalores
y eigenvectores por el método directo. Los pasos necesarios para esta determinación se indican a continuación.
1. Determine la ecuación caracterı́stica de la matriz; es decir determine
p(λ) =| A − λIn |= 0.
2. Encuentre las n raices de la ecuación caracterı́stica. Estas raices son los eigenvalores de la matriz.
2
3. Para cada uno de los eigenvalores determine el subespacio solución de la ecuación
[A − λIn ] b = 0.
Estos subespacios solución constituyen el eigenespacio asociado al eigenvalor λ.
3.1
Ejemplo 1.
Considere la matriz dada por
⎡
8
2
4
⎢
⎢ 2 6
⎢
A=⎢
⎢ 4 3
⎣
−2 3
⎤
1
⎥
−2 1 ⎥
⎥
⎥
−8 0 ⎥
⎦
4 5
La ecuación caracterı́stica de la matriz A está dada por
0 =| A − λI4 |= p(λ) = −1636 + 756 λ − 49 λ2 − 11 λ3 + λ4
La figura 1 muestra la gráfica de la ecuación caracterı́stica, es evidente, de la figura que existen 4 raices reales
Las raices de la ecuación caracterı́stica y, por lo tanto, los eigenvalores de la matriz A están dadas por
2,000
1,000
lambda
−8
−6
−4
−2
0
2
4
6
8
10
0
−1,000
−2,000
−3,000
−4,000
Figure 1: Gráfica de la Ecuación Caracterı́stica de la Matriz A.
λ1 = −8.382430513,
λ2 = 3.094656787,
λ3 = 6.339424118,
λ4 = 9.948349608.
Para la determinación de los eigenvectores asociados a λ1 = −8.382430513, se tienen que realizar los siguientes cálculos.
1. Determinar la matriz A − λ1 I4 , dada por
⎡
16.38243051
2
4
⎢
⎢
2
14.38243051
−2
⎢
A − λ1 I4 = ⎢
⎢
4
3
0.382430513
⎣
−2
3
3
4
1
1
0
13.38243051
⎤
⎥
⎥
⎥
⎥
⎥
⎦
2. Obtener la forma escalonada reducida de la matriz A − λ1 I4 , dada por
⎡
16.38243051
2.0
4.0
1.0
⎢
⎢
0
14.13826650 −2.488328029 0.8779179928
⎢
⎢
⎢
0
0
5.059299318
13.30306562
⎣
0
0
0
⎤
⎥
⎥
⎥
⎥
⎥
⎦
0.0000000009
Este resultado parece contradictorio, si los cálculos se hubieran realizado de manera exacta, la matriz
A − λ1 I4 debe ser singular, y el término (4, 4) de la forma escalonada reducida deberı́a ser igual a 0. La
diferencia es el resultado de no realizar los cálculos de manera exacta.
3. Despreciando el error indicado en el punto anterior, el eigenvector asociado al eigenvalor λ1 está dado por
la solución del sistema
⎡
⎤
⎤⎡
⎡
⎤
16.38243051
2.0
4.0
1.0
x1
0
⎢
⎥ ⎢ x2 ⎥
⎢
⎥ ⎣
⎢
⎦
0
14.13826650 −2.488328029 0.8779179928 ⎥
⎣
⎦ ⎣ x3 ⎦ = 0
0
0
0
5.059299318
13.30306562
x4
La solución está dada por
bλ =
1
−0.2453188593 0.1996149746 1 −0.3803107842
T
.
Es importante señalar que cualquier múltiplo escalar de bλ1 es igualmente un eigenvector de la matriz A
asociado al eigenvalor λ1 .
Procediendo de manera semejante con los restantes eigenvalores, se tiene que
1. Para λ2 = 3.094656787, se tiene que
bλ =
2
0.06478833904 −0.4579574956 −0.1004735120 1
T
.
2. Para λ3 = 6.339424118, se tiene que
bλ =
3
−0.5802494150 0.2153771052 −0.1168015068 1
T
.
3. Para λ4 = 9.948349608, se tiene que
bλ =
4
4
1
0.3756429166 0.2856490351 0.05446763308
T
.
Determinación de Eigenvalores y Eigenvectores de Matrices Simétricas.
Esta sección inicia definiendo de manera formal una matriz simétrica.
Definición. Una matriz A ∈ n×n se dice que es simétrica, si y sólo si, su transpuesta es igual a la matriz
original, es decir:
AT = A.
Si la matriz cuyos eigenvalores y eigenvectores se desea determinar es simétrica, entonces es posible encontrar
interesantes resultados teóricos que simplifican esa determinación. Por ejemplo, en la sección 2, se comentó que
4
los eigenvalores de una matriz real pueden ser reales o complejos, sin embargo, si la matriz es simétrica, puede
probarse que todos sus eigenvalores son reales. Sin embargo, para probar estos resultados, es necesario emplear
algunos resultados acerca de matrices definidas sobre el campo de los números complejos y de espacios vectoriales
complejos.
Definición. Considere el espacio vectorial C n , definido sobre el campo de los números complejos, C, es
posible definir la siguiente forma cuadrática
∗
q : Cn → q(v ) = v v ,
donde la barra indica la transpuesta conjugado del vector.
Es necesario probar que la imagen de este mapeo es efectivamente un número real
T
q(v ) = v v =
n
v j vj =
j=1
n
(aj + i bj )(aj + i bj ) =
j=1
n
(a2j + b2j ) ∈ j=1
Teorema II. La forma cuadrática definida en la definición anterior es positiva definida.
Prueba: Es evidente que
q(v ) ≥ 0 ∀v ∈ C n .
En particular, si q(v ) = 0, entonces
n
(a2j + b2j ) = 0 ⇔ aj = bj = 0 ∀j = 1, 2, . . . , n.
j=1
Por lo tanto,
q(v ) = 0 ⇔ v = 0.
Ahora se analizarán algunas propiedades de matrices complejas.
Definición. Considere el álgebra de matrices cuadradas, C n×n , definidas sobre el campo de los números
complejos. Una matriz A ∈ C n×n se denomina hermitiana si
∗
A = A.
∗
Donde, A representa la transpuesta conjugada de la matrix A. Es decir, una matriz es hermitiana, si la matriz
es igual a su transpuesta conjugada.
Puesto que el campo de los números reales es un subcampo de los números complejos, < C, entonces si
a ∈ , entonces a = a, y se tiene el siguiente resultado.
Teorema III. Una matriz simétrica, real, es una matriz hermitiana.
∗
Prueba: Suponga que A ∈ n×n < C n×n es simétrica, entonces A = AT , y se tiene que
∗
A = AT = A.
por lo tanto es hermitiana.
Teorema IV. Sea A ∈ C n×n una matriz hermitiana. Entonces
∗
1. x A x es un número real para todo x ∈ C n , y
2. Todos los eigenvalores de A son reales.
Prueba: Para la primera parte, considere el número complejo
∗
∗
∗
∗
∗ ∗∗
x A x = x A x = x A x
5
puesto que el número complejo satisface la propiedad de que su conjugado es igual al número, entonces el
número “complejo” es, en realidad, un número real.
Para la segunda parte considere, un eigenvalor λ de la matriz A hermitiana y sea x un eigenvector de A
∗
asociado a λ y con la propiedad que su forma cuadrática q(x) = x x = 1, entonces
A x = λ x
Además
∗
∗
∗
λ = λ x x = x λ x = x A x.
Debe notarse que por el primer resultado de este teorema λ es un número real.
Debe recordarse que como indica el Teorema III, todas las matrices simétricas son hermitianas, de manera
que todos los resultados del Teorema IV son aplicables a todas las matrices simétricas.
Puede, además, mostrarse que si la matriz es simétrica los eigenvectores son ortogonales, sin embargo, la
prueba de este resultado requiere de conceptos bastante mas complicados.
4.1
Ejemplo 2.
Considere la matriz dada por
⎡
8
2
⎢
⎢ 2 6
⎢
A=⎢
⎢ 4 −2
⎣
1 1
4
1
0
5
⎤
⎥
−2 1 ⎥
⎥
⎥
−8 0 ⎥
⎦
La ecuación caracterı́stica de la matriz A está dada por
0 =| A − λI4 |= p(λ) = −2444 + 946 λ − 60 λ2 − 11 λ3 + λ4
La figura 2 muestra la gráfica de la ecuación caracterı́stica, es evidente, de la figura que existen 4 raices reales
Las raices de la ecuación caracterı́stica y, por lo tanto, los eigenvalores de la matriz A están dadas por
3,000
2,000
lambda
1,000
−10
−8
−6
−4
−2
0
2
4
6
8
10
0
−1,000
−2,000
−3,000
−4,000
−5,000
−6,000
Figure 2: Gráfica de la Ecuación Caracterı́stica de la Matriz A.
6
λ1 = −9.325502313,
λ2 = 4.446795311,
λ3 = 5.915205526,
λ4 = 9.963501476.
Para la determinación de los eigenvectores asociados a λ1 = −9.325502313, se tienen que realizar los siguientes cálculos.
1. Determinar la matriz A − λ1 I4 , dada por
⎡
17.32550231
2
4
⎢
⎢
2
15.32550231
−2
⎢
A − λ1 I4 = ⎢
⎢
4
−2
1.325502313
⎣
1
1
0
⎤
1
⎥
⎥
⎥
⎥
⎥
⎦
1
0
14.32550231
2. Obtener la forma escalonada reducida de la matriz A − λ1 I4 , dada por
⎡
17.32550231
2.0
4.0
1.0
⎢
⎢
0
15.09462877 −2.461747074
0.8845632315
⎢
⎢
⎢
0
0
−0.0866122253
14.21594747
⎣
0
0
0
⎤
⎥
⎥
⎥
⎥
⎥
⎦
−0.00000000332
Este resultado parece contradictorio, si los cálculos se hubieran realizado de manera exacta, la matriz
A − λ1 I4 debe ser singular, y el término (4, 4) de la forma escalonada reducida deberı́a ser igual a 0. La
diferencia es el resultado de no realizar los cálculos de manera exacta.
3. Despreciando el error indicado en el punto anterior, el eigenvector asociado al eigenvalor λ1 está dado por
la solución del sistema
⎤
⎡
⎤⎡
⎡
⎤
17.32550231
2.0
4.0
1.0
x1
0
⎢
⎥ ⎢ x2 ⎥
⎥ ⎣
⎢
⎢
⎦
0
15.09462877 −2.461747074 0.8845632315 ⎥
⎣
⎦ ⎣ x3 ⎦ = 0
0
x4
0
0
−0.0866122253 14.21594747
La solución está dada por
bλ =
1
−0.2500102856 0.1627305853 1
0.006092610111
T
.
Es importante señalar que cualquier múltiplo escalar de bλ1 es igualmente un eigenvector de la matriz A
asociado al eigenvalor λ1 .
Procediendo de manera semejante con los restantes eigenvalores, se tiene que
1. Para λ2 = 4.446795311, se tiene que
bλ = −0.07156723992 −0.4816374493 0.05439198782 1 T .
2
2. Para λ3 = 5.915205526, se tiene que
bλ = −0.5818315235 1 −0.3109782378 0.4569120971 T .
3
3. Para λ4 = 9.963501476, se tiene que
bλ = 1 0.4961701156 0.1674317099 0.3014344054 T .
4
7
Descargar