3. Formas cuadráticas. - Matemática Aplicada II

Anuncio
GRADO DE INGENIERÍA AEROESPACIAL. CURSO 2011–12.
MATEMÁTICAS II. DPTO. DE MATEMÁTICA APLICADA II
Lección 1. Aplicaciones de la derivación parcial.
3. Formas cuadráticas.
En la segunda parte de esta lección abordaremos el problema de la optimización de funciones de
varias variables. En el caso de una variable, la clasificación (máximo o mínimo relativo) de los
puntos críticos de una función f ( x) suficientemente regular depende, como sabemos, del signo de
la derivada segunda, resultado que se obtiene de aplicar el teorema de Taylor. Estos dos elementos:
el teorema de Taylor y el estudio del signo de la derivada segunda son las piezas fundamentales de
la optimización en una variable. Cuando estamos trabajando con varias variables, por ejemplo con
una función f ( x, y ), ocurre algo similar. Ahora nos ocuparemos de trasladar a dos o tres variables
qué significa estudiar el signo de la derivada segunda. En esta nueva situación, y como quedará
claro en la siguiente sección, el papel de la derivada segunda lo desempeña la matriz hessiana o
⎡ f xx ( x, y ) f xy ( x, y ) ⎤
diferencial segunda D 2 f ( x, y ) := ⎢
⎥ , que es una matriz simétrica si la función f
f
x
y
f
x
y
(
,
)
(
,
)
xy
yy
⎣
⎦
es suficientemente regular. Necesitamos, pues, traducir a matrices simétricas qué significa ser positivas o negativas.
DEFINICIÓN (FORMA CUADRÁTICA). Dada una matriz real y simétrica A
ne la forma cuadrática asociada a ella como la aplicación de \ n en \
⎡a
na el número real xt Ax. Si n = 2 y consideramos la matriz A = ⎢ 11
⎣ a12
entonces la expresión de la forma cuadrática es
⎡a
xt Ax = [ x1 x2 ] ⎢ 11
⎣ a12
de dimensión n × n , se defique a cada vector x le asiga12 ⎤
⎡x ⎤
y el vector x = ⎢ 1 ⎥ ,
⎥
a22 ⎦
⎣ x2 ⎦
a12 ⎤ ⎡ x1 ⎤
= a x 2 + 2a12 x1 x2 + a22 x22 .
a22 ⎥⎦ ⎢⎣ x2 ⎥⎦ 11 1
⎡ a11
De forma análoga, si n = 3 y consideramos la matriz A = ⎢⎢ a12
⎢⎣ a13
a12
a22
a23
a13 ⎤
⎡ x1 ⎤
⎥
a23 ⎥ y el vector x = ⎢⎢ x2 ⎥⎥ , en⎢⎣ x3 ⎥⎦
a33 ⎥⎦
tonces la expresión de la forma cuadrática es
⎡ a11
xt Ax = [ x1 x2 x3 ] ⎢⎢ a12
⎢⎣ a13
a12
a22
a23
a13 ⎤ ⎡ x1 ⎤
a23 ⎥⎥ ⎢⎢ x2 ⎥⎥ = a11 x12 + a22 x22 + a33 x32 + 2a12 x1 x2 + 2a13 x1 x3 + 2a23 x2 x3 .
a33 ⎥⎦ ⎢⎣ x3 ⎥⎦
Observa que una forma cuadrática está compuesta por todos los monomios posibles de grado dos de
un polinomio de dos o tres variables. Observa también que el valor de una forma cuadrática en el
origen, es decir, cuando x es el vector nulo, vale cero.
DEFINICIÓN (CLASIFICACIÓN DE FORMAS CUADRÁTICAS). Sea A una matriz cuadrada y simétrica de
orden 2.
1) Diremos que A es semidefinida positiva si para cualquier x ∈ \ 2 se verifica que xt Ax ≥ 0.
2) Diremos que A es semidefinida negativa si para cualquier x ∈ \ 2 se verifica que xt Ax ≤ 0.
1
GRADO DE INGENIERÍA AEROESPACIAL. CURSO 2011–12.
MATEMÁTICAS II. DPTO. DE MATEMÁTICA APLICADA II
Lección 1. Aplicaciones de la derivación parcial.
3) Diremos que la matriz A es indefinida si no es ni semidefinida negativa ni semidefinida positiva;
es decir, si existen dos vectores x, y ∈ \ 2 tales que xt Ax > 0 e y t Ay < 0.
4) Diremos que A es definida positiva si para cualquier x ∈ \ 2 , x ≠ 0, se verifica que xt Ax > 0.
5) Diremos que A es definida negativa si para cualquier x ∈ \ 2 , x ≠ 0, se verifica que xt Ax < 0.
Definiciones análogas tenemos para una matriz cuadrada y simétrica A de orden 3.
Podemos clasificar las matrices simétricas en tres cajas como se representa en el siguiente esquema,
donde además en las cajas de las correspondientes matrices simétricas semidefinidas positivas y
semidefinidas negativas hay una caja más pequeña con las matrices definidas positivas y definidas
negativas, respectivamente.
Matrices semidefinidas negativas
Matrices semidefinidas positivas
Matrices
Matrices definidas
negativas
Matrices definidas
positivas
indefinidas
Una matriz no nula A puede estar solamente en una de las tres cajas grandes en el anterior esquema. Si está en la primera caja, entonces es semidefinida negativa. En este caso puede ser también
definida negativa. Depende de si el único vector donde se anule es el vector cero (en este caso es
definida negativa) o si hay otros vectores donde también se anula (en este caso es semidefinida negativa pero no es definida negativa). Los mismos comentarios pueden hacerse para la segunda caja.
Clasificar una matriz consiste en decidir en qué caja de las anteriores se encuentra. El siguiente
ejemplo, a pesar de que es bastante simple, es clave y, como veremos, todos los demás casos se reducen a éste. Lo desarrollaremos para matrices cuadradas de orden 3. Para matrices de orden 2 se
verifica un resultado análogo.
EJEMPLO. Consideremos una matriz diagonal D = diag(λ1 , λ2 , λ3 ). En este caso, si tomamos un vector x = [ x1 , x2 , x3 ] ∈ \ 3 , se verifica que xt Dx = λ1 x1 + λ2 x2 + λ3 x3 . Por tanto, tenemos que:
t
2
2
2
1) D es semidefinida positiva si, y sólo si, todos sus elementos diagonales son mayores o iguales
que cero;
2) D es semidefinida negativa si, y sólo si, todos sus elementos diagonales son menores o iguales
que cero;
3) D es indefinida si tiene al menos un elemento positivo y otro negativo en su diagonal;
4) D es definida positiva si, y sólo si, todos sus elementos diagonales son positivos;
5) D es definida negativa si, y sólo si, todos sus elementos diagonales son negativos.
OBSERVACIÓN. Es conocido que toda matriz real y simétrica A es diagonalizable y, de hecho, la
matriz de paso es ortogonal. Es decir, existe una matriz P ortogonal ( P −1 = P t ) tal que D = P t AP
2
GRADO DE INGENIERÍA AEROESPACIAL. CURSO 2011–12.
MATEMÁTICAS II. DPTO. DE MATEMÁTICA APLICADA II
Lección 1. Aplicaciones de la derivación parcial.
es una matriz diagonal. De hecho, la diagonal de la matriz D está formada por los autovalores de la
matriz A. En este caso, si x ∈ \ 3 y llamamos y = P t x, entonces
xt Ax = x t PDP t x = ( P t x ) DP t x = y t Dy.
t
Puesto que P es no singular, se verifica que x ≠ 0 si, y sólo si, y ≠ 0. Por consiguiente, xt Ax > 0
para todo x ∈ \ 3 , x ≠ 0 , si, y sólo si, y t Dy > 0 para todo y ∈ \ 3 , y ≠ 0. Es decir, A es definida positiva si, y sólo si, lo es la matriz D = diag(λ1 , λ2 , λ3 ) y, por el ejemplo anterior, esto sucede si los
tres autovalores son positivos.
Resumiendo, hemos probado la afirmación cuarta de la siguiente proposición. Las otras se prueban
de forma análoga.
PROPOSICIÓN. Sea A una matriz cuadrada y simétrica. Entonces
1) A es semidefinida positiva si, y sólo si, todos sus autovalores son mayores o iguales que cero;
2) A es semidefinida negativa si, y sólo si, todos sus autovalores son menores o iguales que cero;
3) A es indefinida si tiene al menos un autovalor positivo y otro negativo;
4) A es definida positiva si, y sólo si, todos sus autovalores son positivos;
5) A es definida negativa si, y sólo si, todos sus autovalores son negativos.
Para matrices de orden bajo podemos establecer una caracterización más cómoda de su carácter definido o indefinido.
⎡ a11 a12 ⎤
PROPOSICIÓN. Sea A = ⎢
⎥ una matriz cuadrada y simétrica. Entonces se verifican las siguien⎣a21 a22 ⎦
tes afirmaciones:
1) A es definida positiva si, y sólo si, det( A) > 0 y a11 > 0 ;
2) A es definida negativa si, y sólo si, det( A) > 0 y a11 < 0 ;
3) A es indefinida si det( A) < 0.
DEM. Si λ y μ son los autovalores de la matriz A, entonces es fácil comprobar que det( A) = λμ y
a11 + a22 = λ + μ . Observemos, por tanto, que el signo de det( A) nos informa sobre el signo de sus
autovalores: si det( A) es negativo entonces sus autovalores son de distinto signo y la matriz es indefinida; si det( A) es positivo entonces los dos tienen el mismo signo, luego la matriz es definida
positiva o definida negativa. ¿Cómo sabemos en este caso el signo de los autovalores? Si λ y μ
son positivos entonces también lo será su suma y así a11 + a22 . Si λ y μ son negativos entonces
también lo será a11 + a22 . Además, puesto que se verifica que det( A) = a11a22 − a12 > 0, deducimos
que a11 y a22 tienen el mismo signo.
2
Para matrices cuadradas de dimensión superior se puede establecer un resultado análogo en términos de los pivotes de la eliminación gaussiana (sin intercambio de filas y sin multiplicar una fila
3
GRADO DE INGENIERÍA AEROESPACIAL. CURSO 2011–12.
MATEMÁTICAS II. DPTO. DE MATEMÁTICA APLICADA II
Lección 1. Aplicaciones de la derivación parcial.
por un escalar). Este resultado es importante ya que para matrices cuadradas de dimensión mayor o
igual que 3, no siempre es posible calcular sus autovalores puesto que hay que calcular las raíces de
un polinomio de grado mayor o igual a tres.
PROPOSICIÓN. Sea A una matriz cuadrada y simétrica de orden n. Entonces se verifica que:
1) A es definida positiva si, y sólo si, todos los pivotes de la eliminación gaussiana son positivos;
2) A es definida negativa si, y sólo si, todos los pivotes de la eliminación gaussiana son negativos;
3) A es indefinida si tiene algún pivote de la eliminación gaussiana positivo y otro negativo.
Para finalizar esta sección recordemos que para una matriz cuadrada de orden 3 (suponiendo que
sus dos primeros pivotes son no nulos) se verifica que el primer pivote es a11 ; el segundo pivote es
1 a11
a11 a12
a12
a22
y, finalmente, el tercer pivote es
det( A)
.
a11 a12
a12 a22
OBSERVACIÓN. Para terminar comentemos una diferencia importante entre las formas cuadráticas de
orden dos o tres. Una matriz cuadrada y simétrica de orden 2 que tiene un autovalor cero (es decir,
con determinante cero) es semidefinida. Por el contrario, hay matrices simétricas de orden 3 con un
autovalor cero que son indefinidas. Por ejemplo, la matriz diag(1, −1, 0).
4
Descargar